聊天补全(非流式)
创建一轮 AI 对话,返回完整的响应内容。
请求参数
| 参数 | 类型 | 说明 |
|---|---|---|
| model必填 | string | 模型标识符,如 gpt-4o、claude-3.5-sonnet、gemini-1.5-pro |
| messages必填 | array | 对话历史数组,每条包含 role(system/user/assistant)和 content |
| temperature可选 | float | 采样温度,0~2,默认 1.0。越高越有创意,越低越确定 |
| max_tokens可选 | int | 最大返回 token 数,默认受模型上限限制 |
| top_p可选 | float | Nucleus 采样比例,0~1,默认 1.0 |
| stream可选 | boolean | 设为 false 或省略为非流式响应(详见流式版本) |
| stop可选 | string/array | 生成到此字符串时停止 |
| presence_penalty可选 | float | -2.0 ~ 2.0,默认 0 |
| frequency_penalty可选 | float | -2.0 ~ 2.0,默认 0 |
| user可选 | string | 终端用户标识,用于滥用检测 |
请求示例
Python (OpenAI SDK)
from openai import OpenAI
client = OpenAI(
api_key="am-your-api-key",
base_url="https://allmodel.top/v1"
)
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "system", "content": "你是一个专业的AI助手。"},
{"role": "user", "content": "用一句话解释量子计算。"}
],
temperature=0.7,
max_tokens=256
)
print(response.choices[0].message.content)
响应格式
响应 JSON
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"created": 1713000000,
"model": "gpt-4o",
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "量子计算是一种利用量子力学原理..."
},
"finish_reason": "stop"
}],
"usage": {
"prompt_tokens": 28,
"completion_tokens": 42,
"total_tokens": 70
}
}
cURL 示例
cURL
curl https://allmodel.top/v1/chat/completions \
-H "Authorization: Bearer am-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4o",
"messages": [{"role": "user", "content": "Hello!"}]
}'
💡 注意:allmodel.top 会自动根据 model 参数将请求路由到对应的 AI 提供商。不同模型支持的功能(如 vision、function calling)可能不同,请参考模型列表。
多轮对话
多轮对话只需将对话历史完整传入 messages 数组:
多轮对话
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "user", "content": "什么是量子计算?"},
{"role": "assistant", "content": "量子计算是一种利用量子力学原理..."},
{"role": "user", "content": "能举个具体的例子吗?"}
]
)
allmodel.top