聊天补全（非流式）

创建一轮 AI 对话，返回完整的响应内容。

POST https://allmodel.top/v1/chat/completions

请求参数

参数	类型	说明
model必填	string	模型标识符，如 `gpt-4o`、`claude-3.5-sonnet`、`gemini-1.5-pro`
messages必填	array	对话历史数组，每条包含 `role`（system/user/assistant）和 `content`
temperature可选	float	采样温度，0~2，默认 1.0。越高越有创意，越低越确定
max_tokens可选	int	最大返回 token 数，默认受模型上限限制
top_p可选	float	Nucleus 采样比例，0~1，默认 1.0
stream可选	boolean	设为 `false` 或省略为非流式响应（详见流式版本）
stop可选	string/array	生成到此字符串时停止
presence_penalty可选	float	-2.0 ~ 2.0，默认 0
frequency_penalty可选	float	-2.0 ~ 2.0，默认 0
user可选	string	终端用户标识，用于滥用检测

请求示例

Python (OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    api_key="am-your-api-key",
    base_url="https://allmodel.top/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "你是一个专业的AI助手。"},
        {"role": "user", "content": "用一句话解释量子计算。"}
    ],
    temperature=0.7,
    max_tokens=256
)

print(response.choices[0].message.content)

响应格式

响应 JSON

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1713000000,
  "model": "gpt-4o",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "量子计算是一种利用量子力学原理..."
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 28,
    "completion_tokens": 42,
    "total_tokens": 70
  }
}

cURL 示例

cURL

curl https://allmodel.top/v1/chat/completions \
  -H "Authorization: Bearer am-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

💡 注意：allmodel.top 会自动根据 model 参数将请求路由到对应的 AI 提供商。不同模型支持的功能（如 vision、function calling）可能不同，请参考模型列表。

多轮对话

多轮对话只需将对话历史完整传入 messages 数组：

多轮对话

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "user", "content": "什么是量子计算？"},
        {"role": "assistant", "content": "量子计算是一种利用量子力学原理..."},
        {"role": "user", "content": "能举个具体的例子吗？"}
    ]
)