聊天补全(非流式)

创建一轮 AI 对话,返回完整的响应内容。

POST https://allmodel.top/v1/chat/completions

请求参数

参数类型说明
model必填string模型标识符,如 gpt-4oclaude-3.5-sonnetgemini-1.5-pro
messages必填array对话历史数组,每条包含 role(system/user/assistant)和 content
temperature可选float采样温度,0~2,默认 1.0。越高越有创意,越低越确定
max_tokens可选int最大返回 token 数,默认受模型上限限制
top_p可选floatNucleus 采样比例,0~1,默认 1.0
stream可选boolean设为 false 或省略为非流式响应(详见流式版本
stop可选string/array生成到此字符串时停止
presence_penalty可选float-2.0 ~ 2.0,默认 0
frequency_penalty可选float-2.0 ~ 2.0,默认 0
user可选string终端用户标识,用于滥用检测

请求示例

Python (OpenAI SDK)
from openai import OpenAI

client = OpenAI(
    api_key="am-your-api-key",
    base_url="https://allmodel.top/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "你是一个专业的AI助手。"},
        {"role": "user", "content": "用一句话解释量子计算。"}
    ],
    temperature=0.7,
    max_tokens=256
)

print(response.choices[0].message.content)

响应格式

响应 JSON
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1713000000,
  "model": "gpt-4o",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "量子计算是一种利用量子力学原理..."
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 28,
    "completion_tokens": 42,
    "total_tokens": 70
  }
}

cURL 示例

cURL
curl https://allmodel.top/v1/chat/completions \
  -H "Authorization: Bearer am-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

💡 注意:allmodel.top 会自动根据 model 参数将请求路由到对应的 AI 提供商。不同模型支持的功能(如 vision、function calling)可能不同,请参考模型列表

多轮对话

多轮对话只需将对话历史完整传入 messages 数组:

多轮对话
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "user", "content": "什么是量子计算?"},
        {"role": "assistant", "content": "量子计算是一种利用量子力学原理..."},
        {"role": "user", "content": "能举个具体的例子吗?"}
    ]
)