Documentation Index
Fetch the complete documentation index at: https://docs.xcompute.us/llms.txt
Use this file to discover all available pages before exploring further.
- 同步处理模式,实时返回对话内容
- 最简化参数,快速上手
curl --request POST \
--url https://XCompute.us/v1beta/models/gemini-2.5-pro:generateContent \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "你好,介绍一下自己"
}
]
}
]
}'
{
"code": 200,
"data": {
"candidates": [
{
"content": {
"role": "model",
"parts": [
{
"text": "你好!很高兴能向你介绍我自己。\n\n我是一个大型语言模型,由 Google 训练和开发..."
}
]
},
"finishReason": "STOP",
"index": 0,
"safetyRatings": [
{
"category": "HARM_CATEGORY_HATE_SPEECH",
"probability": "NEGLIGIBLE"
}
]
}
],
"promptFeedback": {
"safetyRatings": [
{
"category": "HARM_CATEGORY_HATE_SPEECH",
"probability": "NEGLIGIBLE"
}
]
]
},
"usageMetadata": {
"promptTokenCount": 4,
"candidatesTokenCount": 611,
"totalTokenCount": 2422,
"thoughtsTokenCount": 1807,
"promptTokensDetails": [
{
"modality": "TEXT",
"tokenCount": 4
}
]
}
}
Authorizations
所有接口均需要使用Bearer Token进行认证获取 API Key:访问 API Key 管理页面 获取您的 API Key使用时在请求头中添加:Authorization: Bearer YOUR_API_KEY
Path Parameters
模型名称示例中使用 gemini-2.5-pro,您可以将其替换为其他支持的 Gemini 模型:
gemini-2.5-flash - Gemini 2.5 快速版
gemini-2.5-pro - Gemini 2.5 专业版
gemini-2.5-flash-lite - Gemini 2.5 超轻量版
gemini-2.5-pro-thinking - Gemini 2.5 Pro 深度思考版
生成方法(快速开始推荐使用 generateContent):
generateContent: 等待完整响应后一次性返回
streamGenerateContent: 流式返回,逐块实时返回内容
可选值:generateContent, streamGenerateContent
Body
对话内容列表最少需要1条消息
角色类型:
user: 用户消息
model: 模型响应(对话历史中使用)
消息内容部分
内联数据(用于多模态输入)
MIME 类型,如 image/jpeg, image/png
示例:[
{
"role": "user",
"parts": [{ "text": "你好,介绍一下自己" }]
}
]
生成配置(可选)
控制输出随机性,范围 0.0-2.0默认值:1.0 生成的最大 token 数量不同模型有不同的最大值限制
核采样参数,范围 0.0-1.0控制采样时考虑的概率质量
Top-K 采样参数每步只从概率最高的 K 个 token 中采样
安全设置(可选)
安全类别:
HARM_CATEGORY_HATE_SPEECH: 仇恨言论
HARM_CATEGORY_DANGEROUS_CONTENT: 危险内容
HARM_CATEGORY_HARASSMENT: 骚扰
HARM_CATEGORY_SEXUALLY_EXPLICIT: 色情内容
阈值级别:
BLOCK_NONE: 不阻止
BLOCK_ONLY_HIGH: 仅阻止高风险
BLOCK_MEDIUM_AND_ABOVE: 阻止中等及以上风险
BLOCK_LOW_AND_ABOVE: 阻止低等及以上风险
Response
候选响应列表
完成原因:
STOP: 正常结束
MAX_TOKENS: 达到最大 token 限制
SAFETY: 因安全原因停止
RECITATION: 因重复内容停止
OTHER: 其他原因
安全评级列表
概率级别:NEGLIGIBLE, LOW, MEDIUM, HIGH
使用量统计
提示词 token 详情Show promptTokensDetails 对象