API 文档

FangKa Ai 兼容 Anthropic / OpenAI API 格式，无缝切换，即改即用。

简介

FangKa Ai 提供统一的 API 网关服务，通过一个 API Key 即可访问 Claude、GPT、Gemini、DeepSeek 等多种主流大模型。接口与 Anthropic / OpenAI 官方完全兼容，现有代码仅需修改 Base URL 即可接入，无需更改任何业务逻辑。

💡 已在使用 Anthropic 或 OpenAI SDK？只需替换 base_url 和 api_key 两个参数即可立即使用 FangKa Ai，无需修改任何其他代码。

认证方式

所有 API 请求都需要在 HTTP Header 中携带 API Key 进行身份认证。FangKa Ai 支持以下两种认证格式，你可以根据使用的 SDK 选择对应的方式：

方式一：Anthropic 原生格式

适用于 Anthropic SDK 或直接调用 Anthropic 兼容端点：

x-api-key: sk-fkai-xxxxxxxxxxxx

方式二：Bearer Token 格式

适用于 OpenAI SDK 或通用 HTTP 客户端：

Authorization: Bearer sk-fkai-xxxxxxxxxxxx

⚠️ 安全提醒：请勿在客户端、前端代码或公开仓库中暴露 API Key。API Key 应仅在服务端安全环境中使用。如果 Key 不慎泄露，请立即在控制台重新生成。

Base URL

根据你使用的 SDK 类型，选择对应的 Base URL：

兼容格式	Base URL	适用 SDK
Anthropic	`https://fkai.cc`	anthropic (Python/Node/Go)
OpenAI	`https://fkai.cc/openai/v1`	openai (Python/Node)

版本控制

使用 Anthropic 兼容端点时，需要在请求头中指定 API 版本：

anthropic-version: 2023-06-01

当前支持的版本为 2023-06-01，建议始终显式指定版本号以确保接口行为一致。

Messages API

Messages API 是最核心的接口，用于发送消息并获取 AI 模型的回复。完全兼容 Anthropic Messages API 规范。

POST /v1/messages

请求体参数

参数	类型	必填	说明
`model`	string	是	模型 ID，如 `claude-sonnet-4-20250514`
`messages`	array	是	对话消息列表，每条消息包含 role 和 content
`max_tokens`	integer	是	模型最大输出 Token 数，不同模型上限不同
`system`	string \| array	否	系统提示词，指导模型行为和角色
`temperature`	number	否	采样温度 (0-1)，越低越确定性，默认 1
`top_p`	number	否	Top-P 核采样 (0-1)，与 temperature 互斥使用效果更佳
`top_k`	integer	否	Top-K 采样，仅保留概率最高的 K 个 Token
`stream`	boolean	否	是否启用流式输出 (SSE)，默认 false
`stop_sequences`	array	否	自定义停止序列，模型遇到时停止生成
`metadata`	object	否	请求元数据，如 `{"user_id": "xxx"}`

基础请求示例

curl https://fkai.cc/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: sk-fkai-xxxx" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "什么是 API 网关？请简要说明。"}
    ]
  }'

响应格式

{
  "id": "msg_01XFDUDYJgAACzvnptvVoYEL",
  "type": "message",
  "role": "assistant",
  "content": [
    {
      "type": "text",
      "text": "API 网关是一个服务器，充当 API 消费者与后端服务之间的中间层..."
    }
  ],
  "model": "claude-sonnet-4-20250514",
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 18,
    "output_tokens": 156
  }
}

stop_reason 说明

值	说明
`end_turn`	模型正常完成回复
`max_tokens`	达到 max_tokens 上限被截断
`stop_sequence`	遇到自定义停止序列
`tool_use`	模型请求使用工具

多轮对话

通过在 messages 数组中交替排列 user 和 assistant 角色的消息，可以实现多轮对话。模型会根据完整的对话历史生成回复。

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 1024,
  "messages": [
    {"role": "user", "content": "我正在学习 Python，你能帮我吗？"},
    {"role": "assistant", "content": "当然可以！Python 是一门很棒的编程语言。你想从哪个方面开始学习呢？"},
    {"role": "user", "content": "我想了解列表推导式怎么用"},
    {"role": "assistant", "content": "列表推导式是 Python 中非常优雅的语法..."},
    {"role": "user", "content": "能给我一个实际的例子吗？"}
  ]
}

💡 Tips：对话消息必须以 user 角色开始，且 user/assistant 需交替出现。每轮对话都会消耗输入 Token，长对话建议定期做摘要压缩以控制成本。

多模态 / 视觉

支持发送图片给模型进行视觉理解和分析。在 content 中使用数组格式，混合 image 和 text 类型：

Base64 方式（推荐）

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 1024,
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "image",
          "source": {
            "type": "base64",
            "media_type": "image/png",
            "data": "iVBORw0KGgo..."
          }
        },
        {
          "type": "text",
          "text": "请详细描述这张图片的内容"
        }
      ]
    }
  ]
}

URL 方式

{
  "type": "image",
  "source": {
    "type": "url",
    "url": "https://example.com/image.jpg"
  }
}

项目	说明
支持格式	JPEG、PNG、GIF、WebP
单张上限	5MB（超过建议压缩后发送）
多图支持	单条消息最多 20 张图片
Token 计算	图片会根据分辨率折算为 Token

Streaming（流式输出）

设置 "stream": true 启用 Server-Sent Events (SSE) 流式输出，可实时逐字获取模型生成的内容，大幅降低首字延迟（TTFT）。

请求示例

curl https://fkai.cc/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: sk-fkai-xxxx" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "stream": true,
    "messages": [
      {"role": "user", "content": "写一首关于编程的短诗"}
    ]
  }'

SSE 事件类型

事件	说明	触发时机
`message_start`	消息开始	包含消息 ID、模型名等元数据
`content_block_start`	内容块开始	标记一个新的文本/工具块开始
`content_block_delta`	增量内容	每个文本片段，需要拼接成完整回复
`content_block_stop`	内容块结束	当前内容块生成完毕
`message_delta`	消息更新	包含 stop_reason 和 usage 信息
`message_stop`	消息完成	整个消息生成完毕
`ping`	心跳保活	防止连接超时

SSE 数据格式示例

event: message_start
data: {"type":"message_start","message":{"id":"msg_xxx","type":"message","role":"assistant","model":"claude-sonnet-4-20250514"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"代码"}}

event: content_block_delta
data: {"type":"content_block_delta","index":0,"delta":{"type":"text_delta","text":"如诗"}}

event: message_delta
data: {"type":"message_delta","delta":{"stop_reason":"end_turn"},"usage":{"output_tokens":42}}

event: message_stop
data: {"type":"message_stop"}

Models API

查询当前可用的模型列表及详细信息。

GET /v1/models

响应示例

{
  "data": [
    {
      "id": "claude-sonnet-4-20250514",
      "name": "Claude Sonnet 4",
      "provider": "anthropic",
      "max_tokens": 8192
    },
    {
      "id": "claude-opus-4-20250514",
      "name": "Claude Opus 4",
      "provider": "anthropic",
      "max_tokens": 32768
    },
    {
      "id": "gpt-4o",
      "name": "GPT-4o",
      "provider": "openai",
      "max_tokens": 16384
    },
    {
      "id": "gemini-2.5-pro",
      "name": "Gemini 2.5 Pro",
      "provider": "gemini",
      "max_tokens": 65536
    }
  ]
}

OpenAI 兼容接口

FangKa Ai 同时提供完整的 OpenAI Chat Completions 兼容接口，无需修改代码即可从 OpenAI 迁移。

POST /openai/v1/chat/completions

cURL 示例

curl https://fkai.cc/openai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-fkai-xxxx" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {"role": "system", "content": "你是一个专业的技术顾问。"},
      {"role": "user", "content": "解释一下微服务架构"}
    ],
    "max_tokens": 1024,
    "temperature": 0.7
  }'

Python (OpenAI SDK) 示例

from openai import OpenAI

client = OpenAI(
    api_key="sk-fkai-xxxx",
    base_url="https://fkai.cc/openai/v1"
)

# 非流式调用
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "你是一个专业的技术顾问。"},
        {"role": "user", "content": "解释微服务架构"}
    ]
)
print(response.choices[0].message.content)

# 流式调用
stream = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "你好"}],
    stream=True
)
for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

系统提示词

系统提示词用于定义 AI 的角色、行为方式和约束条件。它是独立于对话消息的顶层参数（与 OpenAI 将 system 放在 messages 中不同）。

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 1024,
  "system": "你是 FangKa Ai 的客服助手。请用专业但友好的语气回答用户关于产品和定价的问题。回答应简洁明了，如果不确定，请坦诚告知用户。",
  "messages": [
    {"role": "user", "content": "你们支持哪些模型？"}
  ]
}

💡 最佳实践：在系统提示词中明确指定角色、语气、输出格式和边界约束，可以显著提升模型回复的质量和一致性。

Tool Use（工具调用）

允许模型调用你预定义的工具/函数来获取外部信息或执行操作。模型会智能判断何时需要使用工具，并生成符合你定义的参数格式的调用请求。

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 1024,
  "tools": [
    {
      "name": "get_weather",
      "description": "获取指定城市的当前天气信息",
      "input_schema": {
        "type": "object",
        "properties": {
          "city": {
            "type": "string",
            "description": "城市名称，如 北京、上海"
          },
          "unit": {
            "type": "string",
            "enum": ["celsius", "fahrenheit"],
            "description": "温度单位"
          }
        },
        "required": ["city"]
      }
    }
  ],
  "messages": [
    {"role": "user", "content": "北京今天天气怎么样？"}
  ]
}

工具调用流程

1. 发送带 tools 定义的请求 → 2. 模型返回 tool_use 内容块 → 3. 你执行工具并返回 tool_result → 4. 模型根据结果生成最终回复

工具调用响应示例

{
  "stop_reason": "tool_use",
  "content": [
    {
      "type": "tool_use",
      "id": "toolu_01A09q90qw90lq917835lq9",
      "name": "get_weather",
      "input": {"city": "北京", "unit": "celsius"}
    }
  ]
}

返回工具结果

{
  "messages": [
    {"role": "user", "content": "北京今天天气怎么样？"},
    {"role": "assistant", "content": [
      {"type": "tool_use", "id": "toolu_01A09q90qw90lq917835lq9", "name": "get_weather", "input": {"city": "北京"}}
    ]},
    {"role": "user", "content": [
      {"type": "tool_result", "tool_use_id": "toolu_01A09q90qw90lq917835lq9", "content": "北京：晴，28°C，湿度 45%"}
    ]}
  ]
}

Prompt Caching

对于 Anthropic 模型，支持 Prompt Caching 功能。将重复使用的系统提示词或上下文标记为可缓存，后续请求命中缓存时可大幅降低输入 Token 费用（降低约 90%）。

{
  "model": "claude-sonnet-4-20250514",
  "max_tokens": 1024,
  "system": [
    {
      "type": "text",
      "text": "这里是你的很长的系统提示词...",
      "cache_control": {"type": "ephemeral"}
    }
  ],
  "messages": [
    {"role": "user", "content": "你好"}
  ]
}

💡 缓存有效期为 5 分钟，期间相同前缀的请求将自动命中缓存。缓存至少需要 1024 个 Token 才能生效。详见模型广场中的缓存价格。

错误处理

API 使用标准 HTTP 状态码。出错时，响应体包含结构化的 JSON 错误信息：

{
  "type": "error",
  "error": {
    "type": "invalid_request_error",
    "message": "max_tokens: Field required"
  }
}

状态码	错误类型	说明	建议处理方式
400	invalid_request_error	请求参数错误	检查请求体格式和参数
401	authentication_error	API Key 无效	检查 Key 是否正确
403	permission_error	权限不足	检查账户状态和余额
404	not_found_error	模型不存在	检查模型 ID 拼写
429	rate_limit_error	请求超限	等待后重试（指数退避）
500	api_error	服务器错误	稍后重试
529	overloaded_error	上游过载	等待 30s+ 后重试

速率限制

速率限制取决于你的账户等级和套餐配置。超出限制时返回 429 状态码。可通过响应头获取限制详情：

响应头	说明	示例值
`x-ratelimit-limit`	时间窗口内允许的最大请求数	60
`x-ratelimit-remaining`	当前窗口剩余请求数	45
`x-ratelimit-reset`	限制重置的 Unix 时间戳	1713484800
`retry-after`	建议等待秒数（仅 429 时返回）	30

SDK 支持

FangKa Ai 完全兼容 Anthropic 和 OpenAI 官方 SDK，你可以选择任一 SDK 接入。

语言	SDK	安装命令	适用端点
Python	anthropic	`pip install anthropic`	Anthropic 兼容
Python	openai	`pip install openai`	OpenAI 兼容
Node.js	@anthropic-ai/sdk	`npm i @anthropic-ai/sdk`	Anthropic 兼容
Node.js	openai	`npm i openai`	OpenAI 兼容
Go	anthropic-go	`go get github.com/anthropics/anthropic-sdk-go`	Anthropic 兼容

只需在初始化 SDK 时指定 base_url 即可。详细的接入示例请参阅快速上手教程。