一份 API Key,调用所有 LLM
全站模型限时7折!Opus 4.7/GPT 5.5/Gemini 3最新模型多用多省
实时调度
按健康度和延迟动态加权,始终路由到最优上游。
统一可观测
调用、费用、异常一站式可视化,运行状态尽在掌握。
智能限流
多维策略保住核心业务的优先级,突发流量不拖垮生产。
限时优惠
全线旗舰模型,7 折起
Claude Opus 4.7、GPT 5.5、Gemini 3.1 Pro 等 9 家供应商旗舰模型,限时 7 折。按 token 计费,无月费,无最低消费。
上游供应商
一份 Key,数十家供应商
每个模型名背后都是一组上游——我们按健康度、延迟、价格自动排序,你只管写 OpenAI 风格的代码。
OpenAI
GPT-5、GPT-4o、o 系列、embeddings、TTS、Whisper。
Anthropic
Claude Sonnet / Opus / Haiku——官方直连 + Bedrock + Vertex 三路冗余。
Gemini Pro / Flash,原生 generateContent 直通。
AWS Bedrock
Claude / Llama / Mistral,企业合规链路。
xAI
Grok 全系,原生流式 + 工具调用。
用数字说话
ToRouter 的体量
把团队的每一次大模型调用,统一收拢到同一个网关。
月度 token 路由量
在线模型
聚合层可用性
为每一次大模型调用打造的企业级 AI 网关
即插即用的 OpenAI 兼容接口、多上游路由、请求级可观测、策略驱动的访问控制——全部集成在一个控制台。
统一接入入口
一份 base URL,一份 Key。OpenAI / Anthropic Messages / Gemini generateContent 原生直通,现有 SDK 不动一行代码。
多上游自动切换
每个模型背后接 Anthropic 直连、AWS Bedrock、Google Vertex、Azure 等多家上游,主供应商劣化时秒级切换。
实时智能调度
路由按实时健康度、延迟、价格加权;边缘节点把首字延迟压到最低。
统一可观测
每条请求都记录上游、token、延迟和成本,支持导出 CSV 或 Prometheus metrics。
智能限流
按 Key、按组织、按模型设多维配额和并发上限,突发任务不会拖垮生产流量。
组织级数据策略
只用零留存上游、屏蔽特定地域、关闭请求体记录——组织级一键开关。
按 token 计费
无订阅,无最低消费。充值的额度可用于任何模型和上游——一份账单,而不是六份。
开发者优先的 SDK
OpenAI Python / Node SDK、Cursor、Cline、Codex CLI、Claude Code 开箱即用——只需改 base_url。
客户评价
开发者和团队都在用 ToRouter 加速交付
独立开发者
AI 应用作者把 base_url 切到 ToRouter 之后,再没为单家供应商抖动操过心——多上游自动切换加上预算告警,真的省事。
SRE
中型团队 Infra 负责人统一计费、统一 Key、统一日志,从 OpenAI / Anthropic / Vertex 迁过来零改动——比维护一堆账号清爽多了。
SaaS 创始人
产品负责人没有月费,没有最低消费,按 token 计费,30 人团队共享额度,对账只看一个仪表盘。
Cursor 重度用户
开发者Cursor / Cline / Claude Code 全部接 ToRouter,一份 Key,模型随便切——比同时订阅 ChatGPT Plus 和 Claude Pro 便宜一半还不止。
独立创业者
AI 工具请求级的成本和延迟都汇到一张图上,有次上游性能回退,用户还没感知到就被我抓到了。
平台工程师
B2B SaaS组织级数据策略真的解决合规问题——只用零留存上游、不记录 prompt、限定在欧盟地域。
代理商 CTO
AI 咨询公司按客户分 Key、单独限额、单独导出账单。我们直接拿 ToRouter 的数据给客户开发票。
游戏工作室
后端负责人在便宜档和高端档之间智能路由,LLM 成本砍了 38%,质量没下降。
开源维护者
CLI 工具作者OpenRouter 风格的 model 字符串直接能用。一份配置,用户想接哪家供应商都行。
常见问题
你可能想问的几个问题