VGA BU Internal · Service Live
One Gateway.
Every Model.
由 VGA BU 内部部署的 LLM 统一网关。原生支持 OpenAI / Anthropic / Gemini 等主流协议,当前已配置 GLM / MiniMax / Kimi 三家国产模型 —— 智能路由、成本核算、权限管理一站完成。
Core Capabilities
四大能力支柱,覆盖 BU 内部从研发到内容生产的全场景 AI 需求
Multi-Model Hub
多协议多模型,一个端点
一个 API Key,调用任意 OpenAI / Anthropic / Gemini 兼容模型。当前已配置 GLM / MiniMax / Kimi 三家国产模型,更多模型可按需上线 —— 上游更换或新增模型时业务代码零改动。
- 统一 OpenAI 兼容协议
- 覆盖文本 / 图像 / 音频 / 视频
- 支持自定义上游接入
- Rerank / Embedding 一并支持
Protocol Bridge
Cross-Protocol Auto-Convert
写一份代码,跨协议运行。网关自动处理不同上游模型的 API 协议差异(OpenAI / Anthropic / 自定义协议),上游升级或更换供应商时无需改动业务代码,研发效率翻倍。
- OpenAI ⇄ Claude Messages 双向
- OpenAI → Gemini 格式桥接
- Realtime / Responses / Chat 全覆盖
- Thinking-to-content 自动处理
Intelligent Routing
Failover & Rate-Limit Aware
渠道加权随机选择,失败自动重试下一渠道;用户级模型限流避免单人打满上游配额。研发同事写并发任务,工具自动调度,体验丝滑。
- 渠道加权随机分发
- 失败自动重试 + 故障转移
- 用户级模型速率限制
- Reasoning effort 精细控制
Cost & Analytics
Per-Request Cost Tracking
每次调用都精确到 token 级计费,缓存命中自动计减。可视化看板让你清楚每张卡牌消耗了多少预算,团队内部公平分摊、避免滥用。
- 按请求 / Token 用量计费
- Redis 缓存命中计减
- 数据可视化控制台
- 配额分配
Gateway Architecture
企业级网关特性,开箱即用
Format Conversion
OpenAI ⇄ Claude ⇄ Gemini 协议自动转译,业务代码无需关心上游协议差异。
Unified Auth
支持 OIDC 单点登录、Discord / LinuxDO / Telegram 授权,BU 内部账号一键接入。
Cache Acceleration
Redis 缓存 + 内存缓存双层加速,命中自动按缓存价格计费,显著降低 BU 整体成本。
Auto Retry
渠道故障自动重试 + 失败转移,单点上游抖动不影响 BU 内部业务连续性。
Permission Control
Token 分组、模型可见性、用户角色三级管控,按项目 / 团队精细分配可用模型。
Realtime Dashboard
用量、延迟、错误率、计费实时可视化,动态统筹管理&计量Token消耗。
Supported Models
网关原生兼容 OpenAI / Anthropic / Gemini 全协议。当前 3 个国产模型已配置启用,更多模型可按需上线
已支持 · Available Now
GLM-5 / GLM-4.7 / GLM-Z1
Kimi K2.7 / K2-Thinking
MiniMax M3 / M2
待接入 · Coming Soon
DeepSeek V4-Pro / V4-Flash
Qwen3.7-Max / Qwen3-VL
Doubao Seed 2.1 / 1.6
Hunyuan Hy3 / A13B
BGE v2.5 Rerank / M3 Embedding
GPT-5.1 / Codex-Max
Claude Sonnet 5 / Opus 4.8
Gemini 3.5 Flash / 3.1 Pro
Midjourney v8
Suno v5
Quick Start in 30 Seconds
同时支持 OpenAI 兼容协议和 Anthropic Messages 协议,原生 SDK 体验
OpenAI 兼容协议
from openai import OpenAI
client = OpenAI(
base_url="https://api.asusaio.cn/v1",
api_key="sk-vgabu-xxxxxxxxxxxxxxxx"
)
response = client.chat.completions.create(
model="glm-5",
messages=[{"role": "user",
"content": "用中文介绍一下你自己"}]
)
Anthropic Messages 协议
import anthropic
client = anthropic.Anthropic(
base_url="https://api.asusaio.cn",
api_key="sk-vgabu-xxxxxxxxxxxxxxxx"
)
message = client.messages.create(
model="kimi-k2.7",
max_tokens=1024,
messages=[{
"role": "user",
"content": "用中文介绍一下你自己"
}]
)
print(message.content[0].text)