VGA BU Internal · Service Live

One Gateway.
Every Model.

由 VGA BU 内部部署的 LLM 统一网关。原生支持 OpenAI / Anthropic / Gemini 等主流协议,当前已配置 GLM / MiniMax / Kimi 三家国产模型 —— 智能路由、成本核算、权限管理一站完成。

Core Capabilities

四大能力支柱,覆盖 BU 内部从研发到内容生产的全场景 AI 需求

Multi-Model Hub

多协议多模型,一个端点

一个 API Key,调用任意 OpenAI / Anthropic / Gemini 兼容模型。当前已配置 GLM / MiniMax / Kimi 三家国产模型,更多模型可按需上线 —— 上游更换或新增模型时业务代码零改动。

  • 统一 OpenAI 兼容协议
  • 覆盖文本 / 图像 / 音频 / 视频
  • 支持自定义上游接入
  • Rerank / Embedding 一并支持
Protocol Bridge

Cross-Protocol Auto-Convert

写一份代码,跨协议运行。网关自动处理不同上游模型的 API 协议差异(OpenAI / Anthropic / 自定义协议),上游升级或更换供应商时无需改动业务代码,研发效率翻倍。

  • OpenAI ⇄ Claude Messages 双向
  • OpenAI → Gemini 格式桥接
  • Realtime / Responses / Chat 全覆盖
  • Thinking-to-content 自动处理
Intelligent Routing

Failover & Rate-Limit Aware

渠道加权随机选择,失败自动重试下一渠道;用户级模型限流避免单人打满上游配额。研发同事写并发任务,工具自动调度,体验丝滑。

  • 渠道加权随机分发
  • 失败自动重试 + 故障转移
  • 用户级模型速率限制
  • Reasoning effort 精细控制
Cost & Analytics

Per-Request Cost Tracking

每次调用都精确到 token 级计费,缓存命中自动计减。可视化看板让你清楚每张卡牌消耗了多少预算,团队内部公平分摊、避免滥用。

  • 按请求 / Token 用量计费
  • Redis 缓存命中计减
  • 数据可视化控制台
  • 配额分配

Gateway Architecture

企业级网关特性,开箱即用

Format Conversion

OpenAI ⇄ Claude ⇄ Gemini 协议自动转译,业务代码无需关心上游协议差异。

Unified Auth

支持 OIDC 单点登录、Discord / LinuxDO / Telegram 授权,BU 内部账号一键接入。

Cache Acceleration

Redis 缓存 + 内存缓存双层加速,命中自动按缓存价格计费,显著降低 BU 整体成本。

Auto Retry

渠道故障自动重试 + 失败转移,单点上游抖动不影响 BU 内部业务连续性。

Permission Control

Token 分组、模型可见性、用户角色三级管控,按项目 / 团队精细分配可用模型。

Realtime Dashboard

用量、延迟、错误率、计费实时可视化,动态统筹管理&计量Token消耗。

Supported Models

网关原生兼容 OpenAI / Anthropic / Gemini 全协议。当前 3 个国产模型已配置启用,更多模型可按需上线

已支持 · Available Now
GLM-5 / GLM-4.7 / GLM-Z1 Kimi K2.7 / K2-Thinking MiniMax M3 / M2
待接入 · Coming Soon
DeepSeek V4-Pro / V4-Flash Qwen3.7-Max / Qwen3-VL Doubao Seed 2.1 / 1.6 Hunyuan Hy3 / A13B BGE v2.5 Rerank / M3 Embedding GPT-5.1 / Codex-Max Claude Sonnet 5 / Opus 4.8 Gemini 3.5 Flash / 3.1 Pro Midjourney v8 Suno v5
3
Models Active
All
Protocols
24/7
Always On
1
Unified Endpoint

Quick Start in 30 Seconds

同时支持 OpenAI 兼容协议和 Anthropic Messages 协议,原生 SDK 体验

OpenAI 兼容协议

# Python 示例 (OpenAI SDK)
from openai import OpenAI

client = OpenAI(
  base_url="https://api.asusaio.cn/v1",
  api_key="sk-vgabu-xxxxxxxxxxxxxxxx"
)

response = client.chat.completions.create(
  model="glm-5",
  messages=[{"role": "user",
    "content": "用中文介绍一下你自己"}]
)

Anthropic Messages 协议

# Python 示例 (Anthropic SDK)
import anthropic

client = anthropic.Anthropic(
  base_url="https://api.asusaio.cn",
  api_key="sk-vgabu-xxxxxxxxxxxxxxxx"
)

message = client.messages.create(
  model="kimi-k2.7",
  max_tokens=1024,
  messages=[{
    "role": "user",
    "content": "用中文介绍一下你自己"
  }]
)
print(message.content[0].text)