发现宝藏！白嫖Token神器OmniRoute

引言

最近注册了不少免费的Token服务，但基本都有使用量限制，一超就要切换，非常影响使用体验，所以想自己写个API代理，统一调用model-id，只要出现429或其他错误，就自动切换下一个服务商。正当我思考功能时，发现了这个更强大的OmniRoute，内置了很多免费层的服务商，专门针对我们这种白嫖党有组合规则，真是太贴心了！既然有这么强大的系统，就不用自己手搓了，开箱即用！

什么是OmniRoute？

简单来说，它是一个AI API网关，帮你把多个AI服务提供商（比如OpenAI、Claude、Gemini、以及各种免费平台）统一成一个接口。当某个服务商的额度用完或出现错误时，它会自动切换到下一个可用的服务商，完全无感知。

核心特性：

🌐 237个AI提供商，其中90+有免费额度
🔄 17种路由策略，支持优先级、权重、成本优化等
🗜️ Token压缩，最高节省95%用量
🛡️ 自动故障转移，遇到429或错误自动切换
🐳 Docker部署，一键启动，支持NAS

OmniRoute Dashboard总览

1. 安装：Docker一键部署

OmniRoute支持多种安装方式（npm全局安装、Docker、Electron桌面应用、Termux手机端），但我最喜欢Docker，干净利落，直接部署在我的NAS上。

快速启动

打开终端，运行以下命令：

1
2
3
4
5
6
7
docker run -d \
  --name omniroute \
  --restart unless-stopped \
  --stop-timeout 40 \
  -p 20128:20128 \
  -v omniroute-data:/app/data \
  diegosouzapw/omniroute:latest

参数说明：

-d：后台运行
--restart unless-stopped：自动重启（除非手动停止）
-p 20128:20128：映射端口，访问地址是 http://你的NAS-IP:20128
-v omniroute-data:/app/data：持久化数据，重启不丢失配置

验证安装

等待镜像下载完成后，打开浏览器访问：

http://你的NAS-IP:20128

你应该能看到OmniRoute的Dashboard界面。首次访问时，系统会提示你创建一个API Key（用于后续客户端连接）。

OmniRoute Dashboard首页

Docker Compose（推荐生产环境）

如果你想更灵活地配置，可以使用Docker Compose：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
version: '3.8'
services:
  omniroute:
    image: diegosouzapw/omniroute:latest
    container_name: omniroute
    restart: unless-stopped
    ports:
      - "20128:20128"
    volumes:
      - omniroute-data:/app/data
    environment:
      - PORT=20128
      - OMNIROUTE_MEMORY_MB=1024  # 增加内存限制（可选）

  redis:
    image: redis:7-alpine
    container_name: omniroute-redis
    restart: unless-stopped
    volumes:
      - omniroute-redis-data:/data

volumes:
  omniroute-data:
  omniroute-redis-data:

保存为 docker-compose.yml，然后运行：

1
docker compose up -d

2. 配置：添加提供商和创建组合规则

安装完成后，接下来就是配置服务商和路由规则。OmniRoute的配置非常直观，通过Web界面即可完成。

2.1 添加AI提供商

进入Dashboard → Providers 页面，点击"Add Provider"。

推荐先添加这些免费提供商：

提供商	前缀	免费模型	额度
SiliconFlow	`sf/`	Qwen3、DeepSeek等	无限制（速率限制）
OpenRouter	`or/`	多种免费模型	需注册，有免费额度
StepFun	`step/`	Step-2系列	邀请注册送额度
ZenMux	`zm/`	Claude等顶级模型	预存$5免费用
Xiaomi Mimo	`mi/`	Mimo系列	免费额度

添加步骤：

选择提供商类型（如SiliconFlow）
填入API Key（从对应平台获取）
点击"Connect"测试连接
连接成功后，该提供商就会出现在已连接列表中

添加提供商界面

2.2 创建组合规则（Combo）

Combo是OmniRoute的核心功能——它定义了请求的路由顺序和故障转移策略。

进入 Combos 页面，点击"Create Combo"。

示例：创建一个"永不停机"组合

名称: always-on
策略: priority（优先级）

步骤：
1. sf/qwen3-235b      (硅基流动 - 优先使用)
2. or/gpt-4o-mini     (OpenRouter - 备用1)
3. step/step-2-mini   (StepFun - 备用2)
4. pol/gpt-4          (Pollinations - 兜底，无需Key)

工作原理：

请求首先发给硅基流动的Qwen3
如果遇到429（额度用完）或其他错误，自动切换到OpenRouter
OpenRouter也不行，切换到StepFun
最后兜底用Pollinations（完全免费，无需注册）

更多路由策略：

OmniRoute支持17种路由策略，常用的有：

策略	说明	适用场景
`priority`	按顺序依次尝试	有明确优先级
`weighted`	按权重随机分配	负载均衡
`cost-optimized`	优先选择最便宜的	节省成本
`headroom`	优先选择剩余额度最多的	避免额度耗尽
`auto`	智能评分，自动选择最优	懒人模式

懒人推荐：直接使用auto模式

在客户端配置时，模型ID填写 auto，OmniRoute会根据9个因素（健康度、额度、成本、延迟、成功率等）自动选择最佳提供商，无需手动创建Combo。

Combo配置界面

2.3 配置API端点

配置完成后，进入 Endpoints 页面，获取连接信息：

Base URL: http://你的NAS-IP:20128/v1
API Key:  复制你的API Key
Model:    auto  (或具体的combo名称/模型ID)

这些信息将用于配置你的AI客户端（如Claude Code、Cursor、Cline等）。

3. 实测：在WorkBuddy中配置OmniRoute

接下来，我在自己的AI编码助手WorkBuddy中配置OmniRoute端点，测试一个复杂任务，看看实际效果如何。

配置步骤

打开WorkBuddy设置
找到"API配置"或"自定义端点"选项
填入以下信息：
- Base URL: http://192.168.1.100:20128/v1（替换为你的NAS IP）
- API Key: 从OmniRoute Dashboard复制
- Model: auto
保存并测试连接

WorkBuddy配置OmniRoute端点

执行复杂任务

我让WorkBuddy执行一个多步骤任务：分析一个GitHub仓库的代码结构，并生成技术文档。

这个任务需要：

读取多个文件
理解代码逻辑
生成结构化文档
多次往返对话

测试结果：

✅ 全程无错误：任务顺利完成，没有出现429或其他中断 ✅ 响应流畅：延迟在可接受范围内（2-5秒） ✅ 自动切换无感知：从日志看，中间确实发生了提供商切换，但我完全没感觉到

关键观察：

任务开始时使用的是硅基流动的Qwen3
中途因为并发限制，自动切换到了OpenRouter
最后几轮对话又切回了硅基流动（额度恢复）

整个过程对我来说是透明的，我只需要专注于任务本身，不用担心"额度用完"或"服务不可用"的问题。

WorkBuddy执行任务过程

4. 监测：查看OmniRoute后台

任务完成后，我回到OmniRoute Dashboard，查看详细的运行数据。

4.1 使用统计

进入 Analytics 页面，可以看到：

总请求数：本次任务共发送了23次API请求
提供商分布：
- 硅基流动：15次（65%）
- OpenRouter：6次（26%）
- Pollinations：2次（9%）
Token消耗：总计约45,000 tokens
节省金额：按商业API价格计算，节省了约$2.5

Analytics统计页面

4.2 健康状态

进入 Health 页面，查看各提供商的状态：

硅基流动：✅ 正常，延迟120ms
OpenRouter：✅ 正常，延迟200ms
StepFun：⚠️ 当前额度已用完，处于冷却状态
Pollinations：✅ 正常，延迟350ms

OmniRoute会自动标记不健康的提供商，并在恢复前跳过它们。

4.3 使用日志

进入 Usage Logs 页面，可以看到每次请求的详细记录：

时间: 2026-07-03 14:32:15
模型: auto
实际路由: sf/qwen3-235b → or/gpt-4o-mini
原因: sf/qwen3-235b returned 429 (rate limit exceeded)
Tokens: 2,345 input + 890 output
耗时: 3.2s

这些日志让你清楚了解每次请求的路由路径和切换原因，便于优化Combo配置。

Usage Logs详细日志

4.4 免费额度监控

进入 Free Tiers 页面（路径：/dashboard/free-tiers），可以看到：

本月已用免费Token：约120万
剩余免费Token：约1.48亿（是的，OmniRoute聚合了约1.6B免费Token/月）
各提供商额度详情：每个免费层的已用/剩余比例

这个功能非常实用，让你清楚知道自己还有多少"弹药"，避免突然断供。

5. 总结与推荐

使用体验

经过一周的使用，OmniRoute给我留下了深刻印象：

优点：

✅ 真正实现了"永不停机"：多提供商组合 + 自动故障转移，再也没有遇到"额度用完"的尴尬
✅ 配置简单：Docker一键部署，Web界面配置，无需复杂编程
✅ 节省成本：充分利用免费额度，配合Token压缩，大幅降低使用成本
✅ 透明可控：详细的日志和统计，清楚了解每次请求的路由和成本
✅ 支持广泛：兼容237个提供商，几乎所有主流AI平台都支持

注意事项：

⚠️ 部分免费提供商有速率限制，高峰期可能需要等待
⚠️ 某些提供商的ToS（服务条款）对代理使用有限制，建议先了解
⚠️ Token压缩虽然节省用量，但极端压缩可能影响复杂任务的质量（建议用Standard模式）

最后

OmniRoute是我近期发现的最实用的AI工具之一。它完美解决了"免费额度不够用、切换麻烦"的痛点，让白嫖党也能享受稳定、流畅的AI服务。

如果你也经常使用多个AI提供商，或者担心额度突然用完，强烈建议试试OmniRoute。Docker部署5分钟搞定，配置也简单，关键是——完全免费开源！

项目地址：https://github.com/diegosouzapw/OmniRoute

官方文档：https://omniroute.online

P.S. 如果你有其他好用的免费AI提供商，欢迎在评论区分享，让我们一起把"白嫖"进行到底！😄