运营
Cloudflare API 成本和使用
互客鱼是自托管的:您的 Cloudflare 账户由 Cloudflare 直接计费。 互客鱼团队永远不会看到这些发票,也永远不会收取加价。本页解释了互客鱼使用的 Cloudflare 资源、每个资源为您的应用做什么,以及在哪里查看账单。
设置 — 令牌权限
在 我的资料 → API 令牌 → 创建令牌 → 开始使用 — 创建自定义令牌 创建 API 令牌。 添加以下所有账户范围的权限,否则某些功能会静默中断(LLM 工作,Vectorize 10000s;或爬取工作,嵌入失败等)。
| 权限 | 级别 | 如果缺失会破坏什么 |
|---|---|---|
Account → Workers AI |
读取 | 每个聊天回复 + 每个嵌入(访客消息、索引)— 整个 RAG 管道。 |
Account → Vectorize |
编辑 | 首次运行时创建 chunks 索引,存储/查询向量。没有它:每次检索都会出现 code 10000 Authentication error 或 code 40040 Index not found。 |
Account → Browser Rendering |
编辑 | JS 渲染爬取适用于纯 HTTP 返回空壳的网站(Shopify、Next.js、Vue、Angular SPAs)。没有它:回退到 Browserless(如果配置)或纯 HTTP — 许多网站不会产生 chunks。 |
Account → Workers R2 Storage |
编辑 | 可选。仅当您将品牌资产或上传的源 PDF 存储在 R2(相对于本地磁盘 / S3)时需要。 |
Account → Workers Scripts |
编辑 | 支持“设置 → 系统 → Cron worker”中的“Deploy Cron Worker”按钮,推送一个小型 Worker,每 60 秒 tick 您的队列。没有它:您需要 cPanel cron 或外部 uptime ping 访问 /api/v1/internal/queue-tick。 |
资源范围 — 在令牌创建表单底部,您会看到“Account Resources”
和“Zone Resources”。设置 Account Resources → Include — All accounts,
或明确选择与您粘贴到 设置 → 系统 → AI providers → Cloudflare → Account ID
中的相同账户。账户不匹配的令牌是 code 10000 Authentication error
的最常见原因 — 权限列表看起来正确,但令牌看不到您的账户。
10 秒内验证 — 一旦您有了令牌,从任何 shell 测试:
curl -H "Authorization: Bearer YOUR_TOKEN" \
https://api.cloudflare.com/client/v4/accounts/YOUR_ACCOUNT_ID/vectorize/v2/indexes
带有 JSON 列表(空或包含 hukeyu-chunks)的 200 表示
令牌 + 账户匹配。10000 表示它们不匹配。40040 表示匹配但索引尚不存在 —
没关系,互客鱼在第一次索引运行时创建它。
Cloudflare 是推荐的默认值,因为它在一个账户下捆绑了互客鱼需要的每个原语 (LLM、嵌入、向量存储、爬虫),具有慷慨的免费层。如果您不想使用 Cloudflare, 请在 设置 → 系统 中留空密钥,互客鱼回退到 OpenAI 或 OpenRouter — 参见 环境变量。
互客鱼使用 Cloudflare 做什么
| 资源 | 它做什么 | 免费层(截至 2026 年) |
|---|---|---|
| Workers AI — 聊天 |
默认使用
@cf/meta/llama-3.3-70b-instruct-fp8-fast
生成每个访客回复。每次访客回合调用一次。
|
每天 10,000 个神经元(≈ 几千个短回复)。超过后, 每 1k 输入令牌约 $0.011,每 1k 输出令牌约 $0.011。 |
| Workers AI — 嵌入 |
通过
@cf/baai/bge-base-en-v1.5
将每个爬取的 chunk 和每个访客问题转换为 768-dim 向量。
索引时每个 chunk 调用一次,每次访客回合调用一次。
|
计入相同的 Workers AI 神经元池。嵌入调用很便宜 — 通常 < 聊天成本的 1%。 |
| Workers AI — 重排序器 |
使用
@cf/baai/bge-reranker-base
重新评分 Vectorize 返回的 top-k chunks,以便 LLM 获得最相关的
基础。每次访客回合调用一次。
|
相同的 Workers AI 神经元池。与聊天相比可以忽略不计。 |
| Vectorize | 向量数据库,存储您爬取内容的嵌入并在每次访客回合时回答最近邻查询。 | 每月免费 30M 存储维度 + 50M 查询维度。典型网站(500 页, ~5k chunks)使用 ~3.8M 存储 — 远低于免费层。 |
| Browser Rendering | 爬取 JavaScript-heavy 页面(React / Vue / Shopify Hydrogen), 以便我们可以索引静态 fetch 看不到的内容。在索引时使用, 从不在访客热路径上。对于静态网站自动回退到纯 HTTP。 | 免费 Workers 计划上每天 10 分钟;付费计划上每天 10 小时($5/月)。 500 页网站的完整重新爬取通常需要 5–15 分钟。 |
免费层数字是撰写时 Cloudflare 发布的值 — Workers AI 定价页面、 Vectorize 定价页面 和 Browser Rendering 定价页面 是事实来源 — Cloudflare 定期更新它们。
现实月度成本范围
这些是工作估计,不是承诺。实际成本取决于访客量、平均回复长度以及您重新爬取的频率。
- 爱好网站(≤ 500 访客 / 月,< 100 页索引) — 几乎肯定是 $0 / 月。 一切都适合免费层。
- SMB 网站(5,000 访客 / 月,500 页索引,每周重新爬取) — 通常 $0–$5 / 月。如果您的网站是 JS-heavy,Browser Rendering 付费计划($5/月固定) 是最可能的行项目。
- 中型市场(50,000 访客 / 月,5,000 页索引,每天重新爬取) — 通常 $20–$60 / 月,由 Workers AI 聊天令牌主导。
在哪里查看账单
Cloudflare 通过他们的仪表板直接计费:
- 在 dash.cloudflare.com 使用与您粘贴到互客鱼中的 Account ID 相同的账户登录。
- 打开 Manage Account → Billing 查看发票,或 AI → Workers AI → Analytics / AI → Vectorize → Analytics 查看按模型的实时使用情况图表。
- 对于逐日 Workers AI 成本,Workers AI 仪表板显示一个“neurons used”图表, 直接映射到计费使用。
上限支出
互客鱼附带两个安全杠杆:
-
每个计划的 AI 控制。
平台管理的 Plans 页面
设置每条消息的
max_tokens和每月消息上限。达到上限会向访客显示升级提示而不是燃烧更多令牌。 - Cloudflare 端支出限制。在 dash.cloudflare.com → Billing → Notifications 您可以设置预算警报,并在使用超过阈值时让 Cloudflare 向您发送电子邮件。
切换提供商
如果您根本不想使用 Cloudflare:
-
在“设置 → 系统”中留空 Cloudflare Account ID 和 API 令牌,并设置
OPENAI_API_KEY— 互客鱼的提供商链(Cloudflare → OpenRouter → OpenAI)自动回退到 OpenAI。 -
OpenAI 的聊天模型通常比 Workers AI 每回合更贵,但在
gpt-4o-mini等上提供行业标准质量。 - 此模式下的向量存储回退到您自己托管的 Qdrant 实例 — 参见 环境变量。
底线。Cloudflare 是运行互客鱼最便宜和最简单的方式。 大多数安装保持在免费层内;即使是高流量的也很少超过 $50/月。 您始终拥有完全的可见性 — 账单存在于您的 Cloudflare 仪表板中,而不是互客鱼中。