互客鱼 返回主站

构建您的智能体

测试沙盒

/app/agents/{id}/playground 的 Playground 是测试智能体在发布之前的完整沙盒。 这里的对话标记为 is_playground,永远不会计入您的账单仪表、 对话分析或 Inbox。

您可以测试什么

  • 站点类型 — 在 ecommercesaasdocumentationhelp_centermarketinginternal_kbgeneric 之间切换,而不会改变智能体的持久列。对于“如果将我的智能体视为 ecommerce vs documentation,它会说什么?”很有用。
  • 页面上下文 — 粘贴 URL 和元数据(标题、描述、og 标签、JSON-LD、h1/h2、可见正文文本),以便智能体回答就像访客在特定页面上一样。六个现成模板(Shopify 产品、SaaS 定价、Docusaurus 文档、帮助中心文章、营销落地页、空白)涵盖常见形状。
  • 回复语言 — 选择工作区为其提供翻译的任何语言环境(默认 132 个,从 lang/*.json 自动发现)。用于健全性检查智能体是否以正确的语言回答以及 RTL 脚本是否镜像。
  • 示例提示词 — 每个垂直领域的买家现实测试提示(每个站点类型 5-6 个芯片),因此您可以一键触发典型问题。
  • 比较模式 — 切换将聊天拆分为两列,并并排针对两个不同的站点类型运行相同的问题。选择正确垂直领域的区分因素。

右窗格选项卡

场景

站点类型覆盖 + 回复语言 + 示例提示。 站点类型选择下方的能力徽章显示所选垂直领域可以发出哪些丰富块 (product_cardpricing_cardcase_study_cardescalation_button)。

页面上下文

访客将发送的 page_context 的表单驱动编辑器。 使用 使用模板 下拉列表放入现实的 Shopify 产品页面或 Stripe 定价页面, 然后调整 URL / 标题 / og 字段。JSON-LD 接受粘贴的 JSON。

诊断

最后一轮的只读检查:

  • 延迟 — 首个 token 时间和总时间。
  • 置信度 — 最强的接地信号(检索相似度 OR 页面上下文基线 0.85)。
  • 检索源 — top-k 块,带有 ANN 和 rerank 分数以及片段,按 LLM 看到的顺序排序。
  • 工具调用 — 在该轮期间触发的每个服务器端工具,带有参数。
  • 内联块 — LLM 发出的丰富块的数量和类型(例如 product_card)。
  • 系统提示词 — 使用的完整系统消息,包括垂直片段和任何自定义系统提示。点击展开。

端点

所有三个都是会话认证的并按 AgentPolicy::update 范围限定:

  • GET /app/agents/{agent}/playground — Inertia 渲染,带有按 slug 键入的垂直预览映射。
  • POST /app/agents/{agent}/playground/stream — SSE 流。主体:{message, conversation_id?, site_type_override?, language_override?, page_context?}。发出 startretrievalprompttokenblocktool_calldone 事件。
  • POST /app/agents/{agent}/playground/reset — 清除缓存的对话历史。主体:{conversation_id}

注释

  • Playground 轮次重用与生产小部件对话相同的 Redis 历史密钥。重置 是从空上下文开始的显式方式 — 关闭选项卡会将历史保留两个小时。
  • 站点类型和语言覆盖改变智能体的持久列。一旦找到有效的组合,请前往智能体设置中的 站点类型 保存它。
  • 页面上下文有效负载在服务器端以与访客小部件相同的方式进行清理 — 相同的密钥允许列表、相同的 8 KB 上限、相同的规范 URL 折叠。