+ Overview
+ ++ page-agent 是一个完全基于Web技术的 UI Agent,让任何网站都能拥有 AI 操作员。 通过简单的 CDN + 引入,为你的 Web 应用注入智能化能力。 +
+ +什么是 page-agent?
+ ++ page-agent 是一个页面内嵌式 UI Agent。 + 与传统的浏览器自动化工具不同,page-agent 面向网站开发者 + ,而非爬虫或通用Agent开发者,将 Agent 集成到你的网站中, + 让用户可以通过自然语言与页面进行交互。 +
+核心特性
+ ++ 🧠 智能 DOM 理解 +
++ 节约每一个 token。基于 DOM 分析,高强度脱水。无需视觉识别,纯文本实现精准操作。 +
++ 🔒 安全可控 +
++ 支持操作黑白名单、数据脱敏保护。注入自定义知识库,让 AI 按你的规则工作。 +
++ ⚡ 零后端部署 +
+CDN 直接引入,自定义 LLM 接入点。从 OpenAI 到 qwen3,完全由你掌控。
++ ♿ 普惠智能 +
+为复杂 B端系统、管理后台提供自然语言入口。让每个用户都能轻松上手。
+与 browser-use 的区别
+ +| + 特性 + | ++ page-agent + | ++ browser-use + | +
|---|---|---|
| + 部署方式 + | ++ 页面内嵌组件 + | +外部工具 | +
| + 操作范围 + | +当前页面 | ++ 整个浏览器 + | +
| + 目标用户 + | ++ 网站开发者 + | ++ 爬虫/Agent 开发者 + | +
| + 使用场景 + | ++ 用户体验增强 + | ++ 自动化任务 + | +
应用场景
+ +-
+
-
+
+ 1
+
+ + 对接答疑机器人: + 把你的答疑助手变成全能Agent。客服机器人不再只说"请先点击设置按钮然后点击...",而是直接帮用户现场操作。 ++
+
-
+
+ 2
+
+ + 交互升级/智能化改造: + 一行代码,老应用变身Agent,产品专家帮用户操作复杂 B + 端软件。降低人工支持成本,提高用户满意度。 ++
+
-
+
+ 3
+
+ + 产品教学: + 向用户演示交互过程,边做边教。例如让AI演示"如何提交报销申请"的完整操作流程。 ++
+
-
+
+ 4
+
+ + 无障碍支持: + 为视障用户、老年用户提供自然语言交互,对接屏幕阅读器或语音助理,让软件人人可用。 ++
+