Nanobrowser: 开源AI驱动Web自动化Chrome扩展
Nanobrowser:一款开源的AI驱动的Web自动化Chrome扩展
想体验强大的AI网页自动化,但又不想花费OpenAI Operator每月200美元的高昂费用吗?Nanobrowser,这款开源的Chrome扩展,为你提供了一个免费且更灵活的替代方案。
项目地址: https://github.com/nanobrowser/nanobrowser
核心特性
- **完全免费:**无需订阅,只需安装并使用自己的API密钥,按实际用量付费。
- **隐私至上:**所有操作都在本地浏览器中运行,保护你的凭证安全。
- **灵活的LLM选择:**自由选择不同的LLM供应商,为不同的agent分配不同的模型。目前支持OpenAI和Anthropic,未来将支持更多。
- **完全开源:**透明的自动化过程,告别黑盒操作。
- 多Agent系统: 特化的AI agents 协同工作,完成复杂的web 工作流。
- 交互式侧边栏: 直观聊天界面,实时查看状态更新。
- 任务自动化: 无缝自动化跨网站的重复网络自动化任务。
- 后续问题: 针对已完成的任务,可以提问上下文后续问题。
- 对话历史: 轻松访问和管理你的 AI Agent 交互历史。
快速开始
- 从Github Release页面下载最新的
nanobrowser.zip
文件。 - 在Chrome中打开
chrome://extensions/
。 - 启用开发者模式(右上角)。
- 点击“加载已解压的扩展程序”(左上角)。
- 选择解压后的
nanobrowser
文件夹。 - 点击浏览器工具栏中的Nanobrowser图标打开侧边栏。
- 点击设置图标 (右上角)。
- 添加你的LLM API keys。
- 选择为不同的agent (Navigator, Planner, Validator)使用哪个模型。
从源码构建
如果你想自己构建Nanobrowser,可以按照以下步骤操作:
- Prerequisites:
- Node.js (v22.12.0 或更高版本)
- pnpm (v9.15.1 或更高版本)
- 克隆仓库:
git clone https://github.com/nanobrowser/nanobrowser.git cd nanobrowser
- 安装依赖:
pnpm install
- 构建扩展:
pnpm build
- 加载扩展: 按照"快速开始"中的安装步骤将扩展加载到你的浏览器中。
- Development Mode (optional):
pnpm dev
应用示例
只需一句话,即可完成以下任务:
- 新闻摘要: “前往 TechCrunch,提取过去 24 小时内的前 10 条头条新闻”
- GitHub 搜索: “在 GitHub 上查找最受欢迎的 Python 存储库”
- 购物搜索: “在亚马逊上找到一款防水设计的便携式蓝牙扬声器,价格低于 50 美元。电池续航力应至少为 10 小时。”
架构概览
Nanobrowser使用由大型语言模型驱动的专业多代理系统来理解和执行复杂的web任务:
- Planner: 制定和优化完成任务的策略
- Navigator: 导航网站并执行操作
- Validator: 检查任务是否成功完成
未来规划 (Roadmap)
- 扩展LLM支持: 增加对更多LLM厂商的支持
- 安全防火墙: 实施保护措施,确保安全的浏览操作
- 内存优化: 降低Token使用量,同时保持上下文理解
- 会话重播: 以最低的Token消耗高效地重播历史任务
- 专业Agent: 为复杂的特定领域任务开发专用Agent
贡献
欢迎各种形式的贡献:
- 分享Prompt & Use Cases
- 提供反馈
- 贡献代码
欢迎加入 Nanobrowser 社区,共同构建Web自动化的未来。
Nanobrowser 基于开源项目构建,感谢他们的作者和贡献者。
许可证: Apache License 2.0
- 原文作者:iamdev
- 原文链接:https://blog.iamdev.cn/post/2025/Nanobrowser_-%E5%BC%80%E6%BA%90AI%E9%A9%B1%E5%8A%A8Web%E8%87%AA%E5%8A%A8%E5%8C%96Chrome%E6%89%A9%E5%B1%95/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止转载 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。