Nanobrowser:一款开源的AI驱动的Web自动化Chrome扩展

想体验强大的AI网页自动化,但又不想花费OpenAI Operator每月200美元的高昂费用吗?Nanobrowser,这款开源的Chrome扩展,为你提供了一个免费且更灵活的替代方案。

项目地址: https://github.com/nanobrowser/nanobrowser

核心特性

  • **完全免费:**无需订阅,只需安装并使用自己的API密钥,按实际用量付费。
  • **隐私至上:**所有操作都在本地浏览器中运行,保护你的凭证安全。
  • **灵活的LLM选择:**自由选择不同的LLM供应商,为不同的agent分配不同的模型。目前支持OpenAI和Anthropic,未来将支持更多。
  • **完全开源:**透明的自动化过程,告别黑盒操作。
  • 多Agent系统: 特化的AI agents 协同工作,完成复杂的web 工作流。
  • 交互式侧边栏: 直观聊天界面,实时查看状态更新。
  • 任务自动化: 无缝自动化跨网站的重复网络自动化任务。
  • 后续问题: 针对已完成的任务,可以提问上下文后续问题。
  • 对话历史: 轻松访问和管理你的 AI Agent 交互历史。

快速开始

  1. 从Github Release页面下载最新的 nanobrowser.zip 文件。
  2. 在Chrome中打开 chrome://extensions/
  3. 启用开发者模式(右上角)。
  4. 点击“加载已解压的扩展程序”(左上角)。
  5. 选择解压后的 nanobrowser 文件夹。
  6. 点击浏览器工具栏中的Nanobrowser图标打开侧边栏。
  7. 点击设置图标 (右上角)。
  8. 添加你的LLM API keys。
  9. 选择为不同的agent (Navigator, Planner, Validator)使用哪个模型。

从源码构建

如果你想自己构建Nanobrowser,可以按照以下步骤操作:

  1. Prerequisites:
    • Node.js (v22.12.0 或更高版本)
    • pnpm (v9.15.1 或更高版本)
  2. 克隆仓库:
    git clone https://github.com/nanobrowser/nanobrowser.git
    cd nanobrowser
    
  3. 安装依赖:
    pnpm install
    
  4. 构建扩展:
    pnpm build
    
  5. 加载扩展: 按照"快速开始"中的安装步骤将扩展加载到你的浏览器中。
  6. Development Mode (optional):
    pnpm dev
    

应用示例

只需一句话,即可完成以下任务:

  • 新闻摘要: “前往 TechCrunch,提取过去 24 小时内的前 10 条头条新闻”
  • GitHub 搜索: “在 GitHub 上查找最受欢迎的 Python 存储库”
  • 购物搜索: “在亚马逊上找到一款防水设计的便携式蓝牙扬声器,价格低于 50 美元。电池续航力应至少为 10 小时。”

架构概览

Nanobrowser使用由大型语言模型驱动的专业多代理系统来理解和执行复杂的web任务:

  • Planner: 制定和优化完成任务的策略
  • Navigator: 导航网站并执行操作
  • Validator: 检查任务是否成功完成

未来规划 (Roadmap)

  • 扩展LLM支持: 增加对更多LLM厂商的支持
  • 安全防火墙: 实施保护措施,确保安全的浏览操作
  • 内存优化: 降低Token使用量,同时保持上下文理解
  • 会话重播: 以最低的Token消耗高效地重播历史任务
  • 专业Agent: 为复杂的特定领域任务开发专用Agent

贡献

欢迎各种形式的贡献:

  • 分享Prompt & Use Cases
  • 提供反馈
  • 贡献代码

欢迎加入 Nanobrowser 社区,共同构建Web自动化的未来。

Nanobrowser 基于开源项目构建,感谢他们的作者和贡献者。

许可证: Apache License 2.0