OWL:用于实际任务自动化的通用多智能体协作框架

OWL 是一个顶尖的框架,利用 CAMEL-AI 框架构建,用于推动任务自动化的边界。其愿景是革新 AI 智能体协作解决实际任务的方式。通过动态智能体交互,OWL 能在不同领域实现更自然、高效和稳健的任务自动化。目前 OWL 在 GAIA 基准测试中取得了 58.18 的平均分,在开源框架中排名第一。

核心功能:

  • 实时信息检索: 利用维基百科、谷歌搜索等在线资源获取最新信息。
  • 多模态处理: 支持处理互联网或本地的视频、图像和音频数据。
  • 浏览器自动化: 使用 Playwright 框架模拟浏览器交互,包括滚动、点击、输入处理、下载、导航等。
  • 文档解析: 从 Word, Excel, PDF, PowerPoint 文件中提取内容,并将其转换为文本或 Markdown 格式。
  • 代码执行: 编写和执行 Python 代码。
  • 内置工具包: 提供全面的内置工具包,包括 ArxivToolkit, AudioAnalysisToolkit, CodeExecutionToolkit, DalleToolkit, DataCommonsToolkit, ExcelToolkit, GitHubToolkit, GoogleMapsToolkit, GoogleScholarToolkit, ImageAnalysisToolkit, MathToolkit, NetworkXToolkit, NotionToolkit, OpenAPIToolkit, RedditToolkit, SearchToolkit, SemanticScholarToolkit, SymPyToolkit, VideoAnalysisToolkit, WeatherToolkit, WebToolkit 等,用于专门任务。

安装:

OWL 提供了多种安装方式,包括使用 uvvenvconda。 推荐使用 uv,因为它能够更快地安装依赖项。

快速开始:

  1. 克隆 GitHub 仓库:git clone https://github.com/camel-ai/owl.git
  2. 进入项目目录:cd owl
  3. 选择一种安装方法安装项目依赖,设置环境变量。
  4. 运行示例代码:python owl/run.py

Web 界面:

OWL 现在包含一个基于 Web 的用户界面,使与系统交互更加容易。运行python run_app.py即可启动 Web 界面。

使用不同的模型运行:

OWL 支持多种 LLM 后端。您可以使用以下脚本来使用不同的模型运行:

# 使用 Qwen 模型运行
python owl/run_qwen.py

# 使用 Deepseek 模型运行
python owl/run_deepseek.py

# 使用其他 OpenAI 兼容模型运行
python owl/run_openai_compatiable_model.py

运行自定义任务:

# 定义你自己的任务
question = "Task description here."
society = construct_society(question)
answer, chat_history, token_count = run_society(society)
print(f"\033[94mAnswer: {answer}\033[0m")