OWL:通用多智能体协作框架,赋能实际任务自动化
OWL:用于实际任务自动化的通用多智能体协作框架
OWL 是一个顶尖的框架,利用 CAMEL-AI 框架构建,用于推动任务自动化的边界。其愿景是革新 AI 智能体协作解决实际任务的方式。通过动态智能体交互,OWL 能在不同领域实现更自然、高效和稳健的任务自动化。目前 OWL 在 GAIA 基准测试中取得了 58.18 的平均分,在开源框架中排名第一。
核心功能:
- 实时信息检索: 利用维基百科、谷歌搜索等在线资源获取最新信息。
- 多模态处理: 支持处理互联网或本地的视频、图像和音频数据。
- 浏览器自动化: 使用 Playwright 框架模拟浏览器交互,包括滚动、点击、输入处理、下载、导航等。
- 文档解析: 从 Word, Excel, PDF, PowerPoint 文件中提取内容,并将其转换为文本或 Markdown 格式。
- 代码执行: 编写和执行 Python 代码。
- 内置工具包: 提供全面的内置工具包,包括 ArxivToolkit, AudioAnalysisToolkit, CodeExecutionToolkit, DalleToolkit, DataCommonsToolkit, ExcelToolkit, GitHubToolkit, GoogleMapsToolkit, GoogleScholarToolkit, ImageAnalysisToolkit, MathToolkit, NetworkXToolkit, NotionToolkit, OpenAPIToolkit, RedditToolkit, SearchToolkit, SemanticScholarToolkit, SymPyToolkit, VideoAnalysisToolkit, WeatherToolkit, WebToolkit 等,用于专门任务。
安装:
OWL 提供了多种安装方式,包括使用 uv
、venv
和 conda
。 推荐使用 uv
,因为它能够更快地安装依赖项。
快速开始:
- 克隆 GitHub 仓库:
git clone https://github.com/camel-ai/owl.git
- 进入项目目录:
cd owl
- 选择一种安装方法安装项目依赖,设置环境变量。
- 运行示例代码:
python owl/run.py
Web 界面:
OWL 现在包含一个基于 Web 的用户界面,使与系统交互更加容易。运行python run_app.py
即可启动 Web 界面。
使用不同的模型运行:
OWL 支持多种 LLM 后端。您可以使用以下脚本来使用不同的模型运行:
# 使用 Qwen 模型运行
python owl/run_qwen.py
# 使用 Deepseek 模型运行
python owl/run_deepseek.py
# 使用其他 OpenAI 兼容模型运行
python owl/run_openai_compatiable_model.py
运行自定义任务:
# 定义你自己的任务
question = "Task description here."
society = construct_society(question)
answer, chat_history, token_count = run_society(society)
print(f"\033[94mAnswer: {answer}\033[0m")
- 原文作者:iamdev
- 原文链接:https://blog.iamdev.cn/post/2025/OWL%E9%80%9A%E7%94%A8%E5%A4%9A%E6%99%BA%E8%83%BD%E4%BD%93%E5%8D%8F%E4%BD%9C%E6%A1%86%E6%9E%B6%E8%B5%8B%E8%83%BD%E5%AE%9E%E9%99%85%E4%BB%BB%E5%8A%A1%E8%87%AA%E5%8A%A8%E5%8C%96/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止转载 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。