LLaMA-Factory：统一高效的LLM/VLM微调工具

2025年3月10日

| AI技术

LLaMA-Factory: 统一高效地微调100+ LLMs & VLMs (ACL 2024)

LLaMA-Factory 是一个强大的工具，旨在简化和加速大规模语言模型（LLMs）和视觉语言模型（VLMs）的微调过程。它支持超过 100 种不同的模型架构，并集成了多种先进的微调技术和优化算法。

项目地址: https://github.com/hiyouga/LLaMA-Factory

核心特性

广泛的模型支持: 支持 LLaMA, LLaVA, Mistral, Mixtral-MoE, Qwen, Qwen2-VL, DeepSeek, Yi, Gemma, ChatGLM, Phi 等超过100个模型。
多种训练方法: 包括 (Continuous) pre-training, (multimodal) supervised fine-tuning, reward modeling, PPO, DPO, KTO, ORPO 等。
……

阅读全文

LLM Function-Calling与模型上下文协议(MCP)：构建智能企业系统的双重引擎

2025年3月10日

| AI技术

LLM Function-Calling与模型上下文协议 (MCP)：构建智能企业系统的双重引擎

将大型语言模型 (LLM) 集成到企业系统正在改变企业与其工具和工作流程交互的方式。通过使用自然语言 (NL) 输入来控制复杂操作，LLM 简化了对企业功能的访问，使其更加直观和高效。然而，这种集成需要一个结构良好的方法来处理将提示转换为可操作指令以及执行这些指令。LLM Function-Calling 和模型上下文协议 (MCP) 应运而生，它们各自提供独特且互补的功能。

……

阅读全文

Magentic：让 LLM 与 Python 函数无缝集成

2025年3月10日

| AI技术

Magentic：无缝集成LLM到Python函数中

Magentic 是一个 Python 库，旨在简化将大型语言模型（LLMs）集成到 Python 代码中的过程。它允许开发者使用 @prompt和 @chatprompt 装饰器创建函数，这些函数实际上是 LLM 的提示模板，并返回结构化的输出。

核心特性

结构化输出： 支持使用 Pydantic 模型和 Python 内置类型来定义 LLM 函数的输出结构。
流式输出： 支持流式传输结构化输出和函数调用，允许在生成过程中使用它们。
LLM辅助重试： 通过 LLM 辅助的重试机制，提高LLM生成符合复杂输出模式结果的可能性。
可观测性： 利用 OpenTelemetry 提供了可观测性，并原生集成了 Pydantic Logfire。
类型注解： 类型注解能与代码检查工具和 IDE 良好配合。
灵活的配置： 支持多种 LLM 提供商，包括 OpenAI、Anthropic 和 Ollama。
其他特性： 包括 Chat Prompting、并行函数调用、视觉能力、格式化和异步支持等。

安装

使用 pip 安装：

……

阅读全文

AI Toolkit：Stable Diffusion 的 AI 脚本工具集

2025年3月10日

| AI技术

AI Toolkit：各种 AI 脚本，主要用于 Stable Diffusion

ostris/ai-toolkit 是一个 GitHub 仓库，包含多种 AI 脚本，主要用于 Stable Diffusion 相关任务。该项目使用 MIT 许可证，目前已获得 4.2k star, 470 forks, 59 watching。

主要功能：

Stable Diffusion 脚本: 提供各种用于 Stable Diffusion 的脚本和工具。
FLUX.1 模型训练: 支持对 FLUX.1 系列模型进行训练，包括 FLUX.1-dev 和 FLUX.1-schnell。
LoRA 和 LoKr 训练: 支持 LoRA (Low-Rank Adaptation) 和 LoKr 训练，允许针对特定层进行训练。
Gradio UI: 提供一个基于 Gradio 的用户界面，方便用户上传图片、标注、训练和发布 LoRA 模型。
UI界面: 基于Node.js 和 React 搭建的WEB UI界面，它可以让你方便地启动、停止、监控训练任务，也能更容易地开始新的训练模型。该UI还处于早期beta阶段，可能存在bug 并且UI安全性未知，不建议暴露到公网。

安装步骤：

……

阅读全文

Nanobrowser: 开源AI驱动Web自动化Chrome扩展

2025年3月10日

| AI技术

Nanobrowser：一款开源的AI驱动的Web自动化Chrome扩展

想体验强大的AI网页自动化，但又不想花费OpenAI Operator每月200美元的高昂费用吗？Nanobrowser，这款开源的Chrome扩展，为你提供了一个免费且更灵活的替代方案。

项目地址： https://github.com/nanobrowser/nanobrowser

核心特性

**完全免费：**无需订阅，只需安装并使用自己的API密钥，按实际用量付费。
**隐私至上：**所有操作都在本地浏览器中运行，保护你的凭证安全。
**灵活的LLM选择：**自由选择不同的LLM供应商，为不同的agent分配不同的模型。目前支持OpenAI和Anthropic，未来将支持更多。
**完全开源：**透明的自动化过程，告别黑盒操作。
多Agent系统： 特化的AI agents 协同工作，完成复杂的web 工作流。
交互式侧边栏： 直观聊天界面，实时查看状态更新。
任务自动化: 无缝自动化跨网站的重复网络自动化任务。
后续问题: 针对已完成的任务，可以提问上下文后续问题。
对话历史: 轻松访问和管理你的 AI Agent 交互历史。

快速开始

从Github Release页面下载最新的 nanobrowser.zip 文件。
在Chrome中打开 chrome://extensions/。
启用开发者模式（右上角）。
点击“加载已解压的扩展程序”（左上角）。
选择解压后的 nanobrowser 文件夹。
点击浏览器工具栏中的Nanobrowser图标打开侧边栏。
点击设置图标 (右上角)。
添加你的LLM API keys。
选择为不同的agent (Navigator, Planner, Validator)使用哪个模型。

从源码构建

如果你想自己构建Nanobrowser，可以按照以下步骤操作：

……

阅读全文

HeyGem.ai：完全离线的AI视频合成工具，打造专属数字形象

2025年3月10日

| AI技术

HeyGem.ai：一款完全离线的AI视频合成工具，打造你的专属数字形象

HeyGem.ai 是一个开源项目，致力于打造一款完全离线的视频合成工具，它可以在Windows系统上运行，并能精准地克隆你的外貌和声音，实现你的数字形象化。你可以通过文字和语音驱动虚拟形象，创作个性化的视频内容。由于完全离线运行，它能有效保护你的隐私，同时提供便捷高效的数字化体验。

核心功能：

精准的外貌和声音克隆： 使用先进的AI算法捕捉人脸特征，构建逼真的虚拟模型；精准克隆声音，捕捉和重现人声的细微特征，支持各种声音参数设置，创造高相似度的克隆效果。
文本和语音驱动的虚拟形象： 通过自然语言处理技术理解文本内容，将其转化为自然流畅的语音来驱动虚拟形象；也可以直接使用语音输入，让虚拟形象根据语音的节奏和语调执行相应的动作和面部表情，使虚拟形象的表演更加自然生动。
高效的视频合成： 高度同步数字人视频图像和声音，实现自然流畅的口型同步，智能优化音视频同步效果。
多语言支持： 脚本支持八种语言，包括英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。

主要优势：

……

阅读全文

Cursor Export：导出你的 Cursor IDE 聊天记录和编辑器数据

2025年3月8日

| Github

Cursor Export：导出你的 Cursor IDE 聊天记录和编辑器数据

在使用 Cursor IDE 的过程中，你是否希望能够方便地导出你的聊天记录和编辑器数据，进行备份、分享或者进一步分析呢？现在，cursor-export 这个命令行工具就能帮你轻松实现！

cursor-export 是一款用于从 Cursor IDE 导出聊天历史和编辑器数据的实用工具。它能帮你将宝贵的聊天记录保存为多种格式，方便你随时查阅和利用。

……

阅读全文

Commix: 自动化命令注入漏洞利用利器

2025年3月6日

| 网络安全

Commix：自动化 OS 命令注入漏洞利用工具

Commix (Command Injection Exploiter) 是一个开源的渗透测试工具，由 Anastasios Stasinopoulos (@ancst) 开发，旨在自动化检测和利用命令注入漏洞。

主要功能：

自动化检测和利用命令注入漏洞
支持多种平台
提供丰富的用户手册和使用示例
支持多种语言的翻译

安装：

你可以通过克隆官方 Git 仓库来下载 commix：

$ git clone https://github.com/commixproject/commix.git commix

或者，你也可以下载最新的 tarball 或 zipball。

注意： 运行 commix 需要 Python (版本 2.6, 2.7 或 3.x)。

……

阅读全文

AI驱动的对冲基金概念验证项目

2025年3月5日

| 量化交易

AI驱动的对冲基金：一个概念验证项目

近年来，人工智能在金融领域的应用日益广泛。一个名为ai-hedge-fund的开源项目，展示了如何利用AI构建对冲基金的概念验证。该项目旨在探索使用AI进行交易决策的可能性，但仅供教育目的，不应用于实际交易或投资。

项目概述

ai-hedge-fund项目通过模拟一个由多个AI Agent组成的团队，做出交易决策。这些Agent模仿了不同投资大师的策略，协同工作，从而实现投资组合的管理。

……

阅读全文

Imich：你的自托管高性能照片和视频管理利器

2025年3月5日

| Github

Imich：高性能的自托管照片和视频管理解决方案

近年来，随着个人数据安全意识的提高，越来越多的人开始选择将数据存储在自己掌控的服务器上。Imich 是一款开源的自托管照片和视频管理解决方案，可以让你拥有如同 Google Photos 一般的体验，但数据完全掌握在自己手中。

项目简介

Imich 旨在提供一个高性能、易于使用的平台，用于存储、管理和分享你的照片和视频。

核心功能:
- 上传、查看和管理照片与视频。
- 自动备份（移动端）。
- 重复照片检测。
- 相册和共享相册。
- 支持 RAW 格式。
- 元数据查看 (EXIF, 地图)。
- 基于元数据、物体、人脸和 CLIP 的搜索。
- 时间线滚动浏览
- 用户定义存储结构
- 公共共享
- 合作共享
- 面部识别和聚类
- 标签
多平台支持:
- Web 界面
- 移动 App (iOS 和 Android)
技术栈:
- 后端: NestJS
- 前端: SvelteKit、Flutter
- 编程语言：Typescript、Dart。

功能特性对比 (Web vs. Mobile)

功能	Web	Mobile
上传和查看视频与照片	Yes	Yes
自动备份	N/A	Yes
防止资源重复	Yes	Yes
选择性相册备份	N/A	Yes
下载照片与视频到本地设备	Yes	Yes
多用户支持	Yes	Yes
相册和共享相册	Yes	Yes
可拖动滚动条	Yes	Yes
支持 RAW 格式	Yes	Yes
元数据视图 (EXIF, map)	Yes	Yes
按元数据、对象、人脸和 CLIP 搜索	Yes	Yes
管理功能 (用户管理)	Yes	No
后台备份	N/A	Yes
虚拟滚动	Yes	Yes
OAuth 支持	Yes	Yes
API 密钥	Yes	N/A
LivePhoto/MotionPhoto 备份和播放	Yes	Yes
支持 360 度图像显示	Yes	No
用户自定义存储结构	Yes	Yes
公共分享	Yes	Yes
归档和收藏夹	Yes	Yes
全球地图	Yes	Yes
合作分享	Yes	Yes
人脸识别和聚类	Yes	Yes
“X 年前” 回忆	Yes	Yes
离线支持	No	Yes
只读图库	Yes	Yes
堆叠照片	Yes	Yes
标签	Yes	No
文件夹视图	Yes	No

快速上手

你可以访问 Imich 官方网站 https://immich.app/ 获取更多信息，包括安装指南。你也可以访问官方Demo体验： https://demo.immich.app/ 用户名：demo@immich.app 密码：demo

……

阅读全文

技术杂烩

LLaMA-Factory：统一高效的LLM/VLM微调工具

LLaMA-Factory: 统一高效地微调100+ LLMs & VLMs (ACL 2024)

核心特性

LLM Function-Calling与模型上下文协议(MCP)：构建智能企业系统的双重引擎

LLM Function-Calling与模型上下文协议 (MCP)：构建智能企业系统的双重引擎

Magentic：让 LLM 与 Python 函数无缝集成

Magentic：无缝集成LLM到Python函数中

核心特性

安装

AI Toolkit：Stable Diffusion 的 AI 脚本工具集

AI Toolkit：各种 AI 脚本，主要用于 Stable Diffusion

Nanobrowser: 开源AI驱动Web自动化Chrome扩展

Nanobrowser：一款开源的AI驱动的Web自动化Chrome扩展

核心特性

快速开始

从源码构建

HeyGem.ai：完全离线的AI视频合成工具，打造专属数字形象

HeyGem.ai：一款完全离线的AI视频合成工具，打造你的专属数字形象

Cursor Export：导出你的 Cursor IDE 聊天记录和编辑器数据

Cursor Export：导出你的 Cursor IDE 聊天记录和编辑器数据

Commix: 自动化命令注入漏洞利用利器

Commix：自动化 OS 命令注入漏洞利用工具

AI驱动的对冲基金概念验证项目

AI驱动的对冲基金：一个概念验证项目

Imich：你的自托管高性能照片和视频管理利器

Imich：高性能的自托管照片和视频管理解决方案

项目简介

功能特性对比 (Web vs. Mobile)

快速上手

最近文章

分类

标签

友情链接

其它