Windows‑Use Windows-Use 是一个开源工具,旨在桥接AI智能体(如大型语言模型)与Windows操作系统,实现无需人工干预的自动化操作。 950 项目框架# LLM操作系统控制# Windows自动化# 开源UI自动化
UI-TARS 一个开源的多模态代理模型,基于强大的视觉语言模型,能够有效执行虚拟世界中的多样化任务。具备 GUI、游戏、代码和工具使用等增强能力,能够无缝集成多种能力以完成复杂任务。 910 项目框架# GUI自动化# UI-TARS# 多模态智能体
LangGraph LangGraph 是一个用于构建、管理和部署长运行、有状态代理(agents)的低级编排框架。它被广泛应用于需要构建复杂、可扩展、可持久化代理系统的场景。 900 项目框架# LangGraph# LLM开发# 持久执行
Shimmy Shimmy 是一款轻量级开源工具,专为本地 AI 推理设计,提供了与 OpenAI API 完全兼容的接口,使开发者能够在本地环境中运行大模型,而无需依赖云端服务。 890 项目框架# 开源工具# 本地AI# 隐私保护
coze-studio Coze Studio 是由字节跳动开发并开源的一站式 AI Agent 开发工具,旨在为开发者提供从开发到部署的全方位支持,帮助他们快速构建和调试智能体、应用和工作流 。 880 项目框架# AI Agent开发# coze-studio# 低代码平台
CozeWorkflows 一个开源项目,由风哥(AI 博主)开发并维护,该项目旨在提供200多个Coze工作流,帮助用户高效处理AI任务。 880 项目框架# AI工作流# CozeWorkflows# 开源模板
lmsysorg LMSYS Org是一个专注于大规模人工智能模型研究与开放协作的非营利组织,提供了丰富的资源、工具和社区服务,旨在促进学术界与工业界的合作,降低大模型技术的使用门槛。 850 项目框架# lmsysorg# 大模型评测# 开源聊天模型
Perplexica Perplexica 是一个开源的 AI 驱动搜索工具,旨在深入互联网以找到答案。它基于 Perplexity AI,是一个开源的替代方案,不仅搜索网页,还能理解用户的问题。 840 项目框架# AI搜索# 大语言模型# 开源工具
deep-research 一个由人工智能驱动的研究助手,通过结合搜索引擎、网页抓取和大型语言模型,对任何主题进行迭代、深入的研究。 820 项目框架# AI研究代理# deep-research# 开源研究工具
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 820 项目框架# AI模型部署# Xinference# 开源推理框架
Vercel AI SDK AI SDK 是一个由 Vercel 推出的 TypeScript 工具包,旨在帮助开发者使用 React、Next.js、Vue、Svelte、Node.js 等技术构建 AI 驱动的应用。 810 项目框架# TypeScript 工具包# Vercel AI SDK# 生成式 AI
Anthropic Cookbook Anthropic Cookbook 是由 Anthropic 官方推出的开源项目,旨在为开发者提供基于 Claude 大模型的最佳实践、代码示例和集成案例 810 项目框架# AI 开发示例# Anthropic Cookbook# Claude 大模型
MultiTalk MultiTalk 是一个音频驱动的多人物对话视频生成系统,支持多人对话、互动控制、卡通角色生成、唱歌等。 810 项目框架# MultiTalk# 多人物对话视频# 音频驱动视频生成
Stagehand Stagehand 是一个专注于网页自动化和 AI 浏览器控制的框架。它基于 Playwright 构建,提供自然语言控制的 API,用于实现网页自动化任务,如网页浏览、数据提取和操作等。 810 项目框架# AI驱动自动化# Playwright# Stagehand
DroidRun DroidRun 是一个开源框架,旨在通过自然语言命令控制 Android 设备,实现移动设备的自动化操作。 800 项目框架# Android自动化# DroidRun# LLM代理
MCP Feedback Enhanced MCP Feedback Enhanced 是一个基于 Model Context Protocol(MCP)的反馈驱动开发工具,旨在通过用户确认而非推测操作,优化AI交互流程,提升开发效率。 800 项目框架# AI反馈工具# MCP Feedback Enhanced# Model Context Protocol
Unstract Unstract 是一款基于大语言模型(LLM)打造的无代码平台,专注于非结构化数据提取,旨在通过 LLM 能力消除非结构化数据相关的人工流程 790 项目框架# Unstract# 文档数据提取# 无代码LLM平台
GPT-SoVITS GPT-SoVITS 是一款创新的开源声音克隆工具,它将 GPT 模型与 SoVITS 技术相结合,能够在样本数据极少的情况下,实现高质量的语音克隆和文本到语音转换(TTS)。 780 项目框架# GPT-SoVITS# 语音合成# 语音转换
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 780 项目框架# PaddleSpeech# 文本转语音# 语音识别
AgenticSeek 一个完全本地运行的 AI 助手,旨在替代传统云端 AI 服务,提供多种功能,包括智能网页浏览、代码编写、任务规划、语音交互等,支持多种编程语言和多语言支持。 780 项目框架# AgenticSeek# 代码生成# 智能代理
Edge-TTS Edge-TTS 是一个基于微软 Azure 文本转语音(TTS)功能的 Python 库,旨在为开发者提供简单、高效、免费的文本转语音解决方案。 770 项目框架# Edge-TTS# 开源TTS工具# 文本转语音