UI-TARS 一个开源的多模态代理模型,基于强大的视觉语言模型,能够有效执行虚拟世界中的多样化任务。具备 GUI、游戏、代码和工具使用等增强能力,能够无缝集成多种能力以完成复杂任务。 520 项目框架# GUI自动化# UI-TARS# 多模态智能体
DeepFlow DeepFlow 是由云杉网络(Yunshan Networks)研发的 全栈可观测性平台,面向云原生、分布式系统以及 AI 应用,提供从底层网络到业务层的统一监控、追踪和性能剖析能力。 520 项目框架# DeepFlow# eBPF# 云原生监控
Shimmy Shimmy 是一款轻量级开源工具,专为本地 AI 推理设计,提供了与 OpenAI API 完全兼容的接口,使开发者能够在本地环境中运行大模型,而无需依赖云端服务。 480 项目框架# 开源工具# 本地AI# 隐私保护
deep-research 一个由人工智能驱动的研究助手,通过结合搜索引擎、网页抓取和大型语言模型,对任何主题进行迭代、深入的研究。 480 项目框架# AI研究代理# deep-research# 开源研究工具
LangGraph LangGraph 是一个用于构建、管理和部署长运行、有状态代理(agents)的低级编排框架。它被广泛应用于需要构建复杂、可扩展、可持久化代理系统的场景。 470 项目框架# LangGraph# LLM开发# 持久执行
coze-studio Coze Studio 是由字节跳动开发并开源的一站式 AI Agent 开发工具,旨在为开发者提供从开发到部署的全方位支持,帮助他们快速构建和调试智能体、应用和工作流 。 470 项目框架# AI Agent开发# coze-studio# 低代码平台
CozeWorkflows 一个开源项目,由风哥(AI 博主)开发并维护,该项目旨在提供200多个Coze工作流,帮助用户高效处理AI任务。 470 项目框架# AI工作流# CozeWorkflows# 开源模板
lmsysorg LMSYS Org是一个专注于大规模人工智能模型研究与开放协作的非营利组织,提供了丰富的资源、工具和社区服务,旨在促进学术界与工业界的合作,降低大模型技术的使用门槛。 470 项目框架# lmsysorg# 大模型评测# 开源聊天模型
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 460 项目框架# AI模型部署# Xinference# 开源推理框架
Perplexica Perplexica 是一个开源的 AI 驱动搜索工具,旨在深入互联网以找到答案。它基于 Perplexity AI,是一个开源的替代方案,不仅搜索网页,还能理解用户的问题。 440 项目框架# AI搜索# 大语言模型# 开源工具
MCP Feedback Enhanced MCP Feedback Enhanced 是一个基于 Model Context Protocol(MCP)的反馈驱动开发工具,旨在通过用户确认而非推测操作,优化AI交互流程,提升开发效率。 440 项目框架# AI反馈工具# MCP Feedback Enhanced# Model Context Protocol
DroidRun DroidRun 是一个开源框架,旨在通过自然语言命令控制 Android 设备,实现移动设备的自动化操作。 430 项目框架# Android自动化# DroidRun# LLM代理
MultiTalk MultiTalk 是一个音频驱动的多人物对话视频生成系统,支持多人对话、互动控制、卡通角色生成、唱歌等。 430 项目框架# MultiTalk# 多人物对话视频# 音频驱动视频生成
Vercel AI SDK AI SDK 是一个由 Vercel 推出的 TypeScript 工具包,旨在帮助开发者使用 React、Next.js、Vue、Svelte、Node.js 等技术构建 AI 驱动的应用。 420 项目框架# TypeScript 工具包# Vercel AI SDK# 生成式 AI
Anthropic Cookbook Anthropic Cookbook 是由 Anthropic 官方推出的开源项目,旨在为开发者提供基于 Claude 大模型的最佳实践、代码示例和集成案例 420 项目框架# AI 开发示例# Anthropic Cookbook# Claude 大模型
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 410 项目框架# PaddleSpeech# 文本转语音# 语音识别
LeRobot LeRobot 是由 Hugging Face 推出的一个开源机器人项目,旨在通过提供模型、数据集和工具,降低机器人开发的门槛,使更多人能够参与和受益于机器人技术的发展。 410 项目框架# LeRobot# 开源机器人平台# 模仿学习
Stagehand Stagehand 是一个专注于网页自动化和 AI 浏览器控制的框架。它基于 Playwright 构建,提供自然语言控制的 API,用于实现网页自动化任务,如网页浏览、数据提取和操作等。 410 项目框架# AI驱动自动化# Playwright# Stagehand
Farfalle 开源AI搜索引擎项目,主要功能包括支持本地和云端模型运行,可选择使用本地大型语言模型(如Llama3,Mistral,Gemma和Phi3)或云端模型(如OpenAI的GPT-4和Groq的Llama3)进行搜索和回答问题 410 项目框架# Farfalle# 开源AI搜索引擎# 自托管LLM
GPT-SoVITS GPT-SoVITS 是一款创新的开源声音克隆工具,它将 GPT 模型与 SoVITS 技术相结合,能够在样本数据极少的情况下,实现高质量的语音克隆和文本到语音转换(TTS)。 400 项目框架# GPT-SoVITS# 语音合成# 语音转换
AgenticSeek 一个完全本地运行的 AI 助手,旨在替代传统云端 AI 服务,提供多种功能,包括智能网页浏览、代码编写、任务规划、语音交互等,支持多种编程语言和多语言支持。 400 项目框架# AgenticSeek# 代码生成# 智能代理