DreamTalk DreamTalk是一个基于扩散模型的音频驱动表达性头部生成框架,核心功能是将静态人物照片转化为逼真、富有表现力的说话视频。 840 项目框架# DreamTalk# 开源AI项目# 扩散模型
LeRobot LeRobot 是由 Hugging Face 推出的一个开源机器人项目,旨在通过提供模型、数据集和工具,降低机器人开发的门槛,使更多人能够参与和受益于机器人技术的发展。 410 项目框架# LeRobot# 开源机器人平台# 模仿学习
browser-use Browser Use 是一款专为大语言模型设计的智能浏览器工具。它是将 AI 智能体与浏览器连接起来的最简单方式,通过提供强大且简单的浏览器自动化接口,让 AI 智能体能够访问各类网站。 400 项目框架# browser-use# 大语言模型# 浏览器自动化
mcp.so 最大的 MCP Server(MCP 服务器)集合,包括优秀的 MCP Server(MCP 服务器)和 Claude MCP 集成。搜索和发现 MCP Server(MCP 服务器)以增强您的 AI 能力。 390 垂直导航项目框架# AI工具集成# MCP# Model Context Protocol
Windows‑Use Windows-Use 是一个开源工具,旨在桥接AI智能体(如大型语言模型)与Windows操作系统,实现无需人工干预的自动化操作。 570 项目框架# LLM操作系统控制# Windows自动化# 开源UI自动化
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 460 项目框架# AI模型部署# Xinference# 开源推理框架
Youtu-Agent Youtu-Agent 是腾讯优图实验室于 2025 年 9 月 2 日正式开源的智能体构建框架。是一个灵活、高性能的框架,用于构建、运行和评估自主智能体。 370 项目框架# Youtu-Agent# 开源智能体框架# 腾讯优图实验室
MotionAgent MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。 1200 项目框架# AI视频生成# MotionAgent# 开源创意工具
AniPortrait AniPortrait 是腾讯游戏智迹团队开发的一款创新的音频驱动肖像动画生成框架,能够通过音频和参考肖像图像生成高质量的动态视频。 910 项目框架# AI动画生成# AniPortrait# 音频驱动肖像动画
EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 9030 项目框架# EmotiVoice# 开源TTS# 情感语音合成
WrenAI WrenAI 是一个开源的生成式商业智能(GenBI)AI 代理,旨在帮助数据驱动的团队与他们的数据进行对话,并生成文本到 SQL、图表、电子表格、报告和可操作的见解 。 320 项目框架# WrenAI# 开源数据分析# 自然语言查询
awesome-cursorrules Awesome CursorRules 是一个精选的.cursorrules 文件集合,用于增强 Cursor AI 的代码生成功能。 270 项目框架# .cursorrules# AI代码生成# awesome-cursorrules
Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 2180 项目框架# Diffutoon# 动漫风格渲染# 视频转绘技术
awesome-llm-apps 一个精选的开源项目,旨在为开发者提供全面的大语言模型(LLM)应用开发参考,汇集了从基础聊天机器人到复杂的多模态系统的各类开源应用示例和详细教程 340 项目框架# AI代理# LLM应用# RAG
MultiTalk MultiTalk 是一个音频驱动的多人物对话视频生成系统,支持多人对话、互动控制、卡通角色生成、唱歌等。 430 项目框架# MultiTalk# 多人物对话视频# 音频驱动视频生成
SQLBot 一款基于大语言模型和 RAG(检索增强生成)的智能问数系统。借助 SQLBot,用户可以实现数据的即问即答,快速提炼获取所需的数据信息及可视化图表,并且支持进一步开展智能分析。 610 项目框架# RAG# SQLBot# 数据可视化
PocketFlow PocketFlow 是一个极简主义的 LLM(大型语言模型)框架,其核心代码仅包含 100 行代码,旨在简化 LLM 应用的开发。 340 项目框架# LLM框架# PocketFlow# 轻量级AI开发
MCP Feedback Enhanced MCP Feedback Enhanced 是一个基于 Model Context Protocol(MCP)的反馈驱动开发工具,旨在通过用户确认而非推测操作,优化AI交互流程,提升开发效率。 440 项目框架# AI反馈工具# MCP Feedback Enhanced# Model Context Protocol
Stagehand Stagehand 是一个专注于网页自动化和 AI 浏览器控制的框架。它基于 Playwright 构建,提供自然语言控制的 API,用于实现网页自动化任务,如网页浏览、数据提取和操作等。 410 项目框架# AI驱动自动化# Playwright# Stagehand
Farfalle 开源AI搜索引擎项目,主要功能包括支持本地和云端模型运行,可选择使用本地大型语言模型(如Llama3,Mistral,Gemma和Phi3)或云端模型(如OpenAI的GPT-4和Groq的Llama3)进行搜索和回答问题 410 项目框架# Farfalle# 开源AI搜索引擎# 自托管LLM
Gemini CLI Gemini CLI 是一个开源的 AI 代理工具,由 Google 开发,旨在将 Gemini 模型的强大功能直接集成到开发者的终端中 。 390 项目框架# Gemini CLI# 命令行AI工具# 开发者终端助手
TradingAgents-CN TradingAgents-CN 是一个基于多智能体大语言模型的中文金融交易决策框架,专为中文用户优化,提供完整的A股、港股、美股分析能力。 610 项目框架# TradingAgents-CN# 中文金融分析# 多智能体交易系统