EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 9020 项目框架# EmotiVoice# 开源TTS# 情感语音合成
FireRedTTS FireRedTTS是一款由小红书技术团队开发的基于大语言模型(LLM)的语音合成系统,旨在为用户提供高效、多样化的语音生成服务。 2290 项目框架# AI配音# FireRedTTS# 语音合成
PoloAPI PoloAPI 是一个专注于大模型 API 聚合服务的平台,旨在帮助开发者和企业快速接入和使用多种 AI 模型,如 Claude、OpenAI、Gemini 等。 2190 项目框架# AI模型调用# PoloAPI# 大模型API聚合
Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 2180 项目框架# Diffutoon# 动漫风格渲染# 视频转绘技术
PPTist PPTist 是一个基于 Web 的演示文稿(幻灯片)应用,旨在为用户提供类似于 Microsoft Office PowerPoint 的功能。 1920 项目框架# PPTist# Web演示文稿# 开源幻灯片工具
AstrBo 易于上手的多平台聊天机器人及开发框架。松耦合 / 异步 / 多消息平台部署 / 易用的插件系统 / 完善的大语言模型(LLM)接入 1780 项目框架# AstrBo# 大语言模型集成# 聊天机器人框架
MindSearch MindSearch是一款由上海人工智能实验室联合研发的开源AI搜索引擎框架,旨在通过模仿人类的思维过程,高效地处理复杂信息搜集与整合任务。 1510 项目框架# AI搜索引擎# MindSearch# 多智能体框架
MotionAgent MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。 1200 项目框架# AI视频生成# MotionAgent# 开源创意工具
Fish Speech Fish Speech 是一个由 Fish Audio 团队开发的文本转语音(TTS)技术,旨在利用先进的机器学习和深度学习技术将文字转换为自然流畅的语音输出。 1140 项目框架# Fish Speech# 开源TTS# 文本转语音
Video-Analyzer 一个视频分析工具,结合了视觉模型(如Llama的11B视觉模型)和Whisper进行语音识别,通过提取关键帧并进行分析,生成视频内容的描述。 1040 项目框架# Video-Analyzer# 多模态处理# 开源工具
小智 AI 聊天机器人 小智 AI 聊天机器人是一款基于开源硬件和开源软件的智能对话设备,旨在帮助用户入门 AI 硬件开发和 AI 模型应用。 1000 项目框架# AI 语音交互# 小智 AI 聊天机器人# 开源硬件
opencode opencode 是一个专为终端设计的 AI 编程代理(AI coding agent),旨在提供类似 Claude Code 的功能。支持 OpenAI、Google、Anthropic 等模型,甚至本地模型。 990 项目框架# AI编程工具# opencode# 终端开发
Bytebot 一个开源的 AI 桌面代理,旨在通过自然语言指令自动化计算机任务,允许用户通过简单的自然语言命令执行复杂的任务,如网页浏览、数据处理、文件管理等,无需编写复杂代码 。 910 项目框架# AI桌面代理# Bytebot# 自然语言自动化
AniPortrait AniPortrait 是腾讯游戏智迹团队开发的一款创新的音频驱动肖像动画生成框架,能够通过音频和参考肖像图像生成高质量的动态视频。 910 项目框架# AI动画生成# AniPortrait# 音频驱动肖像动画
Parlant Parlant 是由 emcie-co 团队开发的一款开源的 LLM(大型语言模型)智能体框架,旨在解决传统 AI 代理在实际应用中行为不可预测、难以控制的核心问题。 840 项目框架# AI代理框架# Parlant# 可解释AI
DreamTalk DreamTalk是一个基于扩散模型的音频驱动表达性头部生成框架,核心功能是将静态人物照片转化为逼真、富有表现力的说话视频。 840 项目框架# DreamTalk# 开源AI项目# 扩散模型
500-AI-Agents-Projects AI Agent案例集合。收录了 500 多个 AI Agent 项目和应用案例,涵盖医疗、金融、教育、零售等多个行业,每个案例都配有详细说明和开源代码链接,便于开发者参考和学习 。 760 项目框架# AI智能体# 开源项目# 行业应用案例
OmniHuman OmniHuman 是字节跳动研发的多模态数字人生成模型,能够同时接受文本、图像、音频和姿态等多种条件,实现从单张照片生成全身动态视频的功能。 650 项目框架# AI数字人# OmniHuman# 全身视频合成
TradingAgents 一个开源的多智能体交易框架,旨在模拟真实世界交易公司的动态,通过多个专业智能体(如基本面分析师、情绪分析师、技术分析师等)协同工作,评估市场条件并做出交易决策。 610 项目框架# TradingAgents# 多智能体交易系统# 金融AI框架
SQLBot 一款基于大语言模型和 RAG(检索增强生成)的智能问数系统。借助 SQLBot,用户可以实现数据的即问即答,快速提炼获取所需的数据信息及可视化图表,并且支持进一步开展智能分析。 610 项目框架# RAG# SQLBot# 数据可视化
TradingAgents-CN TradingAgents-CN 是一个基于多智能体大语言模型的中文金融交易决策框架,专为中文用户优化,提供完整的A股、港股、美股分析能力。 610 项目框架# TradingAgents-CN# 中文金融分析# 多智能体交易系统
Windows‑Use Windows-Use 是一个开源工具,旨在桥接AI智能体(如大型语言模型)与Windows操作系统,实现无需人工干预的自动化操作。 570 项目框架# LLM操作系统控制# Windows自动化# 开源UI自动化