LlamaIndex 一个用于构建 LLM(大型语言模型)应用的数据框架,提供了一套工具和框架,帮助开发者将私有数据与 LLM 结合使用,以增强知识生成和推理能力。 330 项目框架# LlamaIndex# LLM框架# 向量索引
Video-Analyzer 一个视频分析工具,结合了视觉模型(如Llama的11B视觉模型)和Whisper进行语音识别,通过提取关键帧并进行分析,生成视频内容的描述。 1040 项目框架# Video-Analyzer# 多模态处理# 开源工具
OmniHuman OmniHuman 是字节跳动研发的多模态数字人生成模型,能够同时接受文本、图像、音频和姿态等多种条件,实现从单张照片生成全身动态视频的功能。 650 项目框架# AI数字人# OmniHuman# 全身视频合成
Parlant Parlant 是由 emcie-co 团队开发的一款开源的 LLM(大型语言模型)智能体框架,旨在解决传统 AI 代理在实际应用中行为不可预测、难以控制的核心问题。 840 项目框架# AI代理框架# Parlant# 可解释AI
opencode opencode 是一个专为终端设计的 AI 编程代理(AI coding agent),旨在提供类似 Claude Code 的功能。支持 OpenAI、Google、Anthropic 等模型,甚至本地模型。 990 项目框架# AI编程工具# opencode# 终端开发
Unstract Unstract 是一款基于大语言模型(LLM)打造的无代码平台,专注于非结构化数据提取,旨在通过 LLM 能力消除非结构化数据相关的人工流程 360 项目框架# Unstract# 文档数据提取# 无代码LLM平台
Ant Design X Vue Ant Design X For Vue。基于 RICH 设计范式,打造卓越 AI 界面解决方案,引领智能新体验。 210 项目框架# Ant Design X Vue# Vue AI 组件库# 对话式 UI
Bytebot 一个开源的 AI 桌面代理,旨在通过自然语言指令自动化计算机任务,允许用户通过简单的自然语言命令执行复杂的任务,如网页浏览、数据处理、文件管理等,无需编写复杂代码 。 910 项目框架# AI桌面代理# Bytebot# 自然语言自动化
LangGraph LangGraph 是一个用于构建、管理和部署长运行、有状态代理(agents)的低级编排框架。它被广泛应用于需要构建复杂、可扩展、可持久化代理系统的场景。 470 项目框架# LangGraph# LLM开发# 持久执行
GPT-SoVITS GPT-SoVITS 是一款创新的开源声音克隆工具,它将 GPT 模型与 SoVITS 技术相结合,能够在样本数据极少的情况下,实现高质量的语音克隆和文本到语音转换(TTS)。 400 项目框架# GPT-SoVITS# 语音合成# 语音转换
500-AI-Agents-Projects AI Agent案例集合。收录了 500 多个 AI Agent 项目和应用案例,涵盖医疗、金融、教育、零售等多个行业,每个案例都配有详细说明和开源代码链接,便于开发者参考和学习 。 760 项目框架# AI智能体# 开源项目# 行业应用案例
Shimmy Shimmy 是一款轻量级开源工具,专为本地 AI 推理设计,提供了与 OpenAI API 完全兼容的接口,使开发者能够在本地环境中运行大模型,而无需依赖云端服务。 480 项目框架# 开源工具# 本地AI# 隐私保护
Edge-TTS Edge-TTS 是一个基于微软 Azure 文本转语音(TTS)功能的 Python 库,旨在为开发者提供简单、高效、免费的文本转语音解决方案。 340 项目框架# Edge-TTS# 开源TTS工具# 文本转语音
coze-studio Coze Studio 是由字节跳动开发并开源的一站式 AI Agent 开发工具,旨在为开发者提供从开发到部署的全方位支持,帮助他们快速构建和调试智能体、应用和工作流 。 470 项目框架# AI Agent开发# coze-studio# 低代码平台
AstrBo 易于上手的多平台聊天机器人及开发框架。松耦合 / 异步 / 多消息平台部署 / 易用的插件系统 / 完善的大语言模型(LLM)接入 1780 项目框架# AstrBo# 大语言模型集成# 聊天机器人框架
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 400 项目框架# PaddleSpeech# 文本转语音# 语音识别