PaddleSpeech

126 0 0

百度飞桨（PaddlePaddle）平台上的一个开源语音处理工具包，旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。

收录时间：

2025-04-27

打开网站手机查看

PaddleSpeech

打开网站

PaddleSpeech 是基于 PaddlePaddle 深度学习框架构建的开源语音与音频处理工具包，面向语音识别、语音合成、语音翻译、音频分类及声纹识别等核心任务提供完整支持。该工具包集成了多种主流模型与常用数据集（如 LibriSpeech、LJSpeech），兼顾训练、推理、测试与部署全流程，适用于学术研究与工业应用。

PaddleSpeech官网入口网址：https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/README_cn.md

项目对中文语音处理具有良好支持，涵盖中文前端文本分析、语音转文本、文本转语音等关键环节，并兼容多语言场景。借助自监督学习（Speech SSL）技术，PaddleSpeech 能在大规模无标注语音数据上预训练声学表示模型，为下游任务提供高质量初始化参数。

用户可通过 pip 或 Docker 快速安装，利用命令行工具或 Python API 调用各项功能，实现一行命令启动语音服务。配套文档详尽，包含使用教程、模型说明及相关研究论文，便于开发者快速上手与深度定制。

PaddleSpeech

相关导航

TTSMaker马克配音

DreamTalk

Kotaemon

SQLBot

Unstract

UI-TARS

Xinference

Parlant