音频驱动动画

共 4 篇网址

排序

发布更新浏览点赞

OmniHuman

OmniHuman 是字节跳动研发的多模态数字人生成模型，能够同时接受文本、图像、音频和姿态等多种条件，实现从单张照片生成全身动态视频的功能。

3610

项目框架 # AI数字人 # OmniHuman # 全身视频合成

EchoMimic

EchoMimic 是蚂蚁集团开发的一款基于音频驱动的肖像动画生成工具，旨在通过音频和面部标志点生成逼真的动态视频。

4590

AI大模型 # EchoMimic # 开源AI工具 # 数字人生成

Hallo

Hallo 是一个由复旦大学（Fudan University）开发的开源项目，专注于音频驱动的视觉合成技术，特别是用于人像动画生成。

1290

AI大模型 # 人脸动画生成 # 开源视觉合成 # 音频驱动动画

MuseTalk

MuseTalk 是一个实时高质量音频驱动唇形同步模型，旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战，尤其适用于实时应用如直播视频。

1510

AI大模型 # MuseTalk # 唇形同步 # 数字人视频生成