OmniHuman OmniHuman 是字节跳动研发的多模态数字人生成模型,能够同时接受文本、图像、音频和姿态等多种条件,实现从单张照片生成全身动态视频的功能。 650 项目框架# AI数字人# OmniHuman# 全身视频合成
EchoMimic EchoMimic 是蚂蚁集团开发的一款基于音频驱动的肖像动画生成工具,旨在通过音频和面部标志点生成逼真的动态视频。 3760 AI大模型# EchoMimic# 开源AI工具# 数字人生成
Hallo Hallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。 430 AI大模型# 人脸动画生成# 开源视觉合成# 音频驱动动画
MuseTalk MuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。 410 AI大模型# MuseTalk# 唇形同步# 数字人视频生成