商汤商量拟人大模型 一款基于先进人工智能技术开发的对话型AI工具,旨在通过高度拟人化的交互体验,为用户提供丰富的情感陪伴、角色互动和多场景应用能力 1290 AI大模型# AI角色对话# 商汤商量拟人大模型# 虚拟人定制
LMArena 一个与人工智能(AI)模型评估和比较相关的平台,其核心功能是通过用户投票和社区参与的方式,对大型语言模型(LLM)进行评测和排名。 1190 AI大模型# AI模型比较# Elo评分# LMArena
IndexTTS2 IndexTTS2 是一个突破性的自回归语音合成模型,旨在解决大规模文本到语音(TTS)系统在精确时长控制和情感表达方面的挑战。 1170 AI大模型# IndexTTS2# 情感语音合成# 文本到语音
BuboGPT BuboGPT是字节跳动推出的一款多模态大语言模型(LLM),能够处理文本、图像和音频等多种输入模态,并具备对齐和非对齐理解的能力。 1000 AI大模型# BuboGPT# 图像音频文本理解# 多模态大模型
Veo3 Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。 880 AI大模型# Google DeepMind# Veo3# 视频生成模型
Qwen-Image Qwen-Image 是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型,采用MMDiT架构,专为复杂文本渲染与高精度图像生成设计。 790 AI大模型# Qwen-Image# 图像生成模型# 文本渲染
VideoPoet VideoPoet模型能够处理多种输入类型,包括图像、视频、文本和音频,并支持多种视频生成任务,如文本到视频、图像到视频、视频风格化、视频修复、视频扩展以及视频转音频等。 760 AI大模型# AI视频生成# VideoPoet# 多模态模型
Seedance 字节跳动开发的AI视频生成模型,模型能够根据文本或图像生成高质量的视频内容,支持多镜头切换、稳定运动轨迹和风格化控制,适用于创意内容创作、广告制作和教育演示等场景。 660 AI大模型# AI视频生成# Seedance# 文本生成视频
AI Ping AI Ping是面向大模型使用者,提供全面、客观、真实的大模型服务评测与信息汇总平台。提供长周期、高频率、多时段评测数据,助力您高效完成大模型服务的选型与供应商评估 590 AI大模型编程工具# API统一调用# 大模型评测# 智能路由
Moondream Moondream 是一个开源的轻量级视觉语言模型,由开发者 vikhyatk 推出,旨在提供高效、灵活的图像理解和文本生成能力。 480 AI大模型# Moondream# 开源AI# 视觉语言模型
SadTalker SadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。 470 AI大模型# AI说话头像# SadTalker# 开源数字人