VASA-1
微软亚洲研究院开发的一款革命性的 AI 模型,能够将静态照片和音频文件结合生成逼真的说话视频
专注于语言模型(LLM)SQL 能力评测的专业平台,构建了全面且具实践价值的 SQL 能力排行榜(SCALE),为开发者、数据库管理员及企业技术决策者提供关键参考
sql-llm-benchmark 是一个专注于评估大语言模型(LLM)在 SQL 相关任务中表现的开源测评框架,同时提供公开的排行榜与详细分析报告。该平台围绕 SQL 理解、方言转换和 SQL 优化三大核心能力,构建了一套结构化、可复现的评测体系,适用于数据库工具开发、模型选型及技术研究等场景。
sql-llm-benchmark官网入口网址:https://sql-llm-leaderboard.com
系统采用模块化设计,支持灵活接入多种大语言模型作为被测对象或裁判模型,并允许用户自定义测试数据集以适配特定需求。为提升评估准确性,裁判机制集成了 MCP(Model Context Protocol)网络搜索功能,使其能够在判断过程中实时参考数据库官方文档与行业最佳实践。
该平台由 ActionTech 团队发起并维护,已在 GitHub 开源。其评测结果可为数据库工程师、AI 应用开发者及技术决策者提供可靠的模型能力参考,助力在实际业务中选择适合的 LLM 解决方案。千流导航 收录此项目,供关注数据库与大模型融合应用的专业用户查阅使用。