欢乐马是什么东西?哪个公司开发的?阿里“黑马”屠榜之谜深度拆解
“欢乐马”(Happy Horse)是阿里巴巴旗下ATH事业群研发的一款AI视频生成大模型,以150亿参数的原生音视频联合生成能力,在4月初以匿名身份空降全球权威盲测榜单并登顶榜首,一举超越字节跳动的Seedance 2.0和快手的可灵3.0。
本文大纲
- 👉 一、欢乐马是什么?——一款‘音画同步’的AI视频模型
- 👉 二、哪个公司开发的?——阿里内部‘赛马’跑出的黑马
- 👉 三、为什么火?——匿名屠榜与‘三无’产品的逆袭
- 👉 四、核心亮点:统一架构带来的音画革命
- 👉 五、关键人物:‘可灵之父’张迪的回归之作
- 👉 六、什么时候能用上?——内测与API开放时间线
- 👉 总结
图源:AI生成示意图一、欢乐马是什么?——一款“音画同步”的AI视频模型
欢乐马(Happy Horse)是一款能够直接生成带同步音频的AI视频模型。传统的AI视频生成流程通常是‘先生成无声视频,再单独配音,再做口型对齐’,工序繁琐且容易出错。欢乐马的核心突破在于:它用一个统一的Transformer模型,一次性把视频画面、人物口型、环境音效和背景音乐全都算出来,端到端输出成片。
具体技术指标如下:
- 参数规模:150亿参数,采用40层统一自注意力Transformer架构。
- 生成速度:在单张NVIDIA H100显卡上,生成一段5秒1080p视频仅需约38秒。
- 多语言支持:原生支持英语、普通话、粤语、日语、韩语、德语、法语七种语言的唇形同步,词错误率在同类开源模型中最低。
图源:AI生成示意图二、哪个公司开发的?——阿里内部“赛马”跑出的黑马
欢乐马是阿里巴巴研发的,这一点已在4月10日由阿里官方正式确认。
它的出身经历了一次组织架构的变迁:欢乐马最初由阿里旗下淘天集团未来生活实验室团队打造,由快手前副总裁、可灵AI技术负责人张迪领衔。随后,该实验室从淘天集团分拆,划归到阿里新成立的ATH(Alibaba Token Hub)事业群旗下的AI创新事业部。
值得注意的是,阿里内部在视频模型赛道上不止一条线。通义万相归通义大模型事业部做底层模型研发,而欢乐马来自AI创新事业部,更靠近场景创新,带有一定的‘内部赛马’性质。欢乐马的横空出世,标志着阿里在视频大模型赛道上已不再只是‘陪跑者’。
图源:AI生成示意图三、为什么火?——匿名屠榜与“三无”产品的逆袭
欢乐马的走红方式非常‘反常规’。它没有预告、没有论文、没有官方账号,以一个‘三无’产品的姿态,突然出现在全球权威AI盲测平台Artificial Analysis的Video Arena榜单上。
在短短48小时内,它在文生视频和图生视频两大赛道双双登顶:
- 文生视频(无音频)赛道:Elo得分1378分,领先第二名字节跳动Seedance 2.0整整105分。
- 图生视频(无音频)赛道:Elo得分1411分,刷新该平台历史最高纪录。
- 带音频赛道:与Seedance 2.0分差仅1-2分,几乎并驾齐驱。
盲测意味着参与评分的用户不知道视频由哪个模型生成,完全基于画面质量投票。这种匿名方式规避了品牌光环对判断的干扰,让评测结果更具说服力。
图源:AI生成示意图四、核心亮点:统一架构带来的音画革命
欢乐马在技术架构上走了一条与众不同的‘极简路线’:
1. 单流Transformer统一建模。大多数视频模型采用‘视频生成+音频后处理’的拼接方案,而欢乐马采用了纯自注意力Transformer架构,没有交叉注意力,没有独立的音频分支。它把文本、视频和音频的所有token拼成同一个序列,让模型自己学会跨模态对齐。
2. 端到端音视频联合生成。这种架构带来的直接好处是:音效、背景音乐、人物口型全是模型一次性算出来的,不存在‘音画不同步’的尴尬,不需要后期拼接。
3. 推理速度优化。采用DMD-2蒸馏技术将去噪步数压缩到8步,再配合编译加速,单张H100上生成1080p视频只需约38秒,256p预览版本约2秒即可完成。
五、关键人物:“可灵之父”张迪的回归之作
欢乐马背后有一位‘王牌主将’——张迪。
张迪的履历非常‘传奇’:他2010年加入阿里,曾任阿里妈妈大数据与机器学习工程架构负责人;2020年跳槽快手,2024年以‘技术一号位’身份牵头研发了快手可灵AI(Kling)的全链路,被业界称为‘可灵之父’。
2025年11月,张迪重返阿里巴巴,出任淘天集团未来生活实验室负责人,向阿里巴巴副总裁郑波汇报。仅用了大约五个月,他就带着团队拿出了欢乐马1.0。
六、什么时候能用上?——内测与API开放时间线
欢乐马目前正处于内测阶段,尚未对公众完全开放。获取方式与时间线如下:
- 4月10日:阿里官方认领欢乐马,开通官方微博 @HappyHorse_AI
- 4月中旬(预计下周):上架阿里云百炼MaaS平台(bailian.console.aliyun.com),以白名单制有限开放API接口,名额非常有限。
- 4月30日:API接口正式对外开放,全面商用。
🚨 提醒:欢乐马目前没有官方网站,网上流传的‘官网’均非官方渠道。唯一可信的官方信息发布渠道是微博 @HappyHorse_AI。
总结
欢乐马是阿里ATH创新事业部研发的一款150亿参数AI视频生成模型,以‘统一自注意力Transformer架构’实现原生音视频联合生成,在盲测榜单上以压倒性分数登顶。它由‘可灵之父’张迪带队打造,是阿里在视频模型赛道上的‘内部赛马’产物,目前处于内测阶段,预计4月中旬上架百炼平台白名单内测,4月30日API正式开放。
如果你想把欢乐马类似的视频生成能力集成到自动化工作流中——从脚本撰写到画面生成再到后期分发——可以了解一下「实在Agent」。它能把模型调用、流程编排和数据流转串成一条线,让AI视频创作从手动敲命令变成可配置、可复用的生产力流水线。
Hermesagent跟openclaw哪个更适合本地模型?从架构到体验的全维度对比
Hermes Agent飞书配置对接步骤,完整实践指南
同事.skill github地址是什么?源头、衍生项目与生态入口

