阿里巴巴发布HappyHorse 1.0视频生成模型:支持多模态生成、高真实感人物渲染与多语种短剧创作
SmartHey4月27日消息,由阿里巴巴ATH团队研发的HappyHorse 1.0视频生成模型及一站式AI创作平台,现已正式开启灰度测试。
HappyHorse 1.0采用原生多模态架构与音视频协同生成技术,面向广告营销、电商推广、微短剧制作、社交媒体创意等高频需求场景,提供“从零生成”到“智能编辑”的全流程视频创作能力。其在画面质感、运镜表现、人物真实感及提示词可控性等关键维度,已展现出显著的行业竞争力。
目前,HappyHorse 1.0聚焦两大核心能力:多模态视频生成与AI视频编辑。既支持文本/图像直接生成高质量短视频,也支持对已有视频进行风格迁移、镜头重组、细节增强等深度创意延展。
作为AI视频领域的新锐力量,HappyHorse在光影还原、动态运镜、人物建模等方面表现突出——无论是细腻的皮肤纹理、飘动的发丝,还是金属反光、烟雾弥散等复杂自然元素,均能呈现高度拟真的视觉效果,成片精细度与电影级质感多次获创作者好评。
模型在镜头语言理解与执行上同样成熟:支持推拉摇移、景深变化、焦点转移等多种专业运镜方式,转场自然流畅,色调与环境响应精准,能高度遵循用户输入的prompt指令,实现导演级叙事控制。
在人物面部建模方面,HappyHorse取得关键突破——五官比例协调、轮廓过渡柔和、表情丰富自然,显著弱化了AI视频常见的“塑料感”与“僵硬感”,已在真人短剧、口播类内容、社媒人设视频等人物密集型场景中验证实效。
针对电商内容生产,HappyHorse在图生视频(I2V)任务中展现出优异的构图还原度与材质表现力,尤其适合产品特写、场景化展示等高转化素材批量生成。
在口播类应用中,人物形象稳定、口型同步准确、构图专业、指令响应率高,广泛适用于品牌广告、知识类Vlog、直播预告及电商创意脚本等细分场景。
HappyHorse还擅长打造高传播效率的短视频内容:从新品种草、品牌故事演绎、热点事件借势,到达人混剪再创作,均可快速输出画面精良、节奏紧凑、情绪饱满的成片,有效降低专业内容门槛,提升创作者的内容生产力与平台分发效率。
海外实测反馈显示,该模型在真人剧面部质感、微表情自然度、空镜氛围营造及慢动作光影层次等方面均获积极评价,初步具备支撑全球化多语种内容生产的底层能力。
目前,专业创作者与企业客户可通过HappyHorse官网及阿里云百炼平台注册使用;大众用户可在通义千问App体验。官网提供720P视频生成服务,刊例价为0.9元/秒。
用户只需将通义千问App升级至最新版本,点击首页底部“HappyHorse”入口,即可即时体验。作为阿里巴巴全新发布的多模态视频基座模型,HappyHorse 1.0支持15秒内多镜头叙事、横竖屏自适应画幅、1080P超分输出,720P生成成本低至0.44元/秒。
值得一提的是,千问App内已开放粤语、英语、法语、韩语等多语种剧情短片生成能力,助力创作者高效产出本地化、跨文化短视频内容。
