AnchorCrafter 是由中国科学院计算技术研究所与腾讯联合研发的 AI 虚拟主播视频生成系统。该系统基于扩散模型,专注于自动生成高保真度的主播风格产品推广视频,通过整合 人-物交互 技术,实现了对商品外观与运动轨迹的精细控制,为电商带货场景提供高效、自然的视频制作方案。
核心功能
- 高保真人-物交互: 支持从基础持握到语义理解的动作生成,如电动牙刷自动演示刷牙、香水自动喷洒,交互动作自然且符合物理逻辑。
- 多角度外观保持: 在视频中保持商品不同视角下的外观一致性,消除变形与闪烁,确保产品细节真实可信。
- 运动轨迹控制: 精确管理主播与商品的运动轨迹,包括手部遮挡等复杂场景,画面连贯流畅。
- 30fps 流畅输出: 生成视频达到 30 帧/秒的流畅度,主播表情与动作自然,接近真人直播效果。
- HOI-Adapter 模块: 采用改进的 UNet 架构与变分自编码器,配合多视角特征融合技术,有效管理复杂的人物-物体交互。
适用人群
AnchorCrafter 主要面向电商运营人员、直播带货团队、内容创作者以及数字人技术研究者。典型场景包括:快速生成商品推广视频,无需搭建实拍直播间;为虚拟主播设计交互式产品演示;在 A/B 测试中生成多个版本带货视频以优化转化率;以及面向学术研究领域的二次开发与模型优化。开源特性使其尤其适合技术团队进行定制化部署。
作为中科院与腾讯联合推出的开源项目,AnchorCrafter 在 AI 虚拟主播领域展现出突出的技术优势。其核心的 HOI-Adapter 组件解决了以往视频生成中物体与手部交互不自然的难题,在 GitHub 上获得了广泛关注。与 MuseTalk、EchoMimi 等数字人项目相比,AnchorCrafter 更专注于带货场景下的物体交互细节,具备更高的实用价值。项目代码完全开源,支持开发者自行部署和定制,无需额外付费。