AnchorCrafter 是由中国科学院与腾讯联合研发的开源 AI 虚拟主播视频生成技术。该系统基于扩散模型,专为自动生成高保真度的主播风格产品推广视频而设计。通过整合人‑物交互(HOI)技术,AnchorCrafter 实现了对商品外观和运动轨迹的精确控制,同时能够处理复杂的人物‑物体交互场景,输出 30fps 流畅、表情动作自然的带货视频,为电商内容生产提供了全新的效率工具。
核心功能
- 高保真人物‑物体交互:支持从基础持握到语义理解的多种交互场景。例如电动牙刷可自动演示刷牙动作,香水瓶可模拟喷洒过程,使产品展示具备真实的“带货感”。
- 多角度外观保持与运动控制:在视频生成过程中能稳定维持商品的多角度外观一致性,同时精确控制物体的运动轨迹,保证展示效果的可信度。
- 自然表情与动作生成:输出 30fps 流畅视频,主播的表情和肢体动作高度自然,手部遮挡等细节处理几乎无破绽,有效增强视频的真实感。
- 扩散模型架构优化:采用改进的 UNet 架构与变分自编码器,结合多视角特征融合技术,有效管理复杂的人物‑物体关系,降低生成视频中的 artifacts。
- 开源可定制:项目代码与模型权重公开,支持开发者根据自身场景微调,适用于电商直播、广告投放、社交媒体内容等多种带货视频制作需求。
适用人群
AnchorCrafter 面向电商卖家、品牌方、内容创作者以及 MCN 机构,尤其适合需要高频、低成本制作高质量产品推广视频的场景。典型应用包括:在商品详情页嵌入虚拟主播演示、生成社交媒体短视频广告、批量产出多 SKU 的解说视频,以及为直播提供预录素材。对于缺乏专业拍摄团队或真人主播的团队,AnchorCrafter 提供了一种即开即用的 AI 视频生成方案。
作为中科院与腾讯联合推出的开源项目,AnchorCrafter 在学术界和工业界均获得广泛关注。其核心优势在于将人‑物交互能力深度融入视频生成流程,解决了以往 AI 数字人难以自然操控商品的技术瓶颈。项目完全开源,无商业授权限制,技术团队持续更新模型与文档。相较于市面上同类 AI 主播工具,AnchorCrafter 在运动轨迹控制、多视角一致性以及交互自然度方面表现突出,且无需额外硬件即可本地部署。目前项目社区活跃,已有多家企业将其集成至自有内容生产管线中。