AnchorCrafter 是由中国科学院计算技术研究所与腾讯联合研发的 AI 虚拟主播视频生成系统。该系统基于扩散模型，专注于自动生成高保真度的主播风格产品推广视频，通过整合 人-物交互 技术，实现了对商品外观与运动轨迹的精细控制，为电商带货场景提供高效、自然的视频制作方案。

核心功能

高保真人-物交互: 支持从基础持握到语义理解的动作生成，如电动牙刷自动演示刷牙、香水自动喷洒，交互动作自然且符合物理逻辑。
多角度外观保持: 在视频中保持商品不同视角下的外观一致性，消除变形与闪烁，确保产品细节真实可信。
运动轨迹控制: 精确管理主播与商品的运动轨迹，包括手部遮挡等复杂场景，画面连贯流畅。
30fps 流畅输出: 生成视频达到 30 帧/秒的流畅度，主播表情与动作自然，接近真人直播效果。
HOI-Adapter 模块: 采用改进的 UNet 架构与变分自编码器，配合多视角特征融合技术，有效管理复杂的人物-物体交互。

适用人群

AnchorCrafter 主要面向电商运营人员、直播带货团队、内容创作者以及数字人技术研究者。典型场景包括：快速生成商品推广视频，无需搭建实拍直播间；为虚拟主播设计交互式产品演示；在 A/B 测试中生成多个版本带货视频以优化转化率；以及面向学术研究领域的二次开发与模型优化。开源特性使其尤其适合技术团队进行定制化部署。

作为中科院与腾讯联合推出的开源项目，AnchorCrafter 在 AI 虚拟主播领域展现出突出的技术优势。其核心的 HOI-Adapter 组件解决了以往视频生成中物体与手部交互不自然的难题，在 GitHub 上获得了广泛关注。与 MuseTalk、EchoMimi 等数字人项目相比，AnchorCrafter 更专注于带货场景下的物体交互细节，具备更高的实用价值。项目代码完全开源，支持开发者自行部署和定制，无需额外付费。

Anchorcrafter

核心功能

适用人群

0 个评论