AnchorCrafter 是由中国科学院与腾讯联合研发的开源 AI 虚拟主播视频生成技术。该系统基于扩散模型，专为自动生成高保真度的主播风格产品推广视频而设计。通过整合人‑物交互（HOI）技术，AnchorCrafter 实现了对商品外观和运动轨迹的精确控制，同时能够处理复杂的人物‑物体交互场景，输出 30fps 流畅、表情动作自然的带货视频，为电商内容生产提供了全新的效率工具。

核心功能

高保真人物‑物体交互：支持从基础持握到语义理解的多种交互场景。例如电动牙刷可自动演示刷牙动作，香水瓶可模拟喷洒过程，使产品展示具备真实的“带货感”。
多角度外观保持与运动控制：在视频生成过程中能稳定维持商品的多角度外观一致性，同时精确控制物体的运动轨迹，保证展示效果的可信度。
自然表情与动作生成：输出 30fps 流畅视频，主播的表情和肢体动作高度自然，手部遮挡等细节处理几乎无破绽，有效增强视频的真实感。
扩散模型架构优化：采用改进的 UNet 架构与变分自编码器，结合多视角特征融合技术，有效管理复杂的人物‑物体关系，降低生成视频中的 artifacts。
开源可定制：项目代码与模型权重公开，支持开发者根据自身场景微调，适用于电商直播、广告投放、社交媒体内容等多种带货视频制作需求。

适用人群

AnchorCrafter 面向电商卖家、品牌方、内容创作者以及 MCN 机构，尤其适合需要高频、低成本制作高质量产品推广视频的场景。典型应用包括：在商品详情页嵌入虚拟主播演示、生成社交媒体短视频广告、批量产出多 SKU 的解说视频，以及为直播提供预录素材。对于缺乏专业拍摄团队或真人主播的团队，AnchorCrafter 提供了一种即开即用的 AI 视频生成方案。

作为中科院与腾讯联合推出的开源项目，AnchorCrafter 在学术界和工业界均获得广泛关注。其核心优势在于将人‑物交互能力深度融入视频生成流程，解决了以往 AI 数字人难以自然操控商品的技术瓶颈。项目完全开源，无商业授权限制，技术团队持续更新模型与文档。相较于市面上同类 AI 主播工具，AnchorCrafter 在运动轨迹控制、多视角一致性以及交互自然度方面表现突出，且无需额外硬件即可本地部署。目前项目社区活跃，已有多家企业将其集成至自有内容生产管线中。

Anchorcrafter官网

核心功能

适用人群

0 个评论