还是有之前的教学视频里,后面跟着的练习题跟题目的关联度并不是很高,和没有针对错题指出正确答案的解析的问题。题目跟视频的关联度实在太差了,但将 AI 实时辅导学习体验,去生成带有视觉效果和旁白的教学短视频的idea还是不错的,能跟秘塔AI的今天学点啥做一下不同语言上的补充,期待考虑引入错题专属讲解机制
可根据用户问题生成动画式、语音引导的学习视频。...
VideoTutor 是一款由斯坦福大学校友团队开发的创新型 AI 教育平台,专注于为 K-12 教育阶段的学生生成个性化的动画教学视频。
评价:略微无聊的一些AI课程视频,生成的视频时长有限,内容没有很生动,适合人群:对文字阅读吃力、适合听内容的群体,这样时长和质量的视频,价格收费略贵,可取代性高(找其他学术性较高的AI检索生成文字同样可以取代)
个人分析:
为什么我们要使用AI教学?因为开发企业想用一种成本低于聘请教师的方式传播知识,使用者想用一种高效的方式吸取知识
非AI教学的优势:
1.教师上课生动,可以暂停提问
2.教师上课可以传播互联网、书面纸质没有的经验知识和感受
3.教师上课可以监督自律较低的学生
非AI教学的劣势:
1.教师水平层次不齐、性格层次不齐,短时间内无法确认
2.教师的工作效率不及AI
3.聘请大量教师的成本高
4.教师的变量多于系统
我认为需要从这些角度再去考虑一下这个软件想要服务的用户群体是怎么样的、想弥补非AI教学的哪些部分(注:该模型目前的水平无法弥补非AI教学所有的劣势,所以找准想服务的用户比较重要)、各国家各地区使用者的学习习惯和教学模式(是否需要在设计时要考虑到各国的情况,还是专注于美国地区)
【产品描述】
用户用自然语言输入知识点/题目,产品生成视频讲解,包含语音讲解,数形结合的图片和动画,文字部分等。视频生成完成后,会附带生成3道课后测试题。
产品定位出海,主要专注于数学、STEM等学科,目前不支持国内邮箱注册。
目前定价4美元/3个视频,每个视频时长大约在1min30s-2min之间。
【功能实现推测】
目前生成的视频均为左字右图/视频,图/视频部分多为学科图形(如坐标轴/运动曲线等)。
文字部分:推测由一个规模较小的模型生成
图像/视频部分:推测首先由一个模型生成数据或数学描述,然后由一个微调后的视频模型生成数学图像/动画等动态部分(图像风格不像是通过代码生成的),有可能是GPT-4o。
接下来将文本和图像两部分拼接起来形成视频,视频风格更像是动画PPT。
人声部分:与文字和图像搭配效果很好,没有出现错误的地方,推测视频左侧文字部分为人声文本的上文prompt,两者先后生成,但不能判断是否为同一模型生成。
推测存在一个中枢推理模型用于控制视频部分的时长,与人声语音时长相匹配。
【测试问题】
有时会出现公式渲染错误,缺失声音的情况。
效果不稳定,有时候水平足以达到真人网课水平,更多的时候都比较普通,目前水平更适合初中、小学等早教视频生成,无法满足高中、大学的教学需求。
【总结】
产品效果较为优秀但不惊艳:右侧组件生成稳定性非常强。
推测产品为较为机械的工作流,端到端程度低,美观化程度依赖视频结构模板和图像模型。目前视频结构较为死板,固定为左字右图/视频。
在真正讲究效果的高中/大学数形结合领域表现一般,目前仅能用在小学/初中领域,作为教师的信息化KPI,或是娱乐性教育。
【思考】
讲解型视频集中于两个应用场景:
1、非可视化不可的场景:如高中和大学数学,不结合动画很难理解抽象的高维世界
2、网课:网课依赖于授课老师的个人解题技巧、出题方向预判等私有数据,数据难以获取。
其他场景的需求刚性存疑。