试了100天AI语音输入法,最后我还是用回闪电说
Typeless 独一档90分,除了贵其他都很棒
豆包顺手做了语音输入,路径太长,试过很多邪修手段只会更复杂
智谱没用心做产品,有些点子,勉强能用
闪电说,效果很棒吗也没有,离线很刚需吗不存在的。但他很专很稳,用的asr还是24年的版本,我发现最新模型效果更棒,给产品反馈才知道他们已经在调教测试了,但效果没有质变故而迟迟未发布
我的观点是,
大厂几乎都是 60/70 分的产品矩阵,然后垂直生态里肯定会有一个 90 分的付费产品和一个 80 分的免费/开源项目
闪电说正好是后者。
今天突然发现AI用习惯之后,错字错句都多了~ 但AI都能理解,下意识就没去纠正
比如这句“wow 我早上刚发现z合格,默认用的flash”,这个【z合格】是啥 随机问了身旁的人,完全看不懂。但让AI纠正,他能还原出来是【这个】,因为拼音都是 zhege 结合上文续写
在语音输入场景,现有方案都是asr先语音转文字再来一个llm纠错润色
那么,ASR、LLM能否像SOC一样原生集成呢?原来Qwen和DeepSeek 已经在探索了,未来可期?