整个产品使用下来,是真的感觉对于提升效率有一定的帮助。基本上它可以把用户个人的语音说话内容,转成书面的文字,并且会做一些格式化的呈现,比如说加序号,或者说加粗等。
从准确率方面来说,识别的准确率相对比较高。性能上会稍微有一些延迟,感觉不是那么快,但是是一个可接受的区间。
使用这个产品久了,感觉还会带来一个好处,它会锻炼人直接说话,会让人的表达能力会更强。
但感觉是否还可以从以下几点做一些优化:
1. 从输出往文字转化时,中间会间隔5到10秒。这5到10秒是不是可以有一个提示,目前的话只是在最下面有个提示。
2. 在信号不好或网络不好的情况下,它会直接丢失识别内容。看是不是可以,哪怕信号不好,也用本地资源做一些准确率不是那么高的识别,或者做一些内存处理,等网络好了之后再处理。这样是不是会比当前的处理方式好一些。
3. 希望尽快提供整个界面的中文版。