Telegram 使用语音转文字功能,识别准确率受哪些因素影响?
1 个回答
语音转文字其实挺难的,不是你一说话,它就能听懂,识别准确率受很多因素影响。
第一,声音太小或者背景太吵,比如你在地铁里录音,那机器听着就容易晕头转向。
第二,语速太快,嘴巴像机关枪一样哒哒哒,AI也反应不过来。
第三,口音太重,比如你用方言讲普通话,系统可能一脸懵逼。
第四,语音质量差,手机麦克风不好,或者录音断断续续,识别也会出错。
第五,生僻词、专业术语这些,普通模型压根没学过,就容易翻车。
所以听不清或转错字,大多数是以上原因造成的。如果想提高准确率,尽量选择安静环境,语速适中,发音清晰一些就行,效果会好很多。