在测试语音识别的过程中,衡量识别内容的准确性,一般通过如下指标进行评估
WER(WordErrorRate,词错率)
定义:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER
WER=(S+D+I)/N
S:substitution,替换
D:Deletion,删除
I:Insertion,插入
N:标准词序列中词的总个数
(S+D+I)=识别出来的词序列与标准的词序列之间的编辑距离
注意:因为有插入词(Insertion),所以可能会出现WER>1的情况,不过,WER>1时,表明识别出来的词序列和标准的词序列相差很大,识别效果特别差
SER(SentenceErrorRate,句错率)
定义:句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的个数,除以总的句子个数即为SER
SER=SE/N
SE:识别出来的序列中,识别错误的句子个数(即WER!=0的句子个数)
N:标准序列中总句子个数
(2)、验证识别内容的准确性
统计识别文字的WER、SER指标
(3)、关注语音识别耗时
①短语音的识别耗时
②长语音的识别耗时
更多详情可联系365备用网站技术工作人员:Benson
手机/Mob:(+86)13632500972
邮箱/E-mail:marketing@tamilfolksongs.com