测试结果
1.开源数据
100条数据堂电话语音数据上平均字错率0.02,句错率0.06 详细见./test_result/recongnnize_result.txt
列举几个准确率(1-编辑距离)不等于1的case,可以看到语言模型真正起到了纠错的作用。
语音 | label | predict | acc |
---|---|---|---|
G2425/session01/T0055G2425S0213.wav | 我不是发给你了么 | 我不是发给你了吗 | 0.875 |
G1978/session01/T0055G1978S0487.wav | 你那有什么服务价格多少 | 你那里有什么服务价格多少 | 0.90909091 |
G2863/session01/T0055G2863S0065.wav | 周末大扫除没空啊 | 周末大扫除没空 | 0.875 |
G1940/session01/T0055G1940S0496.wav | 那你也不给我说一声 | 那你也不跟我说一声 | 0.88888889 |
2.垂直领域效果
贴上自己录音的识别效果: