测试结果

1.开源数据

100条数据堂电话语音数据上平均字错率0.02,句错率0.06 详细见./test_result/recongnnize_result.txt

列举几个准确率(1-编辑距离)不等于1的case,可以看到语言模型真正起到了纠错的作用。

语音 label predict acc
G2425/session01/T0055G2425S0213.wav 我不是发给你了 我不是发给你了 0.875
G1978/session01/T0055G1978S0487.wav 有什么服务价格多少 那里有什么服务价格多少 0.90909091
G2863/session01/T0055G2863S0065.wav 周末大扫除没空 周末大扫除没空 0.875
G1940/session01/T0055G1940S0496.wav 那你也不我说一声 那你也不我说一声 0.88888889

2.垂直领域效果

贴上自己录音的识别效果:

results matching ""

    No results matching ""