【基金支持】“网易见外”语音转文字质量评估研究

教育研究前沿进展

第2卷, 第2期, 第19-29页,发布日期:2022-10-08
DOI: https://doi.org/10.55375/jerp.2022.2.10

在线阅读

文章下载

作者
黄旦华(浙江越秀外国语学院)
文章摘要 随着计算机技术和人工智能的发展,语音转文字的识别质量得到极大的提高,也被广泛的应用于商业、教育、和翻译等领域。本文以西班牙学者罗梅罗--弗雷斯科(Pablo Romero-Fresco)等人提出的“NER模型”为基础,采用“NR模型”,以TED的演讲为素材,使用“网易见外”将其转换为文字,通过详细分析4种错误类别,3个级别的错误,最终计算出语音转写的准确率—这也是评估语音转文字质量的重要标准。结果显示,语音识别虽然识别准确率达到了98%,但还是存在不同类型的错误,后期需要人工积极干预才能取得满意的结果。研究结果还表明,“网易见外”在断句的准确性、识别单词的准确性方面还有较大的改进空间。
关键词 语音转文字,“NER模型”,“NR模型”,准确率
引用 黄旦华(2022).“网易见外”语音转文字质量评估研究. 教育研究前沿进展,第2卷, 第2期, 19-29.