使用 Fon 进行语音识别 - 实时提取和匹配单词模式
截图
Fon 是一款屡获殊荣的分析软件,全球数以万计的语言专家使用它来识别语言之间的模式和关系。 Fon 为用户提供了创建和存储自定义频谱图可视化或基于大量输入字段生成新的自定义可视化的机会。这些工具通过允许他们检查单词、声音和含义之间的关系,彻底改变了语言研究人员分析语言的方式。这种能力使语言学家前所未有地接触到语言的结构。 Fon 允许用户指定单词出现的时间点数量,并自动创建带有相关标签的频谱。用户还可以选择他们感兴趣的关系类型(例如,绝对或相对)并浏览频谱图以确定单词形状的概率分布、在词汇表中的位置以及它在短语中出现的形状。
除了提供高质量的语音模式可视化,Fon 还为用户提供了强大的语音分析能力。 Fon 等语音识别工具为识别语音模式和关系提供了一种富有表现力和精确的方法,它为语音识别研究提供了一个强大的平台。已经使用 Fon 开发了几种语音识别模型。由于全球数千名语言学家的努力,Fon 项目取得了巨大的发展。
Fon 提供每天扫描数千亿个短语的功能。这一突破背后的技术是基于提取和识别方法。当用户在文本框中键入文本时,Praat 的语音识别引擎会快速扫描文本并查找语法正确但拼写错误或看起来写得不好的单词。然后将提取的单词输入语音识别神经网络 (RNN),该网络指的是一对预训练的卷积神经网络 (CNN),以在提取的短语中找到相似之处并创建强关联。