Reconnaissance vocale avec Fon - Extraire et faire correspondre des modèles de mots en temps réel
Captures d'écran
Fon est un logiciel d'analyse primé qui a été utilisé par des dizaines de milliers d'experts en langues dans le monde entier pour identifier des modèles et des relations entre les langues. Fon offre aux utilisateurs la possibilité de créer et de stocker des visualisations de spectrogrammes personnalisées ou de générer de nouvelles visualisations personnalisées basées sur un grand nombre de champs de saisie. Ces outils ont révolutionné la façon dont les chercheurs en langues analysent les langues en leur permettant d'examiner la relation entre les mots, les sons et les significations. Cette capacité a donné aux linguistes un accès sans précédent à la structure des langues. Fon permet aux utilisateurs de spécifier le nombre de points temporels auxquels un mot apparaît, et crée automatiquement un spectre avec l'étiquette associée. Les utilisateurs peuvent également sélectionner le type de relation qui les intéresse (par exemple, absolue ou relative) et parcourir le spectrogramme pour déterminer la distribution de probabilité de la forme du mot, de son emplacement dans le vocabulaire et de la forme de son occurrence dans la phrase.En plus de fournir des visualisations de haute qualité des modèles de parole, Fon offre aux utilisateurs une puissante capacité d'analyse de la parole. Les outils de reconnaissance vocale tels que Fon fournissent un moyen expressif et précis d'identifier les modèles et les relations de la parole, et il fournit une solide plateforme pour la recherche en reconnaissance vocale. Plusieurs modèles de reconnaissance vocale ont été développés à l'aide de Fon. Le projet Fon a connu une croissance énorme grâce aux efforts de milliers de linguistes dans le monde entier.
Fon offre la possibilité de scanner des centaines de milliards de phrases par jour. La technologie à l'origine de cette percée est basée sur la méthode d'extraction et de reconnaissance. Lorsque l'utilisateur tape un texte dans la zone de texte, le moteur de reconnaissance vocale de Praat scanne rapidement le texte et recherche les mots grammaticalement corrects, mais mal orthographiés ou qui semblent mal écrits. Les mots extraits sont ensuite introduits dans un réseau neuronal de reconnaissance vocale (RNN), qui fait référence à une paire de réseaux neuronaux convolutifs (CNN) pré-entraînés, pour trouver des similitudes dans la phrase extraite et créer une association forte.