Fon による音声認識 - 単語パターンのリアルタイムでの抽出と照合
スクリーンショット
Fon は受賞歴のある分析ソフトウェアであり、世界中の何万人もの言語専門家が言語間のパターンと関係を識別するために使用しています。 Fon は、カスタム スペクトログラム ビジュアライゼーションを作成して保存したり、多数の入力フィールドに基づいて新しいカスタム ビジュアライゼーションを生成したりする機会をユーザーに提供します。これらのツールは、言語研究者が単語、音、意味の関係を調べることを可能にすることで、言語の分析方法に革命をもたらしました。この能力により、言語学者は言語の構造に前例のない方法でアクセスできるようになりました。 Fon を使用すると、ユーザーは単語が出現する時点の数を指定でき、関連付けられたラベルを使用してスペクトルを自動的に作成できます。ユーザーは、関心のある関係の種類 (絶対的または相対的など) を選択し、スペクトログラムをブラウズして、単語の形状の確率分布、語彙内の位置、フレーズ内での出現の形状を判断することもできます。
音声パターンの高品質な視覚化を提供することに加えて、Fon は強力な音声分析機能をユーザーに提供します。 Fon などの音声認識ツールは、音声パターンと関係を識別するための表現力豊かで正確な方法を提供し、音声認識研究のための強力なプラットフォームを提供します。 Fon を使用していくつかの音声認識モデルが開発されています。 Fon プロジェクトは、世界中の何千人もの言語学者の努力により、驚異的な成長を遂げました。
Fon は、1 日に何千億ものフレーズをスキャンする機能を提供します。このブレークスルーの背後にある技術は、抽出と認識の方法に基づいています。ユーザーがテキスト ボックスにテキストを入力すると、Praat の音声認識エンジンがテキストをすばやくスキャンし、文法的に正しい単語を探しますが、スペルが間違っているか、書き方が悪いように見えます。抽出された単語は、音声認識ニューラル ネットワーク (RNN) に入力されます。RNN は、事前にトレーニングされた畳み込みニューラル ネットワーク (CNN) のペアを参照して、抽出されたフレーズの類似点を見つけ、強い関連性を作成します。