Top / VstoneMagicを使ってみる / プログラミング / 音声再生・音声合成・音声認識

2.5. 音声再生・音声認識を使ったプログラム

次に、音声データの再生や音声認識を使ったプログラムを作成してみましょう。ロボット本体には音声再生の機能が備わっており、音楽や効果音・あらかじめ吹き込んだ音声などの、waveサウンド形式のファイルを再生することが可能です。また、ネットワークを利用して音声認識を使ったプログラミングが可能です。それでは、これらの機能を使ったプログラムを作成してみましょう。



音声再生を行う

  • ○ リソースファイルの追加

    音声再生の命令ブロックでは、音声ファイル等外部に記録したファイルをプログラムから読み込んで使用します。このように、プログラムの外部に存在し、プログラムから読み込まれるファイルを「リソースファイル」と言います。リソースファイルをプログラムから使用するためには、最初にファイルをエクスプローラに追加する必要があります。

    リソースファイルの追加は、エクスプロ―ラの「resource」の項目を右クリックしてポップアップメニューを表示し、「追加」→「リソースファイル」をクリックします。クリックするとwavサウンドファイルを選択する画面を開くので、再生したい音声ファイルを選んで「開く」をクリックしてください。クリックすると、エクスプローラのresouceフォルダに選択したファイルが追加されます。


    image136.png




    追加したリソースファイルは、エクスプローラ上の項目をダブルクリックすると、ファイルの種類(拡張子)に対してお使いのPCで割り当てられているアプリケーションを起動し、ファイルを開くことができます。

    リソースファイルは、必ず半角英数のファイル名の物を使用してください。
    また、説明中のファイルは参考例です。実際のプログラムの際には、waveサウンド形式のファイルを別途ご用意ください。




  • ○ 音声再生ブロックの設定

    追加したwavサウンド形式のリソースファイルは、soundブロックで再生することができます。soundブロックは、プロパティウィンドウの「file」の項目で、再生する音声ファイルを選択できます。

    image137.png

    使用するリソースファイルは、プログラムの実行時に、プログラムのファイルと併せて本ソフトウェアからロボットに転送されます。一度ファイルを送信したら、ファイルが更新されない限り、次回以降転送を省略します。それでは、先ほど作成したプログラムに、任意のwavサウンドファイル(リソースファイル)を追加し、soundブロックで再生してみましょう。

    image138.png




音声認識を行う


音声認識は、ロボット本体のマイクより周囲の人の声を取り込んで、文字列に変換します。変換結果は単一ではなく、スコアや文節などに応じた複数種類が用意されるため、目的の認識ワードのみを設定すれば、それ単体の発音だけでなくそれを内包する発音でも識別しやすくなっています。

※ 音声認識機能はオプションサービスであり、別途ご登録が必要です。また、ネットワークに接続できない環境ではご利用いただけません。サービスが利用できない環境でブロックを使用すると、ロボット本体がエラーメッセージを発話します



  • ○音声認識(ベストスコア)ブロック

音声認識(ベストスコア)ブロックでは、分岐一つに対して認識ワードを一つ設定します。以下のはブロックを使ったサンプルです。聞き取れた音声に対してロボットが返答する構造で、「こんにちは」に対して「こんにちは」、「さようなら」に対して「さようなら」、「お名前は」に対して「ソータです」と返し、それ以外のワードでは「何ですか」と返します。





ブロックをダブルクリックすると分岐条件の内容が表示され、wordの設定項目に、認識させるワードを入力します。

image142.png


音声認識を使うブロックを実行すると、以下のようにコンソールに全ての変換結果と各結果に対するスコアを表示します。認識精度が悪い場合は、こちらの表示を参考に認識ワードの設定などを調整してください。

image141_.png








  • ○音声認識(正規表現)ブロック
    音声認識(正規表現)ブロックでは、ベストスコアのブロックと類似しますが、分岐一つに対して正規表現を含む認識ワードを一つ設定します。

    例えば「今日はいい天気ですね」「いい天気だな」等の発話から「いい天気」を認識したい場合、認識ワードを「.*いい天気.*」に設定すると、検索結果内に「~~いい天気~~」のように「いい天気」が含まれる語句があれば、認識させることができます。


ブロックをダブルクリックすると分岐条件の内容が表示され、wordの設定項目に、認識させるワードを入力します。

image142.png