2016年7月4日月曜日

Google Cloud Speech API日記(6~8日目)

continuous(多分、文の切れ目までを1つの結果として返却する)を指定したときの結果に変化がありました。
また、この変化が興味深い結果となりました。
具体的には、1度改善された結果が翌日元に戻るというものです。
この結果の意味するところ、会話が途中で切れるような音声ファイルだと結果も不安定になるようです。
そのため、明日以降、会話が途中で切れないような音声ファイルにチューニングした上で検証を続けようと思います。

[ 音声ファイル]
(IVR)はい、オプトエスピーでございます。内線番号を押してください。
ピッ、ポッ、パッ
プルルル(呼び出し音5回)
(私)はい、もしもし、おまたせしました。オプトエスピー上原でございま
※30秒で強制的に音声を切っているため中途半端な状態になっています。

[ 解析結果 ]
返却結果のtranscript(音声解析結果)以外に変化はなかったので、そこだけ抽出して結果として残しております。
<2016/07/02>
・通常時(最低限必要な、エンコード、サンプリング周波数、言語コードのみ指定)
"transcript": "ハイ|ハイ 2|ツー,ニ,フタ,フツ,ブタ sp|エスピー で|デ ござい|ゴザイ ます|マス 内線|ナイセン 番号|バンゴー を|オ 教え|オシエ て|テ ください|クダサイ まし|マシ た|タ"
⇒改善なしです。

・continuous(多分、文の切れ目までを1つの結果として返却する)
 "transcript": "はいオプト sp でございます内線番号を教えてください"
 "transcript": "もしもしまたしましたお手数上原でございま"
⇒まだ、数箇所誤認識はありますが、内線番号及び上原を正しく認識しており、かなりの改善がみられました。

<2016/07/03>
・通常時(最低限必要な、エンコード、サンプリング周波数、言語コードのみ指定)
"transcript": "ハイ|ハイ 2|ツー,ニ,フタ,フツ,ブタ sp|エスピー で|デ ござい|ゴザイ ます|マス 内線|ナイセン 番号|バンゴー を|オ 教え|オシエ て|テ ください|クダサイ まし|マシ た|タ"
⇒改善なしです。

・continuous(多分、文の切れ目までを1つの結果として返却する)
"transcript": "アイオプトエスピーでございます支店番号を教えてください"
"transcript": "明日でござい"
⇒なんと、結果が元に戻ってしまいました。

<2016/07/04>
・通常時(最低限必要な、エンコード、サンプリング周波数、言語コードのみ指定)
"transcript": "ハイ|ハイ 2|ツー,ニ,フタ,フツ,ブタ sp|エスピー で|デ ござい|ゴザイ ます|マス 内線|ナイセン 番号|バンゴー を|オ 教え|オシエ て|テ ください|クダサイ まし|マシ た|タ"
⇒改善なしです。

・continuous(多分、文の切れ目までを1つの結果として返却する)
"transcript": "アイオプトエスピーでございます支店番号を教えてください"
"transcript": "明日でござい"
⇒改善なしです。

0 件のコメント:

コメントを投稿