2016年7月15日金曜日

Google Cloud Speech API日記(17~19日目)

ここ3日位の解析結果はよくなったり、悪くなったり波がある感じです。

[ 音声ファイル ]
(私)はい、もしもし、おまたせしました。オプトエスピー上原でございます。
(サポート)えー、セールスフォースドットコムサポート担当の西田と申しますが。
(私)はい、お世話になっております。
(サポート)えー、お電話でご質問を頂きました(あっ、はいはい)売上予測のデータを外部出力することができるか(うん)という件なんですけれども(ええ)、今この件で少しお時間頂いても大丈夫ですか。
(私)はい、大丈夫です。

[ 解析結果 ]
通常と結果に違いがなかったのでcontinuousのみ載せています。
<2016/07/13>
・continuous(多分、文の切れ目までを1つの結果として返却する)
"transcript": "はいもしもしまたしましたお手数 you have でございますと申しますいただきますすることができるかという間なんですけれども今この手に少しお時間いただいても大丈夫ですかはい大丈夫です"
<2016/07/14>
・continuous(多分、文の切れ目までを1つの結果として返却する)
"transcript": "はいもしもしまたしましたお手数 you have でございますと申しますいただきますすることができるかという間なんですけれども今この手に少しお時間いただいても大丈夫ですかはい大丈夫です"
<2016/07/15>
・continuous(多分、文の切れ目までを1つの結果として返却する)
"transcript": "はいもしもしまたしましたお手数 you have でございますと申します"

このような結果を受けて、テストグループに以下の質問を投げています。
===============================================================
Hi,
Cloud Speech API team

When it passes for several days, an execution result of API is different.
I think the cause is a renewal of a program.( or machine learning ?)

Is it possible to see the change log?

Thank you.
===============================================================
数日置きに、結果が変わるので、プログラムの改修されているのかなと思ってます。
変更履歴見せてもらえませんか?
という内容です。
※今のところ、見事に既読スルーされておりますが、レスポンスがあったら、フィードバックします。

また、前職の後輩がPepperアプリの開発プロジェクトに参画しているということで、音声認識絡みの情報交換をしてきました。
ポイントは、
・後輩のプロジェクトでは、1フレーズを音声認識して、答えをPepperにしゃべらせてるとのこと。
⇒そのため、私たちのやっている会話を認識させるのとは少し系統が違います。
・今まで、検証した中でGoogle speech APIが一番認識率がよい。
・ただし、採用しているのは、docomoの音声認識エンジン(実は、中身は、HOYA製)。
⇒Google speech APIは、一日の認識依頼できる数に制限があるため、使うのをあきらめたとのこと。
・docomoの音声認識エンジンにも制約があり、一度にリクエストできる音声のサイズは、7~8秒とのこと。
⇒それでも1フレーズには十分なサイズみたいです。

※後輩が開発に携わっている製品は、こちら。(Tweeperという製品です)

先日、カンファレンスに参加して、docomoディベロッパーのアカウントも持っているので、こちらも使ってみようと思います。

0 件のコメント:

コメントを投稿