2016年6月28日火曜日

Google Cloud Speech API日記(2日目)

<2016/06/28>
1.専門用語なし
「今日は8時20分頃出勤しました出勤後メールのチェックを行い8時45分から9時まで車内の掃除をしました」
2.専門用語あり
「アスタリスクはアメリカの bgm 社が開発しているオープンソースの ip pbx ソフトウェア」
 ⇒特に変換はありませんでした。ここまでの結果が返却されてくると当然の結果かと思います。

上記の結果から、音声ファイルをもう少し長いものかつ、実際の通話にしてみようと思います。

新しい音声ファイルでの調査にに入る前に、ここまでの調査で得た予備情報を残しておきます。
※本日は、新しい入力音声を作成中で時間切れとなってしまいました。調査は3日目に持ち越します。
<予備情報>
1. 現時点で音声ファイルの最大録音時間は1分のようです。最大録音時間を越える音声ファイルを送ると以下のようなレスポンスが返却されます。
 $ curl "https://speech.googleapis.com/v1/speech:recognize?key=XXXXXXXXXXXX" --header "Content-Type: application/json" --data '{"initial_request":{"encoding":"FLAC","sample_rate": 44100},"audio_request":{"uri":"gs://XXXXXXX/callRecord1.flac"}}'
{
  "responses": [
    {
      "error": {
        "code": 10,
        "message": "For audio inputs longer than 1 min, use the 'output_uri' pararameter to specify an output file."
      }
    }
  ]
}

2. サンプリングレート(今回は、44,100)が高すぎるとサーバーエラーになるようです。コーデックがflacの場合は、16,000がいいのかも。もう少しマニュアルを熟読してみます。
$ curl "https://speech.googleapis.com/v1/speech:recognize?key=XXXXXXXXXXXX" --header "Content-Type: application/json" --data '{"initial_request":{"encoding":"FLAC","sample_rate": 44100},"audio_request":{"uri":"gs://XXXXXXX/callRecord1_1min.flac"}}'
<!DOCTYPE html>
<html lang=en>
  <meta charset=utf-8>
  <meta name=viewport content="initial-scale=1, minimum-scale=1, width=device-width">
  <title>Error 502 (Server Error)!!1</title>
  <style>
    *{margin:0;padding:0}html,code{font:15px/22px arial,sans-serif}html{background:#fff;color:#222;padding:15px}body{margin:7% auto 0;max-width:390px;min-height:180px;padding:30px 0 15px}* > body{background:url(//www.google.com/images/errors/robot.png) 100% 5px no-repeat;padding-right:205px}p{margin:11px 0 22px;overflow:hidden}ins{color:#777;text-decoration:none}a img{border:0}@media screen and (max-width:772px){body{background:none;margin-top:0;max-width:none;padding-right:0}}#logo{background:url(//www.google.com/images/branding/googlelogo/1x/googlelogo_color_150x54dp.png) no-repeat;margin-left:-5px}@media only screen and (min-resolution:192dpi){#logo{background:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) no-repeat 0% 0%/100% 100%;-moz-border-image:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) 0}}@media only screen and (-webkit-min-device-pixel-ratio:2){#logo{background:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) no-repeat;-webkit-background-size:100% 100%}}#logo{display:inline-block;height:54px;width:150px}
  </style>
  <a href=//www.google.com/><span id=logo aria-label=Google></span></a>
  <p><b>502.</b> <ins>That’s an error.</ins>
  <p>The server encountered a temporary error and could not complete your request.<p>Please try again in 30 seconds.  <ins>That’s all we know.</ins>

0 件のコメント:

コメントを投稿