テープ起こし

 先日来書いているGoogle Documen(※1)は、口述筆記の変換精度もなかなか良くて、あれ以来よく利用するようになりました。今、テーブルの上にはPCと供にマイクが常駐しています。
 誰もが次に考えるのは、録音した声を文字に変換(いわゆるテープ起こし)です。手元に会議を録音したファイルがありますので、早速マイクの前で再生してみました。
 口述と録音した声とでは周波数帯域が違うのでしょうか。結果は残念、何の反応もありません。ここで諦めてはと、次の手を探します。思いついたのが IBM の Watson です。その機能の一つに Speech to Text があり、やりたいことずばりです。導入するとなるとかなりのコストがかかりますが、ありがたいことにDemoサイ(※2)があります。
 早速試して見ます。使い方がまずいのか、マイクでは口述すら反応がありません。幸いオーディオファイルのアップロード機能がありますので、それで試して見ると、動きました。だが残念。全く使い物になりません。事前にサンプル1、さんぷる2 の見事なテープ起こしを見ているだけに、がっかりです。
 やはりコストを掛けず無料で済ませようとするのは、虫が良過ぎでしょうか。

(※1) https://accounts.google.com/signin/v2/identifier?service=wise&passive=1209600&continue=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fu%2F0%2F&followup=https%3A%2F%2Fdocs.google.com%2Fdocument%2Fu%2F0%2F&ltmpl=docs&flowName=GlifWebSignIn&flowEntry=ServiceLogin
(※2) https://speech-to-text-demo.ng.bluemix.net/?cm_mc_sid_50200000=37068811517964775470&cm_mc_sid_52640000=71392261517964775477&cm_mc_uid=24044653253315179647754

se.gif