Amazon Transcribeが日本語に対応

Amazon Transcribeといえば、音声を文字に変更してくれるAWSのサービスですが、これまで日本語に対応していませんでした。

やっと対応したそうです。

Amazon Transcribe が、音声のテキスト変換に 7 つの言語を追加

というわけで試してみましょう。せっかくなので、Youtubeにアップする動画の音声を文字に変換し、Youtubeの字幕として登録してみます。

まずはPremiereの音声をSoloモードにして声だけのmp3を作成します。

そのmp3をAWSのS3にアップします。

今回はAWSのサイト上で設定するので、Create transcription jobページでs3のアドレスを入力します。

しばらく待っているとIn ProgressがCompleteになります。今回は4分のmp3ですが、1分もかかりませんでした。

ダウンロードをすると、
asrOutput.json
というファイルが手に入ります。
これはJSONデータ形式で、全文の文章と、音声の開始位置、終了位置と対応したテキストも手に入ります。

"items":[{"start_time":"8.24","end_time":"8.57","alternatives":[{"confidence":"0.9968","content":"はい"}],"type":"pronunciation"},{"start_time":"8.58","end_time":"9.03","alternatives":[{"confidence":"1.0","content":"こんにちは"}],"type":"pronunciation"},{"start_time":"9.04","end_time":"9.38","alternatives":[{"confidence":"0.3328","content":"秀勝"}],"type":"pronunciation"},{"start_time":"9.38","end_time":"9.75","alternatives":[{"confidence":"0.9989","content":"です"}]

こんな感じです。これを、Youtubeで使えるsbv形式に変換します。

0:00:8.24,0:00:8.57
はい

0:00:8.58,0:00:9.03
こんにちは

0:00:9.04,0:00:9.38
秀勝

0:00:9.38,0:00:9.75
です

詳しくは
https://support.google.com/youtube/answer/2734698?hl=ja
をどうそ。

あとはYoutubeで字幕をアップロードすれば完了です。

感想としては「認識が間違っているのは自分の滑舌のせいなのでしょうがないとして、とにかく文章が細切れになるなぁということ。

この調節ってできないんでしょうか?

まぁでもなにか使いどころがあるような気もしますね。

 

コメント