MENU

MACHINE LEARNING BLOG機械学習記事

ニュース記事を音声でも配信したい

2019.12.04

音声合成

お題
先日、弊社ブログで福岡マラソン2019に参加しました #山路レポという記事を紹介しました。
その大会でフルマラソンを3時間切りで完走したメンバーが、
Kindleの読み上げ機能を使って、ランニングと読書を同時にやっているという話を聞きました。
そこで、ニュースやブログを音声変換して配信できないか試してみました。

実現すること
Fusicのホームページで配信しているニュースや機械学習記事を音声でも配信する。

使う技術
Text to Speech(音声合成)と言われる手法を使います。
ニュースを登録し、公開したタイミングで記事内の文字を自動で音声ファイルに変換するようにします。

結果


 こちらは、前回の機械学習記事の画像(一部)です。
記事最上部にあるオーディオのコントローラーが音声ファイルです。

今まで公開してきた「ニュース」「なんしようと?」「機械学習記事」の全記事を
音声変換してみましたので、ぜひいくつか再生してお聞きください。

【ニュース】 https://fusic.co.jp/news
【なんしようと?】https://fusic.co.jp/doings
【機械学習記事】https://fusic.co.jp/ml

また、せっかくなので、Podcast配信もして、新しい記事が出たらすぐに聞けるようにしました。
こちらもぜひお試しください。

【ニュース】 https://fusic.co.jp/news/podcast.rss
【なんしようと?】https://fusic.co.jp/doings/podcast.rss
【機械学習記事】https://fusic.co.jp/ml/podcast.rss

問題点
「Fusic」など特殊な読み方をする単語は、そのままでは正しく読み上げてくれません。
「Fusic」という文字列を「ひゅーじっく」と読むように機械に教えてあげると
正しく読み上げるようになります。

また、イントネーションもところどころ違和感があります。
上記同様、細かく機械に教えることで、ある程度思った通りの読み上げ方にすることができます。

しかし、これらを全自動で行うことはできず、
おかしいところを人が見つけ、一つ一つ定義する必要があります。

まとめ
記事内容が理解できる程度に文字を音声に変換することができました。
問題点はいくつかあるものの、文字でしか配信できていなかったものを
手軽に音声でも配信できることがわかりました。

利用シーンによっては、サービスや製品の新しい価値やチャネルを創出できる可能性を感じました。

参考にしたサイト
Amazon Polly

最後に

Fusic 機械学習チームでは、案件のご相談を随時受け付けております。
お気軽にお声がけください。  


【お問い合わせ先】

 092-737-2616 (平日10:00〜17:00)
 sugimoto@fusic.co.jp
 (担当:先進技術部門 機械学習チーム 杉本)