ホーム > タグ > 音声合成

音声合成

Microsoft Speech Platform

Microsoft Speech Platform 10.1という音声合成のためのライブラリが先月に公開されていたようです。

このSpeech Platformの大きな特徴は日本語をはじめとする多くの音声合成エンジンが無償で公開されているという点です。しかも品質が比較的高いのです。

音声合成というのはテキストを入力として音声合成をして読み上げるため機能です。テキスト読み上げをしたいソフトウェアなどから呼び出されて利用されます。Windows 7/VistaにはMicrosoft SpeechAPI 5(SAPI5)という音声合成エンジンがデフォルトでインストールされており、多くのソフトウェアが、この機能を利用してテキストの読み上げをしています。ただ、Windowsにデフォルトで入っているSAPI5対応の音声合成エンジンは英語版のみです。SAPI5対応の日本語合成エンジンが、ほとんど有償のものしかないため日本ではあまり一般的ではありません。SAPIを利用しない独立した音声合成エンジンが無償で公開されているということもあり、棒読みちゃんSofttalkのようにそれらを利用した音声合成ソフトがポピュラーです。

こんな良いものが公開されたとなってはすぐにでも飛びつきたいところなんですが、このSpeech Platformは一般的にSAPI5とほとんど互換性がないらしくSAPI5対応のアプリでは利用できないようです。

私が翻訳をしているボイスチャットソフトウェア『Mumble』、最近記事で取り上げた音声合成ソフト『棒読みちゃん』なんかも、このSAPI5による音声合成に対応していますが、このSpeech Platformは使えないようです。

ただ、実質的にはSAPI5と大差ないらしく、SAPI5対応のアプリをSpeech Platform に対応させるのはさほど難しくないようです。

Mumbleの方は、Speech Platform のライブラリを使って再コンパイルすることで簡単に対応できました。ですので、棒読みちゃんのほうも作者さんしだいですぐに対応してくれるかもしれません。

今のところ Speech Platformに対応しているアプリケーションはあまりないようです。私の知る限りだとMicrosoft Office 2010 製品のWordやPowerPointで、このSpeechPlatformを使ってのテキスト読み上げができるようです。

全文を読む

Home > タグ > 音声合成

検索
フィード
メタ情報

Return to page top