Miyamoto-Corpus

宮本コーパス:音声合成を目的に日本語コーパスと合わせて英語の音素を網羅するよう構築された英語音素バランス文の構築と評価

本研究は、日本語話者による効率的な英語音声合成モデル作成を目的とした音素限定的英語コーパス(以下:宮本コーパス)の開発及びその効果を検証するものである。宮本コーパスは、日本語には存在しないが英語では発音される子音・母音に焦点を当て構成した184文の音声学習用例文集である。これによって、日本語話者による英語音声モデルの制作の効率化を図ることができる。また、音素連鎖の出現頻度の分布は十分に均等なものであることを、拡張エントロピーを定義し計算することで確認した。このコーパスはパブリックドメインで公開され、これによって全世界で容易に利用することができるようになる。このコーパスは、「日本語になくて英語にある音素の文章群」という独自の、言語横断的な性質を持つために、翻訳・発音学習などに役立てられるほか、speecherror(言い間違い)やspeakability(発話しやすさ)に関する研究への応用が期待できる。

ここでは、宮本コーパス作成時に用いた各プログラム、また宮本コーパス本文を掲載する。