Microsoft Speech Platform を使用し、日本語を発音させた場合に、適切な読み仮名にて発音できない場合がある。

現象

Microsoft Speech Platform で、SSML (Speech Synthesis Markup Language) を使用して日本語を発音させた場合に、適切な読み仮名にて発音ができない場合があります。具体的な例を以下に示します。


<phoneme alphabet="x-microsoft-sapi" ph="チョウ">町</phoneme>
と指定した場合に 「チヨウ」 と聞こえます。

<phoneme alphabet="x-microsoft-sapi" ph="アイウエオ">あいうえお</phoneme>
と指定した場合に 「アイゥュ」 と聞こえます。


これは Microsoft Speech Platform が SSML にて次の発音を適切に処理できないことから発生します。
·         「ヤ (30E4) 」と 「ャ (30E3) 」 の違いを識別できない。
·         「ユ (30E6)」と 「ュ (30E5)」 の違いを識別できない。
·         「ヨ (30E8) 」と 「ョ (30E7)」 の違いを識別できない。
その他、「アイウエオ」などの大文字と小文字の違いを処理できないことがあります。
 

回避策

SSML を利用して発音を指定しない場合には現象は発生しません。
プロパティ

文書番号:2823670 - 最終更新日: 2016/09/29 - リビジョン: 1

フィードバック