Neural Audio Codecベースの音声合成モデル性能改善手法に関する検討
異なるスタイルのプロンプトを与えて合成した音声サンプル
スタイル名
プロンプト
合成音声
Talk
x
x
Happy
x
x
Sad
x
x
Angry
x
x
Fear
x
x
Surprised
x
x
Small
x
x
Whisper
x
x