コミュニティアイコン プチコン 非公式コミュニティ プレイ日記

アバター
こういち ◆ou0jbJnEJ0Kb
2024/1/10 23:52
2024年になりました。
2023年までに音声合成に関する情報はある程度収集できたので、2024年は音声合成関係のプログラムを実装する年にしたいです。(それでも知らないことは多いですが)

そんなわけで、ストレスアナライザーなるプログラムを作りました。

日本語のアクセントのうちピッチ(高低)の部分は藤崎モデルなどの品質の良い近似モデルが提案されていますが、ストレス(強弱)に関してはあまり議論されていないように感じます。

僕は音声の自然さには強弱成分が必要不可欠だと考えており、ゆっくりボイスが機械音らしいのもストレス成分がないことが要因だと思っています。(ゆっくりボイスは機械音らしさを売りにしていますが)
声の強弱をどのように近似すれば良いか解明するため解析用プログラムを作りました。

公開キー:ZECX78HE
マイクを使うため、3号/BIG専用です。高度サウンドユニットは不要なはずです。

「むむ、5頭の飢えたソビエト牛があの庭にいるぞ。」

コメント

アバター
こういち 2024/1/10 23:56 ◆ou0jbJnEJ0Kb
仮説。日本語の強弱はプロミネンス(イントネーションの一種。アクセントが弱まらない位置)でピークになり、指数関数的に緩やかに弱くなっていく。(弱くならない場合もある)

「あらゆる現実をすべて自分のほうへねじ曲げたのだ」

コメントを書く

  • こちらは「プチコン3号」「プチコンBIG」など、プチコンシリーズに関する話題を扱ったコミュニティです
  • プチコンシリーズにまったく関係ない書き込みはご遠慮下さい。削除の対象となります
  • こちらにはその他のゲームや雑談のコミュニティはなく、作る予定もありません (ひとりで管理できないため)。ごめんなさい
  • ユーザー登録なしで書き込みができます
  • 秘密の合い言葉は成りすましの防止 (トリップ機能)、書き込みの編集時の本人認証に使用します
  • 秘密の合い言葉に他人に推測されやすい言葉、他サービスと同じパスワードは入力しないでください。
  • 書き込むと、投稿時に入力したお名前と秘密の暗号が記憶され、ログイン状態になります

- WEB PATIO -