コミュニティアイコン プチコン 非公式コミュニティ プレイ日記

アバター
こういち ◆ou0jbJnEJ0Kb
2023/6/12 22:58
これまで音声合成について学んできた。
僕の学んできた理論(ソース・フィルタモデル)だと、音声は声帯,声道,ピッチで構成できると認識してる。
声道とピッチに関しては数学的なモデルを知ってる(LPC,LSP,藤崎モデル,曲線声調など)
唯一、声帯だけは僕の知る限り乃乃歌や無地歌みたいに経験と試行錯誤で作るしかないのよね。発声法と声帯音源の関係については多少の知識はあるけど…(一応、ACELPってのもあるけど、生成ってより圧縮って感じだった)
そして、声帯が音声のリアルさを左右する上で最も重要な部分になるという認識。

それはそうと、カロス語の生成方法に関する記述を見つけた。( https://wiki3.jp/conlinguistics/page/43 )
これの日本語版とか作れば音声の学習データの作成に使えるかもしれない。

…さて、そろそろ本格的にプログラム組みたいけど…

コメント

アバター
こういち 2023/6/12 23:09 ◆ou0jbJnEJ0Kb
補足
声帯は裏声になるほど正弦波に近づく。つまり、倍音成分は少なく、ノイズ成分も少なくなる。(ゆっくりのブログにも書いてあった http://blog-yama.a-quest.com/?eid=970153 )
藤崎モデルは正確なモデルではあるけど、藤崎モデルにはアクセントとイントネーション(僕はプロミネンスだと認識してるけど、そうでないという認識の方が一般的なのでより広い意味でイントネーションと呼ぶことにする)を正確に与える必要がある。
LPC係数を分析する場合、高域強調が重要になる。高域強調は声道の高周波部分を見やすくする他、声帯の特性を決定する。(高域強調を強くかけると裏声に近い声帯になる。逆に地声を合成,分析するなら高域強調は控えめに掛けるべき)
アバター
こういち 2023/6/15 20:56 ◆ou0jbJnEJ0Kb
隠れマルコフモデルを理解したい。
もしかしたら、これ。音声だけじゃなくてHCI3-P0や紡ネンみたいにズモズモするのにも使えるのでは?

コメントを書く

  • こちらは「プチコン3号」「プチコンBIG」など、プチコンシリーズに関する話題を扱ったコミュニティです
  • プチコンシリーズにまったく関係ない書き込みはご遠慮下さい。削除の対象となります
  • こちらにはその他のゲームや雑談のコミュニティはなく、作る予定もありません (ひとりで管理できないため)。ごめんなさい
  • ユーザー登録なしで書き込みができます
  • 秘密の合い言葉は成りすましの防止 (トリップ機能)、書き込みの編集時の本人認証に使用します
  • 秘密の合い言葉に他人に推測されやすい言葉、他サービスと同じパスワードは入力しないでください。
  • 書き込むと、投稿時に入力したお名前と秘密の暗号が記憶され、ログイン状態になります

- WEB PATIO -