コミュニティアイコン プチコン 非公式コミュニティ プレイ日記

アバター
こういち ◆.Id/aHiU36hu
2021/12/28 6:53
[悲報]僕はフォルマントについて盛大な勘違いをしてたらしいです。
フォルマント合成ソフト「あくあ」。作り直しかな…

コメント

アバター
ネコ薪のごとく 2021/12/28 22:20 ◆SmJfjpqm/X.x
フォルマント計算のアルゴリズムすごく気になるのでコメ残しー
(petitverseってコメ残し意味ありましたっけ)

僕も前にフォルマント計算をプチコン4に実装しようとしたんですが、ネットの情報だと資料が少なくてうまくできなかったんですよね…。
アバター
こういち 2021/12/29 12:03 ◆.Id/aHiU36hu
およ、しんのすさんがプチバに現れるの珍しい。
コメ残し意味あります。

とりあえず調べて分かったことまとめますか。
線形予測符号化や線スペクトル対は周波数スペクトルの包絡線を求めるフィルタの係数を求める手法…だと思います。
そこから包絡線の傾きを調べればフォルマントが求まるはず。
高周波成分は小さくなりがちなので、高域強調と呼ばれる前処理が行われるとか。
アバター
ネコ薪のごとく 2021/12/29 20:18 ◆SmJfjpqm/X.x
おおーめちゃくちゃ参考になります!
僕は包絡線を求める段階で頓挫してたのでまだまだですねー…

プチコン3号・4のFFT命令が優秀なのでFFT→ケプストラム変換で包絡線を求めようかなと当時考えてました
(未だうまく実装できてない)
アバター
ネコ薪のごとく 2021/12/29 20:18 ◆SmJfjpqm/X.x
こういちさんの役に立つかはわかりませんが、一応僕が参考にしてたネットの資料をいくつか貼っておきます〜

ピッチ・フォルマント変換の観察2
http://koigoemoe.g2.xrea.com/formant2/formant2.html

ケプストラム
http://mikeo410.minim.ne.jp/cms/~audiocepstrum

UTAU仕様書(79ページ辺りからフォルマントの解説)
http://udn.utau-synth.com/documents/kouen/20120325/utau_kouen.pdf
アバター
こういち 2021/12/29 22:14 ◆.Id/aHiU36hu
ボクの見た資料はこのあたりですね。
どこかの大学の抗議資料が優秀。

http://www.spcom.ecei.tohoku.ac.jp/~aito/soundmedia/slides.pdf
https://ocw.u-tokyo.ac.jp/lecture_231/
アバター
こういち 2021/12/29 22:14 ◆.Id/aHiU36hu
あとフォルマント自体については安定の足立レイ氏とすきえんてぃあ氏を参考にしてます(ちなみに最近足立レイにハマりつつある)

https://twitter.com/cicada3301_kig/status/1355355720221220869
https://youtu.be/3Ev_lJeAgYM
https://youtu.be/xiZ5HOqP4Qw
アバター
ネコ薪のごとく 2021/12/29 22:56 ◆SmJfjpqm/X.x
情報交換すごくありがたいです〜〜
大学の講義資料って一般公開しているんですね! これはブックマークせねば…。

足立レイ知ってますー! いろんなクリエイターさんが足立レイさんの音声で楽曲などを制作されてますね〜
なかでもアボカド6さん作のMV「足立レイ」が個人的にグッときます…!!
アバター
こういち 2021/12/30 9:26 ◆.Id/aHiU36hu
「足立レイ」良いですよね。進化の歴史が感じられる。
個人的には「隕石が落ちてきた」が好き。

足立レイさん。炉龍うたさんの動画で知りましたが、子音まで作るの衝撃でした。まさに音声合成界のtourist。最近はカリカチュアのCCD-0500[FEE]とセットで扱われてる印象。
アバター
こういち 2022/1/9 14:29 ◆.Id/aHiU36hu
線形予測符号化の連立方程式を解く部分。ガウスの消去法を使ってもいいけど、対称性がある特殊な連立方程式なのでLevinson-Durbinのアルゴリズムって方法を使うと高速に解けるらしい。
アバター
こういち 2022/1/14 19:54 ◆.Id/aHiU36hu
乃乃歌ってのを知った。
あと、乃乃歌について調べてたら良い情報見つけた。ノコギリ波が良いらしい。
https://twitter.com/kanshikironri/status/1289035582744584193
アバター
こういち 2022/2/7 21:13 ◆.Id/aHiU36hu
ノコギリ波は確かにスペクトルが良い感じだけど、周波数が高くなれば倍音も高くなるし、基本周波数より低い成分は含まれない。
ふと、AM変調すれば良いんじゃね?と思った。ただ、感覚的には上手く行きそうだけど実際どうなるかが分からない。

ところで、そもそも基本知識が足りなくて頭の中から「信号処理、やり直したら?」って聞こえてきた(元ネタ https://twitter.com/nekomath271828/status/1249707718278909954 )のでやらない夫のサイトで勉強してたらAM変調について出てきた。
http://www.ic.is.tohoku.ac.jp/~swk/lecture/yaruodsp/shiftmod.html
アバター
こういち 2022/2/15 22:20 ◆.Id/aHiU36hu
なんとなく分かったこと
LPCの欠点は母音のフォルマントを抽出したいだけならそこまでデメリットでもない。

LSPは周波数が出てきて、周波数の粗密で崩落線の形状が分かる?

PARCORの理解を飛ばしてLSPを理解しようとするのは無謀らしい

LSPで得られた信号を復元する方法がCSM(複合正弦波モデル)らしい?

凄まじい情報量のサイト見つけた。
https://home.hiroshima-u.ac.jp/tkurita/thesis/thesis/index.html

良い感じの足立レイの曲見つけた。
https://youtu.be/CYQjmubO2uk
アバター
こういち 2022/2/17 21:24 ◆.Id/aHiU36hu
LPC
スペクトルじゃなくて波形の方にフィルタ掛けるのね。
しかし、FFTで処理する要素数指定できないの地味に厄介。フィルタ掛けるとき用に大きめの配列持っておきたいんだけどな…

↓足立レイのおすすめ曲
https://youtu.be/LtjYyI6oFSU
アバター
こういち 2022/3/8 12:39 ◆.Id/aHiU36hu
分かったこと

線形予測フィルタ:音声をホワイトノイズ(声帯信号)に変換するフィルタ
全極フィルタ:ホワイトノイズを崩落線に変換するフィルタ

LPC:フィルタの係数
PARCOR:フィルタの極(安定条件)
LSP:フィルタの位相がπの整数倍遅れる周波数
いずれもLPCの表記を変えたもの

LPCは扱いづらくて変えるのは無理だけど、LSPなら周波数なのでカスタマイズしやすそう。

おすすめ足立レイの曲
https://youtu.be/eRYmJ-nbwG8
アバター
こういち 2022/3/17 22:57 ◆.Id/aHiU36hu
進捗。
まさかマイクから信号取得したりスペクトル表示したりする部分で半月以上かかるとは…
その間LPC係数の解説を作成したので、フォルマント取得できたら解説用プレイ日記立てます。

おすすめ足立レイ動画
https://youtu.be/jsQ2QtREVOU
アバター
こういち 2022/3/20 22:15 ◆.Id/aHiU36hu
広域強調とノイズ除去後のスペクトル。
広域強調はFIRフィルタ。画像処理の微分フィルタと似たような感じ。次数が低いのでFFTするまでもない。FFTしないときは後ろから処理すると楽。
https://ocw.u-tokyo.ac.jp/lecture_files/engin_01/2/notes/ja/B2-Spectrum.pdf
ノイズ除去はスペクトル減算ってのを使った。効果はイマイチ感じられない。(というか元のノイズがそんなに大きくなさそう)
ランニングスペクトルってノイズ除去も気になるけど、スペクトル減算で不都合は無さそう。



桃源郷シリーズ新作。
ピクドさんのれいを歌わせる技術が凄まじい。
https://youtu.be/Prfnbb-1p9A
アバター
こういち 2022/3/20 22:29 ◆.Id/aHiU36hu
やば、ノイズ信号に広域強調掛けるの忘れてた。
それでも違いは分からん。こっちが合ってるのかすら分からん。
パッと見倍音以外の成分が増えてるように見えるけど、単純にボクの声が枯れかけた説が有力。


そんな倍音成分以外の音多めを目指して作られたのがこの乃乃歌ちゃんらしいです。足立レイもこの子経由で知りました。作者はファイナルソードRTAで有名な炉龍さんです。
https://youtu.be/t8LATuhfIac
アバター
こういち 2022/3/22 22:29 ◆.Id/aHiU36hu
さて、軽く組んでみたけど、遅い。
FFT使うの忘れてた。
ちょっと組み直す。

…あれ?FFTってどうやって使うんだっけ。

と思ったら畳み込みじゃなかった。

あ、これおてがみコウモリさんでお馴染み高原のなさんが描いた乃乃歌と足立レイ親子のイラストです。
https://twitter.com:443/nona_takahara/status/1495624163213590535
アバター
こういち 2022/3/24 23:19 ◆.Id/aHiU36hu
さて、声帯信号は単位インパルスだと駄目っぽい?
ガウス雑音ってのが必要らしい。
どうやってガウス雑音作るんだろう?
(画像はIFFTとCOS,SINで頑張ったやつ)
アバター
こういち 2022/3/28 8:28 ◆.Id/aHiU36hu
嵯峨山先生の講義資料にめっちゃ書いてあった。
z変換のzをexp(-jω)に変えれば良いっぽい。

これ。フーリエ変換かと思って試したけど、違う?(毎回変わる)
あと、v(i)もfftで計算できるらしい。
http://mikeo410.minim.ne.jp/cms/~audiolinearpredictionautocorrelationfft

↓今回の足立レイ
https://nico.ms/sm39736390?ref=other_cap_off

コメントを書く

  • こちらは「プチコン3号」「プチコンBIG」など、プチコンシリーズに関する話題を扱ったコミュニティです
  • プチコンシリーズにまったく関係ない書き込みはご遠慮下さい。削除の対象となります
  • こちらにはその他のゲームや雑談のコミュニティはなく、作る予定もありません (ひとりで管理できないため)。ごめんなさい
  • ユーザー登録なしで書き込みができます
  • 秘密の合い言葉は成りすましの防止 (トリップ機能)、書き込みの編集時の本人認証に使用します
  • 秘密の合い言葉に他人に推測されやすい言葉、他サービスと同じパスワードは入力しないでください。
  • 書き込むと、投稿時に入力したお名前と秘密の暗号が記憶され、ログイン状態になります

- WEB PATIO -