録音した音声データの声色を変える「恋声」というソフト(ボイスチェンジャー)がありました。
・恋声(公式サイト)
(参考)
●フォルマント
恋声を試用してみたら、「Formant」というパラメーターがありました。
知らない用語だったので、意味を調べてみました。(メモ)
フォルマントまたはホルマント(英: formant)とは、言葉を発している人の音声のスペクトルを観察すると分かる、時間的に移動している複数のピークのこと。
周波数の低い順に、第一フォルマント、第二フォルマント…というように数字を当てて呼び、それぞれF1, F2とも表記する(第0フォルマント、F0を数える場合もある)。
フォルマントの周波数は声道の形状と関係し、個体差や性差もフォルマントの違いを生む原因となる。発音する音韻が同じであれば、各フォルマント周波数は近い値になる。
音声との関係
音声は、声帯(英: vocal fold)の振動によって生成された音波(喉頭原音)が声道(英: vocal tract)で共鳴することで形成される。
音声の源となる声帯振動は会話の時は100~200Hz付近で、ゴム風船のブーという振動とあまり変わらない。
この音は喉に直接マイクを当てれば聴くことができる。
また、声帯を失った人に使用される人工声帯は、ブーという音しか出ない。
この声帯音源が、声道つまり咽頭喉頭および唇・舌・歯・顎・頬で構成される口腔、さらに鼻腔、副鼻腔で共鳴することによって特定帯域ごとに倍音が増幅される。
この増幅された成分の塊もしくはピークをフォルマントと言う。
この音は、さらに口から外部への放射、伝播を経て、我々が普段耳にしている音声へと変わる。
(via フォルマント周波数 )
フォルマントというのは、声の波形をオシロスコープ等で調べたとき、波の山になっている部分だそうです。
この山の位置や数によって、声の特徴(声色)が変わってきます。
フォルマントについて分かりやすい解説動画がありました。
音声データを加工するときは、音の高さ(pitch)と声色(formant)の2つをいじればOK!