*前回配布の9月10日版のコンプレッサモードについて、記述に誤りがありました。うまくコンプレッサできなかった皆様には謹んでお詫び申し上げ、訂正いたします。
 
 前編ではAudacityを用いて、MP3からWAV16bitファイルへの変換と、伴奏と歌の時間位置調整について実習した。
Audacityがその真価を発揮する一つの局面がこのようなファイルフォーマットの変換、ハイビット・浮動小数点演算による低損失のレベル調整、サンプル単位の時間位置調整などで、これらの特質は、DAWが行うべき基本中の基本の機能である。

しかし、この基本的機能を重視しているDAWは少なく、よりポップス制作作業に特化したり、各種の同期機能に特化したものが多い。
この基本的ターミナル作業は、それらのDAWに読み込む以前に行っておくべき、いわば「コンディショニング」作業なのだが、それらのDAWではこの基本的コンディショニングを軽視している傾向が否めない。

逆にAudacityでは、これらの基本機能が充実している反面、能率的なポップス制作作業や同期機能はあまり重視されていない。中略
 要は適材適所なわけだ。

 後編ではAudacityとともにutsunomia.comに解説のある、VocalShifterを用いた歌の「音程修正」の実習を行います。

前編でコンディショニングした素材を、後編では効率的に「音程修正」するのですが、現在のVocalShifterは有償無償を問わず、それらの音程加工ソフトの中でも最も進んだ自然な音程処理のできるソフトに新化しています。
この実習は、旧版ではなく、最新のver,1.3正式版を前提に作成しています。必ずver,1.3正式版以降を入手の上、取り掛かって下さい。

 

実習後編の流れ・・
1)最新版VocalShifterの入手
2)VocalShifterの起動
3)読み込み
4)VocalShifterの操作
5)音程の自動補正
6)自動で修正できない部分の修正
7)聴こえにくい部分を聴こえやすくする(コンプレッサモード)
8)より高度な音程修正 (オプション編)

 



☆VocalShifterの入手

 VocalShifterは「あっきー」というハンドルネームの作家によって開発されているフリーウェアです。GoogleまたはYahooなどのサーチエンジンによって「VocalShifter」を検索すると、その上位で作者のサイトを見つけることができます。
ダウンロードページから最新版(ver,1.3正式版)をダウンロードすると、「vshifter13.zip」という834kBのファイルを得られます。このファイルをダブルクリックすると、同名のフォルダが出現し、その中には



vsdata    フォルダ 中にはvshifter.dll 140KB・・・(必須プログラム)
vshelp    フォルダ 中にはヘルプファイル一式
history.txt 2KB    バージョン履歴
readme.txt 2KB    ソフト概要書
vshifter.exe 423KB   プログラム本体・・・・・(必須プログラム)
vshifter.ini 2KB    初期化ファイル(設定などの保存に使用)
* vstmp   フォルダ このフォルダは1度起動すると自動作成される

 

 **もし、上記の内容と異なるものであったり、とくに必須ファイルのファイルサイズが異なっている場合、正しくダウンロードできなかったか、あるいは正常に解凍できなかった可能性があります。(ただしver,1.3正式版以外の場合、ファイルサイズは異なる場合もあります)再度ダウンロードし、異なる解凍ソフトを使用してみる、などを試してみましょう。



○vshifterフォルダの置き場所

 VocalShifterはWindows OSのシステムにインストールする必要はありません。Windows OSから見える場所ならどこにでも置くことができ起動することができます。

つまりC:のどこか(Program Files、デスクトップ、マイゲームなど)でも、パーテションを分けている場合にはD:に専用の置き場を設けたり、USBメモリーに置いても問題ないでしょう。ポータブル化したAudacity(プロフェッショナルマニュアルのトラブルシューティングの[19]の対応2を参照)とともにUSBメモリーに入れて「どこでもセット」を作っておくのも良いでしょう。

インストールしないので、「スタート」→「すべてのプログラム」からは起動できないので、システムに起動登録しておくか、デスクトップにショートカットを作成しておく(後述)と使いやすいでしょう。

* ただしUSBメモリーに置いている場合、接続するPCによってドライブ名が変化することがあるので、そのような場合USBメモリーのルートディレクトリやデスクトップに置いたショートカットはリンク切れで無効になってしまう。
ルートディレクトリから起動したい場合は、起動ファイルを相対アドレス化しなければならないが、その目的のためのフリーウェアもいくつかある。筆者はhttp://mt-soft.sakura.ne.jp/で配布されている「相対パス起動生成」ソフトを使用しています。



☆VocalShifterの起動
 VocalShifterを起動するには、vshifter13フォルダにあるvshifter.exeを直接ダブルクリックするか、vshifter.exeのショートカットまたは上記の相対パス起動プログラムで作成した起動ファイルを、ダブルクリックする。
 ver,1.3系VocalShifterでは、多重起動したVocalShifterを同期再生できるようになったため、実習1の前半で作成した伴奏と歌を、2つ起動したVocalShifterでそれぞれ読み込み、伴奏と歌の両方を同時に同期再生することができる。
その歌と伴奏が「合っているか」を、聴覚で確認しながら作業が進められるのである。




☆読み込み
ショートカットなどの起動ファイルを2回ダブルクリックすると、2つのVocalshifterを起動できるが、同じ場所に重なって起動するので、音データファイルをドロップで開くためには、重なっているVocalShifterの上端の青い帯をつかみ、適当にずらせておく。ひとつには伴奏を、もう一つには歌のファイルをドロップし、それぞれのファイルをVocalShifterに読み込ませる。

VocalShifterに音声ファイルを読み込ませると、最初にファイル全てをウェーブレット変換し、その後解析結果が内部のエディターへ送られ、音程の推移が表示される。最初のウェーブレット変換がそれなりに重い処理で、比較的高速のPCであっても音程の推移が表示されるまでに1分以上を必要とするだろう。

歌と伴奏の両方の解析が終わるのに、両方で数分かかるが、この処理は極めて計算量が多く、その間はマシンパワーのすべてが使用されるので、他の作業はできない。歌と伴奏の両方の表示が出るまで、何もせずにおとなしく待っていよう。



☆VocalShifterの操作
 VocalShifterの操作には次のようなものがある。

1)トランスポートコントロール(再生や停止など)☆本テキスト取り扱い

2)ファイルメニュー
 ・ファイル入出力関連
 ・プロパティ
 ・設定

3)編集
 ・音程        ☆自動補正モードについて、本テキスト取り扱い 
 ・ホルマント
 ・ボリューム
 ・ダイナミクス    ☆コンプレッサモードについて、本テキスト取り扱い
 ・タイミング
 ・ソフトが認識した音程の修正
 *上記の項目下に詳細な編集項目があるが、詳しくはVocalShifterプロフェッショナルマニュアルを参照

4)表示
 ・音程、ダイナミクスの解析結果と修正データの表示
 ・時間、音程、周波数
 ・ホルマント、ボリュームの変更状態の表示
 ・時間/Beat切り替え
 ・音律
 ・音程、ホルマント、ボリューム、ダイナミクス、タイミングの任意の重ね合わせ表示
 ・クリップボード内容の重ね合わせ表示
 ・オートページめくりの有無
 ・解析結果の時間軸方向、音程方向の拡大縮小
 *これらについての詳細な解説は、VocalShifter附属のヘルプファイルかVocalShifterプロフェッショナルマニュアルを参照

 

 

○トランスポートコントロール
 最も頻繁に使用するのは再生(画面左上右向き三角ボタン)と、停止(■印)であろう。マウスでこれらのボタン操作も悪くないが、ショートカットキーの割当があるので、(再生はF5、停止はF3  また、ショートカットキーはカスタマイズも可能)使用頻度の高い操作はそれを利用する方が快適であろう。覚えるのが面倒なら、他のソフトと同じようにカスタマイズするか、筆者のようにキーボードに油性ペンなどで書き込むと
わかりやすいが、カッコ悪いと言う意見も・・。

◎同期再生
Shiftキーを押しながら上記操作を行うと、起動しているVocalShifterすべてが同期して再生できる。Shiftキーを押しながらのマウス操作は筆者は苦手で、Shiftキーを押しながらならFボタンでしょう!

◎同時停止
Shiftキーを押しながら上記操作(■ボタンをマウスで操作するか、F3)。

◎個別MUTE
操作の前に「ファイル」→「設定」→「最小化時に同期再生しない」にチェックを入れておく必要があるが、この設定が有効になっていると、最小化したVocalShifterをMUTEすることができる。

*頻繁にMUTEを多用する方は、音声ファイルを読み込む前に、一つだけVocalShifterを起動し、「ファイル」→「設定」→「最小化時に同期再生しない」にチェックを入れて、一旦そのVocalShifterを終了します。すると、この設定がVocalShifterの初期化ファイルに保存され、次の起動から全てのVocalShifterがMUTE可能になります。初期化ファイルは、VocalShifterを終了する度に更新されるので、多重起動している場合
には最後に終了したVocalShifterの設定のみが有効になります。

 

 

○指定場所からの再生
 VocalShifter解析結果表示上部の時間尺部分をクリックすると、その時間部分にマークが入る。次に再生を操作すると、その時間場所から再生が始まる。同時同期再生の場合は、フォーカスのあるVocalShifterの時間マークが有効となり、他のVocalShifterもそれに追随する。

 *画面のスクロール
 VocalShifterは再生中、再生位置に合わせて画面がページめくりされるが(画面右上本のマークをONにすると)、再生中にも停止中にもマウスのスクロールホイールを回すことでフォーカスの合っているVocalShifterのみ、画面スクロールができる。(ただし、再生中は自動ページめくりが優先します)

 

○ボリュームとPAN
 この設定は同期再生時のみ機能するもの(単独再生時には無効)だが、「ファイル」→「プロパティ」の中に、その入力窓がある。同期再生時には複数信号が一つのサウンドデバイスに送られるため、クリップが発生しやすくなるが、ボリュームを適切に下げておくとクリップを避けることができる。数値は再生トラック数が2倍になるごとに-6dBずつ下げると効果的。
 PANは複数のモノの歌トラックがある場合、両方ともセンター定位になると識別しにくくなっていくが、PANの使用により識別したり、リサージュ波を観察するのに有効になる。

 


☆実習1
実際に上記の操作を行い、再生してみよう。
各修正を行う前に、聴きたい場所を即座に再生できるようになることが必要です!!



☆音程の自動補正
 ○フォーカス
 音程を自動補正するには、自動補正したいトラック(VocalShifter)にフォーカスを合わせる(その画面でクリックし画面上の青い帯が青い状態・・フォーカスが外れている状態では、この帯は灰色になる)必要がある。

 ○音程修正モード
 修正したいトラックのVocalShiterのモード(P、F、V、D、T、Pが各モード)を黒塗りPに合わせ、音程修正モードに入れる。(初期状態ではこのモードになっている) 

 ○範囲指定修正モード(選択ツール)
 P、F、V、D、T、Pの右隣の点線□が範囲指定モード(選択ツール)で、自動補正は指定された範囲内について行われる。(初期状態ではこのモードになっている)

 ○全選択
 フォーカスが合っている状態で、Ctrl+Aで画面全体が明るくなり、そのトラック全体が選択される。

 ○自動補正コマンド
 画面上でマウスを「右クリック」すると、音程修正関連のコマンドのメニューがあらわれる。自動補正はこのメニューの一番下で、そこをクリックするだけで実行される。

 


☆実習2
 実際に上記の操作を行い、音程を自動で修正してみよう。
もちろん修正したものを聴き、どのように修正されたのか確認の必要がある。音程が修正されるのだが、音程が正しくなったのかどうかは、音楽そのものの訓練を受けていなければ判定は困難かもしれない。しかし前半のAudacityを用いたオフセット調整と同様に、歌い手の表情を読むことなら誰でも可能かもしれない。なにせ「愛される歌」にしなければならないのだから。 

 
 ○表示
音程の表示カーブのオレンジ色線は修正前(初期値:オリジナル音程)で、黄色線が修正後(実際に再生されたりファイル再生される音程)なので、どこがどのように修正されたのかはこの線を眺めれば一目瞭然だ。


☆実習3
 全選択のまま、自動補正を2度、3度と繰り返し作用させてみよう。
この自動補正コマンドは、音程そのものと、ビブラートや細かな変移を分離し、音程のみに作用するアルゴリズムが採用されている。繰り返し作用させてもビブラートや細かな変移はほとんど影響を受けないが、表情が変化していくことを確認しよう。
どれくらいが最適な状態なのかは、聴き手により一致はしないかもしれないし、修正無しの状態が最も良いと感じるかもしれない。


 *自動補正で、VocalShifterは何に音程を合わせようとするか
 VocalShifterの音程解析表示/表示画面は縦軸が音程(周波数)、横軸が時間を表し、左端には音名(C、D、E、F = ド、レ、ミ)がある。
この各音名から右方向(時間方向)には「線」があるが、この線が「音程グリッド」と呼ばれるものです。人間の歌声は、この実習での曲のようにグリッドにピタリとは一致せず、ビブラート(正弦波のように見えることが多い)や細かな揺らぎに満ちています。(この一見不安定にも見える変動の中に歌の歌たる情報が秘められている・・)

 VocalShifterの自動補正(ver,1.3系以降の)は、このビブラートや細かな揺らぎと、その中にある「音程」を分離し、(つまり耳に聴こえる音程に近似の情報を)グリッドに近づけるように作用します。

 右クリックメニューにある「半音単位に丸める」や「平均値補正」は一度の操作で、グリッドジャストになりますが、自動補正ではアルゴリズム上グリッドとの一致は無く、複利的に(あるいはフラクタルに・・無限級数的に収束)処理回数ごとにグリッドに接近していきます。このアルゴリズムのおかげで、元の歌唱のニュアンスをよく残した、極めて自然な補正(人間の聴覚によく合致した)が可能になっているのです。

  自動補正の名の通り、自動で音程修正ができるのですが、自動とはいえ考慮しなければならないパラメータがいくつかあります。


 *基準ピッチ
 音楽には曲全体に秩序を与える重要なパラメータがあります。それが「基準ピッチ」と呼ばれるもので、A=440Hzなどのように記され、演奏前に基準ピッチに合わせる事を「チュ-ニング」といいます。この作業は極めて重要で、如何なる演奏でもチューニングが合っていないと、何の整合も秩序も、美も訪れないでしょう。すごくかっこ悪い結果になることが大部分です。

 ポップスではA4=440Hzとすることが多いのですが、クラシックなどでは443~445Hzにしていることも普通で、音楽の分野やスタイルによって基準ピッチをいくつにとっているのかを見極めることは、作業に先立ち重要なチェックポイントになります。

 実習の例曲「夕暮れ~並木道~」の伴奏は440Hzなので、とりあえずとくに変更は必要ないのですが、歌の音程解析結果を見てわかるように、必ずしもA4=440Hzのグリッドと歌の音程は一致していない部分が多く見られます。

 グリッドと一致していない原因は、歌手が音程をミスにより外してしまった、あるいは表現として、わざと音程を高く(あるいは低く)とった、の両方の可能性がありますが、例曲の場合はミスで一致しない部分は全体の数%以下と思います。つまり、一致しないほとんどの部分は、表現としてわざとその音程にしているということになります。(それ以外に歌手の固有の癖などもある)

歌は多くの場合、その楽曲の看板であり、現実の制作実態はさておき、「歌が伴奏を引き連れる」ものなのです。
極論すれば、基準ピッチが伴奏と一致していようがいまいが、音律が平均律だろうが純正律だろうが、そこに調和があり美があるなら、「何でもアリ」というのも真実です。しかしどこかで、何かに調和がなければ聴くに耐えないわけで、その一般的な「匙加減」を教えるのが「歌唱法」と呼ばれるものです。

 ○VocalShifterの基準ピッチも自由に設定することができる。設定窓は画面上部にあり、設定窓に数値を入力することで、基準ピッチを変更できる。この変更によりグリッドも上下に移動する。
☆ポップスでは、どのように歌われたのかろくに確認もせずに音程修正する輩がいるとも聞くが、VocalShifterの音程解析機能は強力で、その歌の基準ピッチはおろか音律(後述)まで解析し、グラフィカルにグリッドを歌に合わせ込むこともできる。



[実習4]  
・解析
ポップスなどの音楽の多くは、定型コード進行(音楽理論でいうカデンツ)により「解決(終止)」する。 如何に歌の音程が自由裁量であろうと、解決部分の音程が外れていてはいかにも後味が悪い。多くの歌手も「解決部分は何とか決めるぞ!」と思考し、実際にその部分は最大集中する。同様に歌いだし冒頭部分も重要なポイントだ。

歌の集中は、このように決めるべき要点を結ぶ形で行われるが、解析を行う場合も漫然と行うのではなく、集中すべき部分から見ていかなければならない。ちなみに例曲の冒頭部分は、筆者ならやりなおすだろう。(例曲の場合は20秒830~22秒750が、とりあえずの解決音)



・作業
音程に対してグリッドを合わせるには、マウスカーソルを画面左の音名尺へ持って行きShift+Ctrlを押しながら上下にドラッグすると、音名尺(とグリッドが)上下にスライドし、歌の音程カーブに対してグリッドの方を合わせ込むことができる。このときのA4=XXXの周波数が、測定できたその歌の基準ピッチになる。(音程方向、+ズームを5回程度クリックすると見やすくなる)



・考察
前のグリッドを合わせる作業を行って、キメ部分が聴覚的、周波数的に合わせも、それ以外の部分はグリッドから外れているところが多数ある。これは歌が下手だからではなく(もちろん下手な場合もあるが)、グリッドのような音階を歌おうと思っていないからだ。
グリッドのようなどこの半音も同じ間隔になる音階を「平均律」と呼ぶ。平均律は多くの鍵盤楽器やMIDIシーケンスで採用されている音律(ドレミ、あるいはテンペラメント)で、少なくとも人間の歌はこれを目指さない。(決め付けれいるように見えるが、生理的現象なので・・)詳しくは後半で。



・実験1
自動補正(平均律)の方法は実習3まででマスターできたことと思うが、平均律自動補正にも唯一のパラメータがある。基準ピッチだ。
もちろんA4=440Hzが最もよく合うはずなのだが、1Hzきざみに上下に変更し、自動補正してみよう。最後のキメはともかく、他の部分について、必ずしもA4=440Hzがよいわけではないことに気付くだろうか。
*元に戻すには右クリックメニューの「ピッチ初期化」でいつでも元に戻せる。
**音程の整合性もさることながら、前編のオフセットと同様に、歌い手の表情を感じ取ることも有効な判断方法だ。



・実験2
VocalShifterには自動補正だけではなく、マニュアル補正も充実している。全選択し、黄色い線部分を左クリックでつまみ、上下にシフトしてみよう。A4=XXXHzの窓はそのままなのでシフト量を読めないが、音程のある部分(黄色線があるところの時間尺をクリックし、カーソルを移し、そのときに表示されている画面上の音名、セントエラー、周波数、が補正後の値、Ctrlボタンを抑えた時の数値が補正前の値なので、どれくらいシフトしたのかは正確に把握できる。

 実験1の結果と実験2の結果印象を比較してみよう。
作業そのものは客観的データ処理の集積だが、判定は使用者や演奏者の主観で構わない。
それが歌という表現物だからだ。表現がマズければアピールできないだけの話だ。

 


☆実習5
実習2で自動補正(平均律)した例曲を全編聴き、おかしなところがないか調べよう。


☆自動で補正できない部分の修正
○自動補正するときに、元の歌の音程が1/2半音(50セント=4分音)以上のズレがある場合、自動補正のアルゴリズムは、より近いグリッドに近づけようとする。このため自動補正したときに「半音ズレ」になってしまう場合があるが、このような場合はその場所を範囲指定し、手動で修正しよう。

方法は、P、F、V、D、T、Pのモードスイッチを左端の「P」、その右隣点線□の「選択ツール」になっていることを確認し、問題のある範囲をドラッグする。ドラッグするとその範囲の色が濃くなっていることを確認し、問題の音程の黄色線にマウスカーソルを合わせるとカーソルが上下矢印に変わるので、修正する方向(低いなら高く、高すぎるなら低く)へドラッグする。
 平均律で作業している場合は、ドラッグするときにShiftキーを押しながら作業すると、半音単位にドラッグされます。


1分0秒320
1分36秒930
3分37秒310
3分38秒920
3分43秒110


 とくに気になる部分は上記の5ヶ所だが、この程度なら手動で修正すべきでしょう。

☆不思議なのは歌の1番の終端(22秒670)の、ビブラートの末尾だ。キメなければならない場所なのだが、元の歌では明らかに低めに入り、後半ビブラートでそれを補正するかのように高めにとっているが、やりすぎと思ったのか、下降しながら終わっている。自動補正後には、ピタリと入り迷い無くビブラートへつながる。

問題はビブラート終端で、歌単独で聴くと明らかに吊り上って聴こえるのに、伴奏とともに聴くと何らの問題も感じられない。
これを歌単独で聴いたときに正しく聴こえるように手動調整すると、低すぎる印象となり終端としてふさわしくなくなる。何が音程感を決めているものなのか、如何に判らないことが多いのか、思い知る。
  歌単独で聴いたときと、伴奏とともに聴いたときの音程感が一致しない、この妙なふるまいは、現在の自動補正のアルゴリズムの課題のようだ。

 そのような「半音ズレ」があまりに頻出する場合は、歌全体のピッチがずれていることもありうるので(聴けばわかるだろう)、上記の「実験2」の方法でグリッドを眺めながら、あらかじめシフトしておき、その後に自動補正を行うと能率的な作業ができる。


*☆聴き取りにくい部分を、聴き取りやすくする(コンプレッサモード)
○VocalShifterには音程修正以外に各種の機能が備わっている。歌の修正がを自動補正で行い、伴奏とともに聴き取り確認しようとすると、音量的なバランスの問題で、目的の音がうまく聴き取れない場合がある。歌の音量をプロパティにある音量調整で上げてもある程度には聴こえるようになるが、逆にそれまでは丁度よかったバランスの部分では歌が大きすぎるといった問題が生じる。このようなときはコンプレッサの出番だ。

 VocalShifterのコンプレッサは操作系が多少風変わりなので、慣れないと戸惑うかもしれないが、操作は以下のようになる。例曲では歌の2番の前半(43秒0~1分05秒0)が聴こえにくく、確認のためにももっとレベルを上げるか、コンプレッサで圧縮したい。
(全選択し、全編にコンプレッサを使用してもよい)  

・ドラッグで範囲指定(または総選択=Ctrl+A)
・Dモード(P、F、V、D、T、Pの)に切り替え、
・水色線のどこかにマウスカーソルを合わせ、カーソルが上下矢印に変化
・Ctrlボタンを押しながら、上方向に1cm程度ドラッグする。(訂正箇所)

 必ずドラッグ前にCtrlボタンを押し、そのままドラッグが終わるまでCtrlボタンを離さず、左クリックボタンから指が離れてからCtrlボタンを離すこと。途中でCtrlボタンから指が離れると、ただのレベルアップになります。



☆実習6
 上記の指定範囲 (43秒0~1分05秒0)を範囲選択し、コンプレッサ処理により圧縮し、伴奏との音量バランスが崩れないようにしてみよう。

 歌単独、歌+伴奏で聴き、印象を比較しよう。歌単独の場合、コンプレッサ処理によりもともと低レベルであまり聴こえなかった部分(ノイズやブレス音など)が強く聴こえるようになるが、ダイナミクスモード(Dを選ぶ)の右クリックモードにある「増幅率制限」に適切な数値(16~30dB程度)を入力し「OK」すると、このブリージングはある程度抑制される。最適値を見出してみよう。

 もしコンプレッサの影響がファイル出力に影響することを望まず、音程修正の作業確認にのみ使用したい場合は、ファイル出力の直前(音程修正作業の終了時)に、全選択し、Dモードの右クリックで「ダイナミクス初期化」を実行することで、元の状態に戻すことができる。

☆ファイル出力
 とくに注意することは無い(読み込みファイルと同サンプリング周波数、同サンプル数になるため)が、作業のやり直しや手直しを行うには、

1)読み込みに使用した元のオーディオファイルと
2)編集データファイルの両方

を保存しておく必要がある。VocalShifterからの出力ファイルの保存は、必須ではない。
なぜなら上記の2つのファイルがあれば、出力ファイルはすぐに作成できるが、元のオーディオファイルを失ってしまうと、編集データファイルは無意味化してしまうので注意してください。

 とくにオーディオ出力ファイルの名称を、元のオーディオファイルと同じにすると、上書き(警告がでる)されるので、上書きを実行してしまうと、元のオーディオデータが失われてしまうからです。注意しましょう。

より高度な音程修正 (オプション編)へつづく