カテゴリー別アーカイブ: DTM雑知識

DTMを行う上で、知っていると役に立つ場合もある知識集

VSTプラグインに時々あるリニアフェーズ、あるいは直線位相って?

VSTプラグインの説明を読んでいると時々リニアフェーズだとか直線位相だとかの単語が出てきます。
(リニアフェーズと直線位相は全く同じ意味で、単に英語か日本語かの違いだけです)
これは何を意味しているのでしょう?
それを知るにはまず、位相とは何かを知る必要があります。

位相とは

位相とは、波がどの位置から始まるかを示した値、の事です。
基本的に位相はラジアンで表されます。
つまり、0~2πまでの範囲で表され、0と2πが同じ位置となる関係となっています。
サイン波1周期分の波を考えたときに、波の開始位置がどこから始まるかによって一定範囲内の波の形が変化するので、音を混ぜ合わせた時に位相がずれていると思わぬ事が起こる場合があります。

位相0のサイン波


位相πのサイン波

位相がずれると何が起こるか?

上記2つは位相差がπ、つまり180°ずれているサイン波ですが、どちらも同じ周波数を表しています。
しかし、この2つのサイン波を合成するとそれぞれが打ち消しあって無音になってしまいます。
位相がどちらも同じだった場合はボリュームが2倍の音になります。
つまり、位相がずれる事によって合成結果の音のボリュームが変化するのです。
この法則は全ての倍音にも当てはまります。
従って、例えばセンドで何かエフェクトをかけてそれを戻した時に位相がπずれていると、結果的に(極端な例ですが)エフェクトで消えた音と、エフェクトで作成された音だけが残りエフェクト前と後で同じ周波数を保っている音は全て消えてしまう、といったことがありえる事になります。
(無論、実際にはこんなに極端なことは起こらない訳ですが、理論上そうなる可能性があるという話です)

リニアフェーズ、あるいは直線位相と呼ばれるプラグインは、こういった事が起こらないように位相ずれを完全に無くすように設計されているエフェクトの事です。
この特性を持ったプラグインを使用するとエフェクトの使用前と後で位相の変化が起こらない為、センドして戻してといった使い方をしても全く問題なく音を合成出来るようになるのです。
上記のような極端な事は起こらずとも、やはり位相がずれた音を合成してしまうと若干響きにおかしな部分が発生してしまいがちです。
マスタリング時のような、音に変化が起こって欲しくない状況の場合は、可能な限りリニアフェーズなエフェクトを使用するようにしましょう。

90年代にDTMでMIDIデータを作っていた人がすべき勉強

DTMに使用する音源は、昔はMIDI音源とかDTM音源とか呼ばれていた、一種のPCM系シンセサイザーでした。
これは、基本的にはGM規格に基づいて音色が配置され、バンク番号とプログラム番号が一致すればどの音源を使用しても大体同じ感じの曲に聴こえるという風な狙いで作られていました。
しかし実際にはやはり音源が違うとニュアンスが変わってしまい、別の曲に聴こえる事も少なくなかった為、当時公開されていたMIDIデータはSC-55mk2専用、とかそういった対象音源が指定されていました。
時は変わって現在
今、DTMに使用する音源は普通はソフトシンセとなるでしょう。
ハードウェアのシンセを用いる場合もあるかもしれませんが、それでも主流がソフトシンセなのは間違いありません。
そしてこのソフトシンセ、大抵の物はGM規格なんて無視しているので当然MIDIデータだけ貰ったところで同じソフトシンセで再生させなければ全く違う曲になってしまいます。
しかし、昔は今ほどネットワークの速度が速くなかったためにMIDIデータでの公開が主流でしたが、今はもう十分ネットワーク速度が速くなっているのでmp3等、実際の音での公開が主流になっています。
(仕事として曲データを作成する場合は、機種を指定されてMIDIデータを作成することが多いというのは昔とそれ程変わっていませんが)
そのため、今は昔よりも曲データをアップする人に求められるスキルが高まっているように思います。
昔はMIDIデータでの公開が主流であった為、ある意味ある程度編集にも限界があったわけです。
無論、コントロールチェンジやRPNを駆使して音を作りまくったデータを公開する場合も多かった訳ですが、それでも今ほど編集の自由度はありませんでした。
しかし、今は最終的に音のデータとして公開するのが主流になっている為、編集時に出来る事が増えています。
最初の旋律作成時の工夫の辺りは昔と変わらないのですが、その後音データに加工した後更に手を加える事が出来る為、出来上がりの音をかなりコントロールする事が出来るようになっています。
その結果、この出来上がり段階での編集をあまり行っていないデータと、出来上がり段階での編集もしっかり行っているデータとで聴き比べられ、旋律データの部分は良い曲なのに最終的に良い評価を貰えないというパターンが発生します。
昔、MIDIデータを公開して曲作りにかなり自信があるような人でも、その後勉強を怠ってしまったら他の人に追い抜かれていくという状況が出来上がってしまっています。
また最初の旋律データの作成に関しても、今は初音ミク等のボーカロイド音源特有のテクニックなど、昔には無かったテクニックが存在している為にこの部分に関しても新たに勉強しなければならない事柄が増えています。

昔、DTMで曲を作っていたが暫く休止して、最近になって復帰した方々は、こういった部分について十分に勉強しなおさなければならないという点に注意しましょう。

倍音と和音

和音というのは、複数の音を積み重ねて響かせた物です。
主に鍵盤の白鍵を1つ飛ばしに積み重ねていったような形の物が使われます。
(実際にはオクターブ単位で上下の入れ替えがあったりで単純な形をしている事はあまりありませんが)
例えばドミソ、とかそういう形ですね。
この形の時、平均率で調律された楽器(普通は平均率を使います)でこの和音を奏でると、ドの音の周波数を1として考えた時にそれぞれ1.259921、1.498307という周波数になります。
で、以前倍音は基となる音の一定倍率の音である、と書いたと思いますが、この定義のままだと和音もまた何らかの倍音の1種という考え方になってしまう事がわかると思います。
だからかどうかはわかりませんが、実際に倍音として扱われる音は、基となる音の整数倍の周波数の音、ということになっています。
上記のような形だと倍音としては扱わない、という事になっているんですね。
しかし、実は和音であっても整数倍の周波数を持つ物があります。
それはオクターブ単位で離れた位置にある音との和音です。
例えば一番低い音から数えて3オクターブ目のドと、4オクターブ目のドを同時に鳴らす、等の場合ですね。
この場合は、鳴らしている音がもしサイン派だった場合は2倍の周波数の倍音を含んだ音と同じになります。
DTMでは時々、このようにしてオクターブ単位で音を積み重ねることによって音に厚みを持たせるテクニックが使用されますが、理論的にはオクターブ単位に積み重ねた音は1つの音の2倍音を含んだ音と同等と見なせる為なんですね。

DTMやるなら楽器は弾けなくても良い?

DTMなら、理論的には楽器が全く弾けなくても何も問題はありません。
実際、本当に何も弾けなくても困ることは殆ど無いのですが、それでもちょっと曲を作るとなるとやはり楽器が多少わかった方が便利な事も多々あったりします。
例えば、思いついたフレーズを実際に演奏してみてどのように聴こえるかを確認する作業でも、一々打ち込むよりは実際に弾いて確認した方が早いのです。
打ち込んでどうにかしようとすると実際の演奏時間よりも長く作業時間が掛かる場合が多いのですが、楽器の演奏なら実際の演奏時間だけが掛かる時間となります。
大抵の場合、作業時間が倍は違ってきますので、最終的な出来上がりにわりと大きな影響を与えます。
また、この場合、演奏してお客さんに聴かせるという目的では無いので完璧に演奏出来る必要は無く、片手で簡単に弾ける程度のレベルでもわりとどうにかなったりします。
(つまり、専門の演奏家のような高度な演奏が出来る必要は無い)
弾きなおす必要も通常は無いので時間の無駄もありません。

DTMだけで、楽器を全く触らなくても何も問題が無いパターンもあります。
例えば既存の曲で、既に譜面もあるような場合は後はただ打ち込めば済む話です。
このパターンだと、楽器で演奏してどうにかしようとしても完璧な演奏が出来るまで何回も録音し直すということもある事を考えれば、最初から打ち込みで済ませたほうが早かったりもします。
演奏でどうにかしようとする場合、このパターンの場合は演奏をお客さんに聴かせるのが目的になる訳ですから演奏にも完璧さが求められ、時間が掛かります。
打ち込みなら最初から間違いが無いので無駄がありません。
このように、楽器が出来た方が良い場合と出来なくても困らない場合があるわけです。
自分の目的のために多少楽器が弾けた方が良いかもな?と思った場合は、とりあえず簡単なMIDIキーボードを買ってきて片手で演奏出来るようになるだけでも大分変わってきますので、チャレンジしてみては如何でしょうか?

エンベロープの話の続き

さて、エンベロープの話の続きです。
エンベロープではアタックの早い/遅いなどを設定出来るわけですが、ここで遅いアタックに設定した場合の注意です。
まぁこれは一般の打ち込みテクニックでよく言われていることなので、その繰り返しになるのですが、遅いアタックに設定した場合は打ち込みタイミングを少し前方にずらすようにしましょう。
これは、人間が耳で音を感じる時に、実際に鳴り始めた瞬間を感じるのではなくある程度以上ボリュームが大きくなってから感じるということにつながるのですが、遅いアタックに設定するとボリュームが大きくなるまでに時間がかかる為に発音が遅れて感じるのです。
実際には、ベロシティが小さく、アタックが遅い音の場合はいつ鳴り出したのか気付かないで、いつの間にか鳴っているというようになるので、この場合には多少発音タイミングがずれていようがあまり関係ないので良いのですが、ベロシティがある程度大きい場合にはやはり目立ってしまいますので、気をつけるようにしましょう。

エンベロープ(ADSR)の話

エンベロープというのは、音量の時間的な変化のことです。
鍵盤を押し、発音した後に音がどのようにボリューム変化を起こすのかを設定するのがエンベロープの役割となります。
音量と聞くと、なんとなく音色とは関係無さそうなイメージを持たれる方もいらっしゃるかと思いますがさにあらず。
意外とこのエンベロープというのは音色に影響を与えるものなんです。

特にアタックの部分が顕著なんですが、発音を開始してから最大のボリュームになるまでにどれ位の時間が掛かるかによって人間の感じる音の感じというのはかなり変わってきます。
最大音量まで0.01秒とかそれ位の速さで変化した場合、かなり鋭いアタックとなり印象強い音になります。
最大音量まで1秒位かけるような音の場合、かなりふんわりとした印象の音になります。
(PAD系の音なんかはそんな感じですよね)
またサスティーンレベルがほぼ100%になっている場合で、アタックタイムが極短い時間に設定されている場合はオルガンのような印象を与えます。
逆に、ディケイタイムを5秒程度に設定し、サスティーンレベルが0になっている場合はピアノ的な減衰音になります。
倍音構成が同じであっても、このエンベロープの設定によってまた音色の持つイメージが異なってきますので、音を作る場合はあらかじめしっかりと方向性を決めてかからないとどっちつかずな音になってしまいがちです。
注意しましょう。

倍音の基本

シンセサイザーの類を使うことによって色々な音を鳴らすことが出来るわけですが、シンセサイザーで音作りをするにはまず「音」そのものについて知っておくべきです。

シンセサイザーでの音作りを行う場合、「倍音」というものについて理解しておくことが重要です。
倍音というのは、簡単に言えば音色の素です。
楽器がそれぞれ違う音色を持っているのは、楽器ごとに違う倍音を含んでいる為、と言えます。

倍音というのは、基準となる周波数に対して一定倍した周波数の音、のことです。
シンセサイザーの鍵盤を押して、その鍵盤の本来の音の高さよりも一定倍率高い、あるいは低い音が同時に鳴っている、ということです。
よくあるのが周波数の2倍の音程で、これを鳴らすと基となる音の1オクターブ上の音が同時に鳴り響きます。
(12弦ギターなんかがオクターブ上の音を鳴らしてますね)
この時、どんな倍率の倍音がどれ位含まれていて、それが時間経過によりどう変化するかによって音色というものが決定されるのです。

たとえば減算系の音作りをするシンセサイザー(アナログシンセなど)の場合、最初にオシレーターで非常に倍音が多く含まれた音を作成しておき、その後フィルターによりその倍音をどんどん削っていくことにより音作りを行っています。
(フィルターで音を削るから「減算」なのです)
この時、どれ位削るかによって音の印象が変わります。
あまり削らなかった場合は輪郭のはっきりした、非常に印象の強い音になります。
思い切り削りまくった場合は輪郭が丸くなり、柔らかく暖かい音になります。
これは倍音がどれくらい含まれているかによって変わってきているのです。
倍音が多く含まれている場合、1つ音を鳴らすとそれよりももっとずっと高い音も同時に沢山鳴る事になるので、印象がはっきりしてきます。
逆に倍音が殆ど含まれていない場合、音を鳴らしてもその音よりも高い音が殆ど鳴らない為、相対的に音が柔らかい印象になるのです。
波形で見ると、倍音が殆ど含まれていない音はサイン波に近くなります。
実はサイン波というのは、特定の音の周波数が1個だけ含まれている時の波形なのです。