デジタルオーディオの基礎の基礎:PCMデータについて

PCMデータ(Pulse Code Modulation:パルス符号変調)はデジタルでオーディオデータを扱う上で最も基本となるデータ形式です。
これを正確に理解していなければDAW等の設定項目で一部意味がわからない部分等が出てきてしまいますので、簡単に書いておきましょう。
(今日書く内容は基礎の基礎レベルなので、恐らく多くの人はとっくに理解している事だと思いますが、本当の初心者の方だとわかっていない可能性もあるのであえて記事にしています)

さて、音の正体は空気の振動というのは小学校の理科で習う内容なので今更だと思いますが、オーディオシステムでこの空気の振動を作り出しているのがスピーカーです。
で、スピーカーはコーン紙を前後に高速に動かす事によって音の振動を作り出している訳ですが、この前後運動を時系列で並べた物が音の波形データです。
音の波形データは、自然界に存在する時にはアナログデータですのでそのままではコンピュータで扱う事は出来ません。
ということで、このアナログの波形データを一定時間間隔で観測し、その時の観測値を取り出して並べなおします。
この観測値がサンプル値、取り出して並べたデータがPCMデータとなるのです。
この時、一定時間間隔をどれ位の時間にするか、の設定がサンプリングレート設定で、通常はヘルツ(Hz)という単位で設定します。
ヘルツというのは1秒間にそれが何回発生するかという単位で、CDのサンプリングレートである44.1KHz=44100Hzの場合、サンプル値を1秒間に44100個分用意する、という事になります。
またこのサンプリングレートというのは、オーディオデータの中に含む事の出来る最大周波数も同時に設定される事になります。
サンプリングレートが44.1KHzの場合、オーディオデータに含む事の出来る音の最高周波数は44.1/2=22.05KHz=22050Hzとなります。
つまり、サンプリングレートの半分の値の周波数が、そのサンプリングレートのオーディオデータに含む事の出来る最高周波数になるのです。
これ以上高音の音を再現しようとするとエイリアシングという現象が発生してしまうのですが、それはちょっとだけ高度な話題なのでここでは語りません。
当然、大きい方が高音質ですが、処理が重くなりデータ容量も大きくなります。
また、サンプル値が何Bitのデータかがサンプルビット深度となります。
これは、波の動きをどこまで細かく再現するかの設定であり、CDでは16Bitとなっています。
この値も当然大きい方が高音質なのですが、やはり処理が重くなりデータ容量も大きくなります。
CDの場合はサンプリングレート=44.1KHz、サンプルビット深度=16Bit、ということで1秒間に88200Byte、実際にはステレオなので倍の176400Byteのデータを処理しているという事になります。

PCMデータについてある程度理解出来ましたでしょうか?
ここが判っていないとどうにもなりませんので、まずはこの部分は完璧に理解してしまうようにしましょうね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です