高レートサンプリングによる高音質な録音術




MP3データを作成する時、元の音源をまずWavデータ等に録音すると思いますが、
ここの方法を改善することで、かなりの音質向上を得ることが出来ます。

今回は、24bit 96KHzの録音環境をお持ちの方の為のTipをご紹介します。

ちなみに今回の実験での作成環境は、

CPU:PentiumIII 1000BMHz
メモリ:SDRAM PC133 CL2 1.2GB
HDD:ATA/100 160GB

SoundCard:M-AUDIO DELTA Audiophile 2496
Cable:MONSTER CABLE BIL200-1M (LINE-IN)

Record & Wav edit:Steinberg Nuendo v2.01
MP3Encoder:Steinberg Nuendo v2.01

です。

録音の際は、24bit 96KHzのアナログ録音で行い、
CD Player(アナログ)からと、YAMAHA MU500からの2パターンで実験しました。


この録音でデータを作っても最終的には16bit 44.1KHzにしないといけないから、
あまり意味ないじゃないか!と思われるでしょう。
しかし、それは違います。
高レートサンプリングという技術を使えば、
同じ16bit 44.1KHzでも、かなりの音質の差が現れます。

簡単にこの技術の説明をしますと、
高レートで録音したものをデジタル上で低レートのものに変換するというもので、
別にこれはデータを圧縮して無理矢理いれている訳ではないのです。

録音の際に44KHzで録音すると、
その半分の22KHz付近に壁を設けてそれ以上の周波数を遮断します。
この壁の事をバンドリミットといいます。

しかしバンドリミットはそこにどーんと置けるというものではなく、
一定位置から減衰させて最後には消えてしまうというもので、
ようするに、MIDIでもよく使う「ローパスフィルタ」によって遮断しているという訳なのです。
この際に使われるローパスフィルタを、アンチ・エイリアシング・フィルタといいます。

録音の際に使われるアンチ・エイリアシング・フィルタはアナログフィルタです。
しかしこれが厄介なものでして、
この処理を行うにはフィルタの角度をかなり急なものにしないとなりません。
しかし急な角度にすると、今度は逆に音色が著しく変化してしまいます。
(LPFの数値を上げるとハッキリと明るくなるのがその例です。)
フィルタというものは位相を操作して実現するものですので、
フィルタをかけることによって、他の音域にも少なからず影響が出ます。

フィルタの角度にコレ!という決定的な位置は未だに無く、
プロのエンジニアもこの角度に施行錯誤しているというのが事実です。
なので、この角度はかなり慎重にきめないとならないのです。

そこで解決策として出たのが、今回の「高レイトサンプリング」という技術です。
最終的なレートとなる44.1KHzよりもはるかに高いレートで録音することにより、
可聴音域内のフィルタによる音質変化をなくするというものです。

例えば96KHzで録音した場合は48KHz付近にフィルタがかかる為、
実際の可聴音域である22KHzには全く影響がありません。

そして実際に44.1KHzにする際はその半分の48KHzからフィルタをかけます。

あんまり変わらんじゃないか!という意見もあるかと思いますが、
A/Dコンバートの際の劣化は無かった訳ですし、
デジタル領域ではフィルタリングに急な角度を要さないため、
可聴音域に殆ど影響ない状態で44KHzにコンバートすることが可能なのです。

さて、次はビットレートの方です。

ビットレートの方も、
通常の録音では16bitのうちの1〜3bitをノイズ処理にとられてしまうので、
どんなに良い機材を使っても、
現実として最高11bit程度の再現力しかなくなってしまうのです。

だから録音の際に24bitで録音すれば、
このノイズの処理(後述)に取られても20bitほどがまるまる残りますので、
単純計算で、54dBものダイナミックレンジの差が出来るわけです。

ダイナミックレンジ=実質のbit数×6(dB)

その後16bitに戻す際も、ディザリングという処理を行うことにより、
この実質20bitほどの解像度を損なうことなく処理することが出来ます。

ディザリングとは、オーディオ信号にディザ信号という特殊な信号を加え、
微弱信号の解像度を向上させるというものです。

微弱信号とは、例えば16bitで録音した時に音量を絞って録音し、
8bit程度しか使用しなかった時などの事で、
この際は48dBというとても微弱なレベルで録音したことになり、
このままでは気付かないでしょうが、
ノーマライズなどでレベルを上げると一緒に量子化エラーまで増幅されてしまうので、
結果的にノイズが耳につく結果となってしまいます。

量子化エラーとは、アナログ信号とデジタル信号の誤差のことで、
この誤差の最大幅は1/2LsB(LsBとは、例えば16bitなら16番目のビットのこと。)で、
これが耳につくか否かは、ビット数の大きさにより決まります。
16bitのうちの1/2LsBならばそんなに影響は無いでしょうが、(3dBくらいですね。)
8bitやそれ以下ではかなりの占有率になってしまいます。

しかし、これを防ぐからといってあまりレベルを上げ過ぎても、
今度はダイナミックレンジの許容範囲を超えてしまい、
デジタルディストーションというノイズを引き起こしてしまいます。
(これは皆さん経験あると思います。)

さて、話を戻しますが、
16bitで録音した場合ピークレベルを87dBより下回るものは、
概数化エラーを含め、1bitでしか表現されません。
(概数化エラーとは、アナログとデジタル比較演算ミスによるエラー)
すなわち、この領域内の音は全て短形波で現され、
その短形波から全く異なるあらたな倍音が発生してしまうのです。
ごくわずかではあるものの、D/Aコンバートの際のエイリアシングの原因となってしまいます。

これを解決するためにディザリングが行われるのですが、
これを誤って使用すると逆に信号自体のノイズを増やす結果となってしまいます。

しかしここをキチンと処理してやると、名目16bitのダイナミックレンジを、
18〜19bit相当の解像度に向上することが可能なのです。

これにより追加されたディザ信号は、
量子化エラーによる周波数成分を除去し易くするノイズシェーピングという技術により
人間の耳では聞き取りにくい周波数域に追いやられます。


このハイビット化のメリットは、
量子化ビット数が長くなることでヘッドルームに余裕が出来るという点です。
ヘッドルームとは、実際の音声信号のレベルに対し、
あとどれくらいのレベルまで扱えるかという度合いを示すもので、
ダイナミックレンジを超えることで起こるデジタルディストーション対策で、
特に重要な部分です。
トランジェント(機械が静止状態から稼動状態になるまでの過程)や
最大音量レベルをダイナミックレンジ内に収めるためだけに、
何ビットかをヘッドルーム用に使用してしまうため、
結果としてダイナミックレンジが狭まってしまいます。

しかし、24bitで録音した場合ヘッドルームやノイズ・フロアに3〜4bit取られても、
16bitで録音した時とは比べ物にならないダイナミックレンジを得られ、
極めてソフトな信号の解像度も増し、低レベル信号の量子化エラーも少なくなるので、
16bitの際耳障りだったフェードイン・アウトの時のヒスノイズやクラック音等も気にならず、
最後までクリアな音質が保たれます。

デジタル領域でディザリング等の音質保持機能を使いコンバートすることで、
可聴音域内の24bitの音質を損なうことなく、
16bitの表現力を最大限に活かすことが出来るという訳です。

しかも、音が良くなった上に同じ16bit 44KHzなので容量は変わりません。
MP3化した時も可聴音域内のデータを殆ど損ないませんので、
手軽なサイズで高音質が楽しめるのです。


ただ、生楽器などの演奏ではこれを最大限に活かせるのですが、
電子楽器等は音源内ですでにバンドリミットされているので、あまり効果がないかもしれません。
(倍音等が含まれるので、多少なりとも効果はあると思います。)

しかし、SACDのような高レートなメディアを録音するような場合は特に効果的です。
最終的にMP3のような形にするにしても、SACDのクオリティを活かしたまま再現することができます。


この行程をしっかり守ってやらないと逆に音質低下につながる事もありますし、
24bit96KHzに耐えられるCPUの処理速度、HDDやメモリの容量等が無いと難しいのですが、
成功すれば一歩上を行く高音質の録音が出来ること請け合いですので、
もしこの環境がある方は、是非試してみて下さい。



DTM Tips トップに戻る