テック
最も感情的なリスナーにとって、この音は最も甘美なものとなるかもしれません。
シカゴ・マスタリング・サービスのエンジニア、ジェイソン・ワードがマスタリング室で比較のために楽曲を読み込んでいる。写真提供:クリス・フォレスマン
シカゴ・マスタリング・サービスのエンジニア、ジェイソン・ワードがマスタリング室で比較のために楽曲を読み込んでいる。写真提供:クリス・フォレスマン
iTunes で配信される楽曲の品質向上を目指す Apple の取り組みは、同社の Mastered for iTunes プログラムで正式に実現されているが、本当に音楽の音質は向上するのだろうか?
Mastered for iTunesプログラムに関する最初のレポートの後、一部の読者からは、圧縮されたAACファイルを非圧縮の16ビット44.1kHz CD標準オーディオに匹敵する音質にできるのかという疑問の声が上がりました。また、最高の音質を得るには、スタジオで作成されたオリジナルの24ビット96kHzファイルにアクセスできるようにすべきだと考える読者もいました。さらに、iTunes PlusのトラックとCDオーディオの違いを実際に聞き分けられる人はほとんどいないのだから、iTunesの音質向上に努力する意味がないのではないかという意見もありました。
英国のレコーディング・エンジニア、イアン・シェパード氏は、iTunes のオーディオファイルを CD 版に近づけるために特別にマスタリングするプロセス全体を、単なる「ナンセンス」と呼んだ。
「本当の巧妙な操作はまさにここだと考えています」とシェパード氏はCE Proに語った。「非可逆コーデックへの最適化は本来必要ないはずですし、私のテストでも(少なくともレッド・ホット・チリ・ペッパーズの場合は)必要ないことが分かりました。」
最近、一部のミュージシャンやレコード会社の幹部が、ファンのiPodやiPhoneに収録される音源は、スタジオでテープやハードドライブに録音された音源よりもはるかに品質が低いと嘆いています。業界関係者の中には、より高解像度のダウンロードを求める声もありますが、Appleの現在の解決策は、長年認められてきた(必ずしも従われているわけではないものの)業界のベストプラクティスを踏襲し、改良された圧縮ツールチェーンを採用することで、高品質のマスターレコーディングから最大限の音質を引き出しつつ、標準的な256kbps AAC iTunes Plusファイルを生成するというものです。
シェパード氏は、Appleの技術ガイドラインを高く評価した。このガイドラインでは、マスタリングエンジニアに対し、ダイナミックレンジの圧縮を少なくし、オーディオレベルを極限まで押し上げないようにし、24/96ファイルを提出して16/44.1圧縮されたiTunes Plusトラックに直接変換するよう推奨している。しかし、シェパード氏は、そのような高品質のファイルを提出しても最終的な音質に大きな違いが出るとは考えていない。シェパード氏の結論を受けて、CE ProはMastered for iTunesは単なる「マーケティングの誇大広告」に過ぎないと主張した。
そこで、Mastered for iTunesの技術的側面をさらに深く掘り下げることにしました。また、Masterdiskの例に倣うことで何か良い点、悪い点があるかを確認するために、独自のテストもいくつか実施しました。
シカゴ・マスタリング・サービスのエンジニア、ジェイソン・ワード氏とボブ・ウェストン氏に協力を依頼しました。二人とも、ノブを少し調整するだけでiTunesの音質が向上するとは到底思えませんでした。しかし、このプロセスを通して、圧縮されたiTunes Plusトラックの音質はほんの少しの作業で確実に向上できること、Appleの改良された圧縮プロセスによって音質が向上すること、そして24/96ファイルは一般ユーザーにとって適切なフォーマットではないことを学びました。
マスタリングエンジニアは、レコード、カセットテープ、CDで曲が主観的に「より良く」聞こえるように、ノブを微調整します。iTunes Plusは、単に別のターゲットフォーマットに過ぎません。クレジット:クリス・フォレスマン
多ければ多いほど少ない
人間の聴覚、数学、そしてオーディオ機器にはそれぞれ限界があります。これらが相まって、スタジオ直送の24ビット96kHz(一部のファイルは192kHzという高いサンプリングレートで販売されています)のオーディオファイルを販売することは、実用的ではないにせよ、全く役に立たないと言えるでしょう。
デジタル化されたオーディオの基本的な側面を見てみましょう。ファイルは通常、ビット深度とサンプリング周波数で指定されます。例えば、オーディオCDでは16ビット44.1kHzが標準として使用されています。ビット深度は、最も小さな音から最も大きな音までのオーディオ録音のダイナミックレンジを決定します。サンプリングレートは、歪みなく正確に再現できる最大周波数を決定します。
各サンプルに 16 ビットを使用することで、最大 96dB のダイナミック レンジを実現できます (最新の信号処理技術を使用すれば、最大 120dB のダイナミック レンジを正確に録音および再生することも可能です)。最新のダイナミック レコーディングでは、ダイナミック レンジが 60dB を超えることはほとんどないため、16 ビット オーディオは、ほぼすべてのオーディオ ソースのダイナミック レンジを完全に正確にキャプチャします。
24ビットに移行すると、ダイナミックレンジは144dBに増加します。144dBの音域全体を再生できるオーディオ機器をお持ちだと仮定します(一般消費者向けにそのような機器は知られていませんが)。そして、その全音域を聞き取れるほど音量を上げたとします。最も大きな音は、永久的な難聴、あるいは場合によっては死に至るほどの音量です。
デジタル録音で捉えられる最大周波数は、サンプリングレートのちょうど半分です。デジタル信号処理におけるこの事実は、ナイキスト-シャノンのサンプリング定理によってもたらされ、数学的に疑いようのない真理です。44.1kHzでサンプリングされたオーディオは、最大22.05kHzの周波数を再生できます。96kHzでサンプリングされたオーディオは、最大48kHzの周波数を再生できます。そして、192kHzでサンプリングされたオーディオ(一部のスタジオでは、このような高レートに対応する機器とソフトウェアを使用しています)は、最大96kHzの周波数を再生できます。
しかし、人間の耳の理想的な周波数帯域は、一般的に約20Hzから20kHzです。この帯域は人によって異なり、24kHzまで聞き取れる人もいれば、それよりずっと低い周波数まで聞き取れる人もいます。また、耳の周波数応答は加齢とともに低下します。ほとんどのリスナーにとって、44.1kHzのサンプリングレートは、聞き取れるすべての周波数帯域、そしてそれ以上の周波数帯域を再生することができます。
さらに、高周波の超音波オーディオ ファイルを一般的な再生機器に強制的に通そうとすると、歪みは減るどころか、むしろ増えてしまいます。
「オーディオトランスデューサーもパワーアンプも歪みから逃れることはできず、歪みは最低周波数と最高周波数で急激に増加する傾向があります」と、Ogg Vorbisオーディオフォーマットを開発したXiph Foundation創設者のクリス・モンゴメリー氏は述べています。「同じトランスデューサーが可聴周波数成分とともに超音波を再生する場合、非線形性によって超音波成分の一部が可聴帯域にシフトし、可聴スペクトル全体を覆う制御不能な相互変調歪み成分の噴出を引き起こします。パワーアンプの非線形性も同様の効果を生み出します。」
これらの事実を踏まえると、24/96オーディオは一般的な再生シナリオには過剰であり、そのため消費者に直接販売されることはほとんどありません。しかし、このような高解像度オーディオは、複数のオーディオトラックをデジタルエフェクトソフトウェアで処理し、それらをミックスして1つの2チャンネルステレオトラックを作成するスタジオでは有用です。拡張されたダイナミックレンジと周波数特性によって得られる「ヘッドルーム」により、レコーディングエンジニアは様々な信号処理エフェクトやミキシング戦略を適用しながら、これらの処理によって通常発生するノイズを除去する余裕を残すことができます。
Appleは、オーディオエンジニアに対し、可能な限り最高品質のオーディオファイルを録音して提出することを推奨しています。これは通常、デジタル録音、またはアナログマスターからサンプリングした24/96ファイルを指します。しかし、そのようなオーディオファイルが聴くのに役立たないのであれば、なぜAppleはそれを要求するのでしょうか?
「iTunes向けにマスタリング」
マスタリングエンジニアは、CD再生用のマスターファイルを作成する際に、レコーディングスタジオから提出された24/96ファイルを16/44.1にダウンサンプリングします。このプロセスでは、マスタリングエンジニアは通常、レベル、ダイナミックコンプレッション、イコライゼーションを調整し、ソースから「良い」オーディオを最大限引き出しながら、「悪い」オーディオ、つまりノイズを可能な限り排除します。
(ビニールなどの他の形式のマスタリングも同様で、各形式には独自の周波数応答特性と制限があります。)
アンディ・ヴァンデットクレジット: Masterdisk
Appleのガイドラインでは、エンジニアが過度の圧縮や音量の限界まで不必要に音量を上げないよう推奨されていますが、商業的に制作された音楽では、これらの手法は一般的に行われています。こうしたツールの過剰な使用は、悪名高い「ラウドネス戦争」を引き起こしました。これは、あるレコードプロデューサーが他のレコードよりも音量を上げようと競い合うというものです。その結果、現代の録音の中には、ダイナミックレンジの限界で「クリップ」された信号による歪みのために、実際には音質が悪くなっているものもあります。
マスターディスクのエンジニア、アンディ・ヴァンデット氏はArs誌に対し、一部のプロデューサーは音を歪ませるマスタリング技術を求めるものの、自身は普段はそのような手法は取らないと語った。また、最近Rushの全カタログをリマスタリングした際にも、同様の手法は避けたという。
「iTunes向けのマスタリングと音量は全く関係ありません。音量を上げることが私の目標だったことは一度もありません。常に目指していたのは『より豊かな』サウンドです」とヴァンデットは語った。「音量を上げることで音量が大きくなることもありましたが、リスナーが30年もの間慣れ親しんできたダイナミクスを壊したくはありませんでした。」
「大音量」の録音が本質的に悪いというわけではない。「グリーン・デイの『アメリカン・イディオット』は素晴らしいサウンドですが、とにかく音量が大きいんです」とヴァンデットは説明する。「あの音量を実現しつつ、良い音質を維持できるでしょうか?そこがプロとアマチュアの違いです。」
24/96 スタジオファイルから16/44.1 CDマスターファイルへと、可能な限り有効なダイナミックレンジをフィルタリングすることが、簡単に言えばマスタリングプロセスです。iTunes Plusのトラックも16/44.1なので、CDマスタリング用に作成されたファイルを使用して、iTunesで販売される圧縮AACファイルを作成するのは理にかなっているように思われます。
しかしAppleは現在、提出されたマスターからiTunes Plusトラックへの変換時に、音の「ディテール」を可能な限り維持するために、改良された圧縮チェーンを採用しています。最初の24/96ファイルは32ビット浮動小数点の中間ファイルに変換され、その後AACエンコード処理中に直接ダウンサンプリングされます。Appleによると、これによりノイズの少ない高品質な圧縮ファイルが得られるとのことです。
これをテストするために、ウォード氏はiTunesで入手可能な最近マスタリングされたアルバムから1曲をダウンロードしました。次に、オリジナルの24/96マスターファイルを読み込み、Appleが提供するiTunesマスタリングツールを使ってiTunes Plusフォーマットに圧縮しました。そして、スタジオの機材を使って両方のトラックをiTunesで再生し、2つのバージョンを切り替えてみました。私たちの観察によると、24/96マスターから直接作成されたバージョンは、確かにわずかに明るく、より鮮明なサウンドでした。
ボブ・ウェストン クレジット:リズ・クレイトン
また、Appleの推奨であるダイナミックコンプレッションとゲインの制限は、より音質の良いAACファイルの作成に役立つこともわかりました。これをテストするために、Westonは最近マスタリングされたハードコアバンドのアルバムを使用しました。バンドは曲をできるだけ大きな音で聴かせたいと考えていたため、Westonはダイナミックコンプレッションと、オーディオ信号がクリッピングしない程度のゲイン設定を採用しました。
このマスタリング済みファイルをAppleの圧縮チェーンに通すと、AACファイルには著しいクリッピングと歪みが生じました。しかし、圧縮を弱め、曲の最大音量とサンプルの絶対最大値の間に約0.3dBのヘッドルームを確保することで、クリッピングがなくなり、再生音量にも目立った変化がないAACファイルになりました。変更は微妙でしたが、iTunes Plusのトラックは明らかに改善されました。
24/96ファイルを提出することのもう一つの利点は、前述の通り、AppleがiTunes Storeで提供するフォーマットを後から変更する際に、レコード会社が新しいマスターファイルを提出する必要がないことです。Appleは、高品質なマスターファイルを希望する新しい規格で再エンコードするだけで、iTunes Storeのライブラリ全体を自動的に更新できる可能性があります。
感情的な反応を生み出す
Appleの改良されたエンコード処理には、少なくとも私たちがテストしたソース素材では目に見えるメリットがあるのに、AAC圧縮で生じたアーティファクトを補正するためにわざわざ追加のマスタリング処理を施す必要があるのでしょうか?Masterdiskの専門家によると、その努力は価値があるとのことですが、Shepherd氏によると、価値がないとのことです。
シェパード氏は、iTunes向けに曲を特別にマスタリングしてCD版に近づけるのは「ナンセンス」だという自身の理論を証明するため、「ヌルテスト」と呼ばれるテストを行った。ある音源が別の音源と完全に同一であることを確認するために、エンジニアはデジタルオーディオワークステーションを用いて2つの波形を比較することができる。両方の波形がサンプルレベルまで完全に揃っている場合、一方の波形をもう一方の波形から減算すると、2つの波形の差が得られる。もし完全に無音であれば、一方の波形がもう一方の波形を「ヌル」にしており、2つは同一であるとみなせる。
シェパード氏は、レッド・ホット・チリ・ペッパーズの CD「I'm With You 」から直接リッピングした WAVと、iTunes から直接ダウンロードした「Mastered for iTunes」バージョン、および iTunes のデフォルト設定を使用してリッピングした CD オーディオから作成した iTunes Plus トラックを比較しました。
予想通り、どちらのAACファイルも、CDからリッピングした非圧縮WAVファイルと比べて聴き取れる違いがありました。WAVファイルとMastered for iTunes版を比較すると、ボーカルの一部に明確な違いが見られました。CDからリッピングしたAACと比較すると、「震え」のようなノイズが聞こえました。したがって、Shepherd氏は、Mastered for iTunes版の方がCD版との違いが大きいと結論付けました。
「それが問題だと言っているのではありません」とシェパード氏は言った。「この『Mastered of iTunes』版のサウンドの方が好みの方もいるでしょうし、エンジニアやプロデューサーがどんなフォーマットでも、違ったサウンド、いや、より良いサウンドを求めてマスタリングするのは全く正当なことです。『より近い』と言うのは正しくありません」
マスターディスクのCEO、スコット・ハル氏は「ちょっと待ってください」と語る。たとえ慎重に実施されたヌルテストでさえ、代替エンコーディングの音質がどの程度「異なる」のか、すべてを明らかにできるわけではない。
「私たちは、知覚的な意味でどのように聞こえるのかをほとんど理解していません」とハル氏はArs誌に語った。「客観的な検査はある程度の指針を与えてくれますが、聴覚には感情的な要素がまだ含まれているという事実は考慮されていません。私たちは感情的に聞いているため、それを測定することはできません。」
言い換えれば、たとえヌルテストであっても、私たちの知覚から感情を排除することはできないのです。「オーディオエンジニアとして、私たちは耳と脳を頼りに最善を尽くしています。しかし、私たちは決して『経験的に』聞いているわけではないと私は確信しています。」
ヴァンデット氏も、Mastered for iTunesのAACファイルとリッピングされたAACファイルの違いは意見の分かれるところだと同意した。「私にとって最も興味深いのは、ヌルテストで残った音質です」と彼はArsに語った。「リッピングされたAACには、圧縮されたCDの音に重ねられた人工的なノイズしか残っていません。Mastered for iTunesのAACには、音楽らしい響き、つまりマスタリングエンジニアがそこに込めたクリエイティブな部分が残っているのです。」
リック、これはおかしいよ
デジタル配信用の特別なマスターを作ることは、実は目新しいことではありません。MP3が普及し始めた初期の頃から、マスタリングサービスではカスタムエンコーディングを提供していました。
「デジタル配信が始まった頃は、マスタリングエンジニアはそれぞれ、気に入ったエンコーダーを見つけるまで試行錯誤を繰り返していました」とハル氏は語る。「しかし、それは常にソース素材によって決まりました。例えば、ジャズとダンスミュージックでは、エンコーダーによって動作が異なっていたのです。」
AppleはiTunes Store向けにはこれまで一貫して独自のエンコード処理を行ってきましたが、MP3を販売する他のストアでは、圧縮ファイルの直接アップロードが一般的に許可されています。異なるエンコーダー向けにソース素材をリマスタリングするのは現実的ではありませんでしたが、ソースに最適なエンコーダーを選択することで、より良い結果が得られる可能性がありました。「そこで、自分たちでエンコードを行い、より良い音質にしようと試みました。そして実際に、音質を向上させることができました」とハル氏は語りました。
「しかし、iTunes Plusフォーマットは、マスタリングすべき非常に具体的な目標を与えてくれました」と彼は付け加えた。「そして、すでにかなり良い音質なので、変更を加えることで感情的な反応に実際に違いが出る可能性があるのです。」つまり、クライアントがエンジニアに費用を支払って作業を依頼すれば、エンコードされたAACファイルの音質を知覚的に向上させることが可能だったのだ。
レッド・ホット・チリ・ペッパーの『I'm With You』は、最初に発売された「Mastered for iTunes」アルバムの 1 つです。
しかし、昨年まで、そうするプロデューサーやアーティストはほとんどいませんでした。有名なプロデューサー、リック・ルービンが、当時発売間近だったレッド・ホット・チリ・ペッパーズのアルバム「I'm With You」のAACファイルの音質に不満を表明したのです。
「リック・ルービンがやって来て、『このAACの音は受け入れられない。もっと良い音にできるか?』と言ったんです」とヴァンデット氏はArsに語った。
MasterdiskはiTunes Plusフォーマットに圧縮された楽曲の音質向上を実験していましたが、ルービン氏が強く訴えるまでは、それが常態化することはありませんでした。「彼の業界における地位がAppleの注目を集めたのです」とハル氏は語ります。その後、AppleのエンジニアたちはMastered for iTunesプログラムのために準備していたエンコード処理に関する情報を共有しました。「あれよあれよという間に、エンコードされたファイルの音質を実際に向上させることができました。」
ルービン氏は昨年、この件に関する自身の考えをMTVに説明し、結果として得られた「Mastered for iTunes」トラックとオリジナルのエンコードの違いは「昼と夜」の違いだと述べた。
「通常のiTunesファイルよりも多くの音響情報が含まれているようです」とルービン氏はMTVに語った。「CDの音にかなり近いので、最終的なiTunesマスターにたどり着くまでには数週間にわたる追加の実験とマスタリングが必要でした。」
(ルービン氏とアップル社はともにこの件に関してコメントを控えた。)
シェパード氏も認めているように、主観的に音質が良い異なるフォーマット用のマスターを作成することは全く理にかなっている。「アーティストは、サウンドを改善し、自分の思い通りにするためには、どんなことでもします」とハル氏はArsに語った。「必要がない限り、レコード制作に15ドルも余分に費やすつもりのないクライアントもいます。しかし、彼らはiTunes用のマスタリングには、その追加費用と労力に見合う価値があると考えています。」
見る人の耳
ジェイソン・ワードクレジット: ジェイソン・ワード
シェパードは『 I'm With You』におけるマスターディスクのカスタムマスタリング作業にはあまり感心しなかったが、シカゴ・マスタリング・サービスのジェイソン・ワードは、自分でそのプロセスを試した後、信奉者になった。
スタジオにいる間、ワードはiTunesから最近マスタリングされたインディーロックアルバムのトラックをダウンロードしました。AppleのiTunes処理ツールを使って、そのトラックをWAVファイルに変換しました。Appleによると、これはiTunesの再生時に行われるのと同じデコード処理だそうです。その後、ワードはオリジナルのCDマスターWAVファイルを彼のワークステーションに読み込みました。コンソールのA/Bリスニングスイッチを使って、私たちは2つのトラックを比較検討しました。
CDマスターとiTunes Storeで配信されたものには、聴感上大きな違いがあることで、私たちは意見が一致しました。ワード氏はiTunes版を「箱型」と表現し、私は「こもった」と表現しました。ワード氏はオリジナルマスターの方がステレオイメージと存在感が優れていると指摘し、私はオリジナルの方が「空気感」が豊かだと感じました。
「iTunes から出てきた曲がひどい音だというわけではないが、オリジナルほど良くはない」と Ward 氏は言う。
その後、オリジナルの高解像度マスターを読み込み、EQ調整を開始しました。24/44.1 WAVファイルをエクスポートし、Appleのツールを使って、Apple自身が生成するものと全く同じエンコードされたAACファイルを作成しました。そして、前回と同様に、Appleのツールを使って、このAACファイルを16/44.1 WAVファイルに変換しました。
これで、オリジナルのCDマスター、そのマスターからiTunesで生成されたファイル、そして私たち独自の「iTunes専用マスタリング」バージョンを比較できるようになりました。主観的には、私たちの調整によってトラックの音質が向上しました。「箱型感」が大幅に軽減され、曲がより「生き生き」と聴こえるようになりました。
異音が聞こえていないことを確認するため、シェパードのヌルテスト実験を繰り返しました。シェパードのテストと同様に、CDマスターとiTunesからのリッピング音を比較すると、かなりの揺れのあるノイズと雑音が発生しました。しかし、私たちが独自にマスタリングしたバージョンを使ったヌルテストでは、ほぼ無音でした。音楽とボーカルの音がわずかに残っていましたが、結果は前回の比較で聞いたノイズよりもはるかに静かでした。
「本当に目から鱗でした」とワード氏はArs誌に語った。「これは、レコードのマスタリング用にラッカーをカッティングする時に行う作業と似ています。周波数特性が完全に直線的ではないという事実を考慮して、微調整を加えています。これが標準になるかもしれないという予感がします。お客様に様々なフォーマットを提供するという、私たちの次の進化形となるでしょう。」
iTunes Plusを「標準」として
事実、Appleは現在、米国でナンバーワンの音楽販売業者です。つまり、今日購入されている音楽のかなりの割合が256kbpsのiTunes Plusフォーマットで購入されているということです。ハードドライブは数テラバイトにも及ぶ巨大な容量へと成長しましたが、圧縮オーディオは依然として最も一般的な音楽配信フォーマットです。
「最終消費者は客観的な科学者やロボットのようには耳を傾けません。最終消費者は 100% 感情的に耳を傾けます。」
いつか私たちは、広く普及しているLTE Advanced無線接続を使って、64GBをはるかに超えるストレージ容量を持つスマートフォンに非圧縮オーディオをダウンロードするようになるだろう。しかし、それはまだ先のことだ。iTunes Plusは、おそらく2020年代後半まで存在し続けるだろう。
AACが音楽フォーマット戦争を席巻する限り、マスタリングエンジニアはAACファイルの音質向上に努めるだろう。「エンコードによってレベルが変化すれば、そのレベルを調整できます。音質があまりにも『脆く』なってしまったら、高域を調整すればいいんです」とヴァンデット氏は語る。「プロセスを100%コントロールすることはできませんが、コントロールできる部分があるなら、試してみるべきではないでしょうか?」
ヴァンデットの同僚で、レッド・ホット・チリ・ペッパーズのプロジェクトでルービンと仕事をしたヴラド・メラーは、iTunes用のマスタリングは精密科学ではないと説明した。彼はそのプロセスを「まるでベントレーを真っ暗闇の中で磨き、その後ライトをつけてどこが見落としていたかを確認するようなものだ」と表現した。
AACエンコーディングは適応的なプロセスだからです。「エンコーダーは決して静的に動作することはありません」とヴァンデット氏は説明します。「うまく動作する『AACプリセット』というものは存在しません。もしそんなに簡単なら、ソフトウェア設計者がそれをプログラムしているはずです。」
しかし、そのプロセスを正確な科学にしようとして、ヌルテストだけがそのプロセスに価値があることを「証明」しようとすると、要点を見逃してしまうかもしれません。
「最終消費者は、客観的な科学者やロボットのように耳を傾けるわけではありません。100%感情的に耳を傾けるのです」とハル氏は結論づけた。「数字に囚われすぎると、そのことを忘れてしまいがちです。」
リスト画像:クリス・フォレスマン撮影

クリスは Ars Technica のアソシエイトライターであり、過去 5 年間、Apple、スマートフォン、デジタル写真、特許訴訟などのトピックについて執筆してきました。
373件のコメント