Het productieproces van een muziek-, of audioproject bestaat grofweg uit drie stappen: registratie, mixage en mastering. Tijdens het masteren worden de klankkleur, de ruimtelijkheid, de dynamiek en het volume van verschillende tracks op elkaar afgestemd en geoptimaliseerd. Vervolgens worden de tracks gereedgemaakt voor online verspreiding of cd-replicatie.

Sinds iTunes de Nederlandse markt heeft betreden, zijn er vele technische vragen ontstaan over de mastering van audiotracks voor de distributie via iTunes (Store). De meeste vragen worden duidelijk en grondig beantwoord in de officiele documentatie en op de website, maar sommige aspecten komen daarin niet aan de orde. Laten we dit eens nader onderzoeken...

Het uiteindelijke vereiste audioformaat voor iTunes is AAC, en Apple beveelt het gebruik van 96 kHz, 24 bits bronmateriaal aan, ondanks het feit dat het uiteindelijke resultaat 44.1 kHz zal worden. Dus impliceert dit proces duidelijk een stap van samplingrate conversie (SRC). Laten we de kwaliteit van deze conversie onderzoeken (SRC-analyse en interactieve implemetatie door Alexey Lukin).

Buiten een uitvoerige documentatie en handleiding biedt Apple ook Open Source OSX Software aan om de juiste stappen van conversie te maken: "afconvert utility" biedt een aantal mogelijkheden tot conversie, waaronder norm en bats mode. Allereerst de meetresultaten in norm mode:

afconvert norm transition
afconvert norm transition
afconvert norm tone
afconvert norm tone
afconvert norm pulse
afconvert norm pulse
afconvert norm phase
afconvert norm phase
afconvert norm passband
afconvert norm passband
afconvert norm
afconvert norm

CONCLUSIE: niet slecht, maar ook niet echt de superkwaliteit dat door Apple wordt geclaimed - de resultaten zijn ronduit middelmatig, zeker vergeleken met de moderne conversie algoritmen van professionele digitale audio editors (DAW).

De tweede mode van "afconvert utility" is bats, en hier zijn de meetresultaten:

afconvert bats transition
afconvert bats transition
afconvert bats tone
afconvert bats tone
afconvert bats pulse
afconvert bats pulse
afconvert bats phase
afconvert bats phase
afconvert bats passband
afconvert bats passband
afconvert bats
afconvert bats

Dit ziet er al veel beter uit: de resultaten zijn vergelijkbaar met die van de beste samplingrate convertors op de markt.

CONCLUSIE: er is géén meetbaar verschil in conversiekwaliteit, of er nu gebruik gemaakt wordt van een externe high-quality samplingrate converter of de door Apple gebouwde en aanbevolen converter in bats mode.

Het volgende belangrijke punt: signaal niveau.

Apple beveelt in haar richtlijnen het maximale piekniveau van het aangeboden bronmateriaal (inclusief alle intersample-pieken) op -1 dBFs aan. Kan dit niveau overschreden worden? Is 1 dB headroom genoeg om "clipping" van het bronmateriaal tijdens conversie te voorkomen?

Om deze vraag te beantwoorden, is een andere Apple Utility inzetbaar, genaamd: "afclip". Het meet de signaalniveau's van het bronmateriaal, inclusief de intersample-pieken.

Ter experiment nemen we 3 bestanden bronmateriaal op 44,1kHz: het eerste bestand clipt hard op 0 dBFs, het tweede bestand werd zodanig met een limiter bewerkt dat het ware piekniveau tot op -0,5 dBFs komt ("True Peak" houdt rekening met intersample pieken), en een derde bestand werd zodanig met een limiter bewerkt dat het ware piekniveau tot op -1 dBFs komt (Elke limiter met een "intersample detection"-functie zou hiervoor gebruikt kunnen worden).

De analyse en meetresultaten van de bronbestanden produceren verwachtbare resultaten: het eerste bestand vertoont duizenden clippende intersample pieken, de tweede en de derde vertonen er geen. Alhoewel: nadat de bronbestanden naar AAC en terug geconverteerd werden, zien de meetresultaten er nogal verschillend uit: het eerste bestand komt er zeer slecht af... Het tweede bestand vertoont duizenden clippings: dit duidt erop dat de 0.5 dB headroom (zelfs wanneer geanticipeerd op intersample peaks) niet toereikend genoeg is. Het derde bestand voldoet aan Apple’s A-standaard: er is geen clipping gedetecteerd en het orginele audiosignaal geraakte op de best mogelijke manier getranscodeerd.

CONCLUSIE: de aanbeveling welke Apple maakt aangaande signaal piekniveau's is valide: de headroom van 1 dB is noodzakelijk en afdoende om "clipping" van muzikaal materiaal te voorkomen.

CONCLUSIE: het proces van adaptie van reeds bestaande, gepubliceerde CD's voor iTunes distributie omhelst tenminste limiting of verzwakking van het audiosignaal tot -1 dBTP (True Peak) en opslag als 24-bit formaat.

Wat is nu het verschil? Het belangrijkste verschil is dat het gebruik van compressie en limiting, enkel voor het bereiken van "loudness", geen enkele zin meer heeft en zelfs schade kan berokkenen na conversie. De luidheid van tracks in een playlist, afgespeeld met iTunes/iPod, worden op elkaar afgestemd door de standaard ingebouwde functie "Sound Check".

CONCLUSIE: het gebruikmaken van compressie en limiting om de te ervaren "loudness" van bronmateriaal te vergroten, hebben geen enkele zin meer; deze zouden alleen nog maar gebruikt moeten worden voor het creatieve proces, zoals het vormgeven van dynamiek van een track.

Overigens: de bovenstaande aanbeveling geldt ook voor andere audio compressie (lees: komende streaming-) formaten, ...niet enkel voor AAC.

In 2002, nog vóór de lancering van de iTunes Store, kreeg Apple een Grammy Award® voor technische uitmuntendheid in de muziek, de eerste en enige dergelijke onderscheiding ooit uitgereikt aan een bedrijf gespecialiceerd in personal computing.

Met de lancering van iTunes werd er besloten het AAC-formaat (later: AAC plus) te standaardiseren, in plaats van het schijnbaar meer populaire MP3-formaat; simpelweg omdat AAC duidelijk aantoonbaar voorziet in een superieure geluidskwaliteit in vergelijking met andere codecs tegen vergelijkbare bitrates.

Door ook nauw samen te werken met andere audiocompressie-pioniers Dolby Laboratories, Fraunhofer IIS en Sonnox-Fraunhofer IIS, heeft dit sindsdien geleid tot doorgaande verbeteringen (tot op vandaag tot op hoog niveau van uitmuntendheid in luisterervaring) van AAC/iTunes. Als u de in dit document beschreven huidige richtlijnen toepast, kunt u een dynamisch bereik van uw audiomateriaal behalen dat superieur is aan CD/redbook audio; een eindproduct bereiken dat vrijwel niet te onderscheiden is van de oorspronkelijke opname.

Meer over de Apple Mastering Tools:

  • afclip: de afclip command-line utility kan gebruikt worden om elk audiobestand te controleren op "clipping".

  • afconvert: de afconvert command-line utility kan gebruikt worden om ge-master-de audiobestanden te encoderen in iTunes Plus formaat.

  • AURoundTripAAC Audio Unit: de AURoundTripAAC Audio Unit kan gebruikt worden om een iTunes Plus audiobestand auditief te vergelijken met het orginele audiobestand op "clipping".

  • Master for iTunes Droplet: de Master for iTunes Droplet is een simpele, standalone drag-and-drop tool welke gebruikt kan worden om snel en makkelijk audiobestanden/master te encoderen in iTunes Plus formaat.

  • Audio to WAVE Droplet: de Audio to WAVE Droplet automatiseert het creeëren van audiobestanden, in WAVE (Waveform Audio File) formaat, van elke audiobestand (zoals MPEG of CAF bestanden) welke "native" wordt ondersteund door Mac OS X.

AAC (Advanced Audio Coding): compressed, lossy, perceptual coding scheme, originally a component of the MPEG-2 standard as MPEG-2 AAC. Defined in 1997 as part of ISO/IEC 13818-7. Enhanced for the MPEG-4 standard as MPEG-4 AAC. MPEG-2 AAC provides better perceived audio quality at the same bit rate compared to MPEG-1, layer 3 ( MP3), according to results published in ISO/IEC JTC1/SC29/WG11, N2006 (February 1998). MPEG-4 AAC extends MPEG-2 AAC with additional coding tools.

Perceptual coding: lossy compression that takes advantage of limitations in human perception. In perceptual coding, audio data is selectively removed based on how unlikely it is that a listener will notice the removal. MP3 and MPEG-2 AAC are popular examples of perceptual coding.

