Grundlagen: CD-ROM

10.06.2000 von NICO HARTMANN  und Eduard Scherer
Die CD-ROM ist klein, handlich, speichert viele Daten und ist widerstandsfähig. tecChannel.de zeigt den Aufbau und die Technik dahinter im Detail.

Jahrhunderte alte Pergament-Rollen und Fresken werden selbst noch für unsere Nachfahren zu sehen sein. Die modernen Bücher werden das nicht mehr erleben. Das Papier ist säurehaltig und zerbröckelt langsam.

Auch digitale Speichermedien altern - unhörbar und unsichtbar. Der bekannteste Fall von Datenverlust hat sich bei der amerikanischen Weltraumbehörde NASA abgespielt: 1,2 Millionen Magnetbänder sind hinüber, Dokumente aus drei Jahrzehnte amerikanischer Raumfahrt zerstört.

Das langlebigste magnetische Speichermedium ist immer noch die Festplatte. Die Hersteller gehen auf Grund des hermetisch abgekapselten Gehäuses von einer Lebensdauer von 20 Jahren aus. Bänder sind bei optimalen Bedingungen für fünf bis zehn Jahre gut. Bei optischen Speichern liegt die Lebenserwartung bei etwa zehn bis 100 Jahren.

Im folgenden Artikel stellen wir die CD-ROM ausführlich vor. Dieser erste Teil des Artikels behandelt die Spezifikationen der CD und die prinzipielle Funktionsweise eines CD-Laufwerks. Sie erfahren, wie Daten auf der CD gespeichert sind, und wir erklären, wie Fehler erkannt und korrigiert werden. Im zweiten Abschnitt des Beitrags stellen wir Ihnen die wichtigsten CD-Formate vor.

Technische Daten der CD

An den Abmessungen und am Aufbau von CDs hat sich seit der Markteinführung nichts geändert: Eine Standard-CD wiegt etwa 18 Gramm, misst 120 mm im Durchmesser und ist 1,2 mm dick. Die Größe des Mittellochs beträgt 15 mm. Die CD dreht sich im Laufwerk von der Datenseite aus betrachtet gegen den Uhrzeigersinn.

Die Daten liegen in einer von innen nach außen verlaufenden, spiralförmigen Spur. Bei einer CD mit 650 MByte (74 Minuten) beträgt die Spurweite 1,6 µm. Die Spur besteht aus 120 nm tiefen und 0,5 µm breiten Vertiefungen in der Metallschicht. Die Vertiefungen nennt man Pits, der Bereich zwischen zwei Pits heißt Land. Die Datenspur enthält maximal zirka 22.000 Windungen und ist bis zu 25 km lang.

Der Aufzeichnungsbereich liegt zwischen 46 und 117 mm. Er teilt sich in Lead-in (Eingangsbereich), Datenbereich (50 mm - 116 mm) und Lead-out (Ausgangsbereich). Im Lead-in befindet sich die TOC der CD, das Lead-out markiert das Ende der Aufzeichnung.

Der Aufbau einer CD

Die CD besteht aus verschiedenen Schichten, wie in der Grafik dargestellt ist.

Als Trägermaterial dient ein beliebiges durchsichtiges Material mit einem Lichtbrechungsindex von 1,55. Presswerke verwenden meist Polycarbonat. Das Trägermaterial macht den größten Teil der Gesamtdicke einer CD aus.

Die Datenspur befindet sich auf einer 0,05 bis 0,1 µm dicken Metallschicht. Dafür werden in der Regel Aluminium und dessen Legierungen verwendet. Bei manchen "Luxusausgaben" von Klassik-CDs kommt auch Messing zum Einsatz. Das verleiht der CD-Oberfläche einen goldenen Glanz. Auf Gold verzichten die meisten Presswerke, weil das Aufdampfen des Edelmetalls die Fertigungskosten einer CD um etwa 50 Pfennig erhöht. Die Pressung einer CD kostet je nach Auflage zirka 50 bis 80 Pfennig.

Die Metallschicht ist von einer Schutzschicht aus UV-unempfindlichem Lack bedeckt. Auf die Schutzschicht wird dann das Label gedruckt.

Das optische System

Ein Laserstrahl tastet die Informationsspur auf der CD ab. Der Strahl hat den Vorteil, berührungs- und damit verschleißfrei für das Medium zu sein.

Ein Halbleiterlaser erzeugt den notwendigen Laserstrahl mit einer Wellenlänge von 780 nm. Das Beugungsgitter weitet den Strahl auf. Er passiert einen halbdurchlässigen Spiegel, und eine Sammellinse (Kollimator) parallelisiert den Strahl. Ein Fokussierungs-Linsensystems verengt ihn, sodass er beim Auftreffen auf die CD-Oberfläche nur etwa 0,8 mm breit ist.

Der Strahl wird an der Oberfläche der CD gebrochen. Der Grund dafür ist, dass der Lichtbrechungsindex von 1,55 des Trägermaterials höher ist als der von Luft mit 1,0. Die Brechung des Strahls bewirkt eine Bündelung von 800 µm Breite an der CD-Oberfläche auf letztendlich 1,7 µm, wenn er auf die Datenspur trifft. Das entspricht ungefähr der dreifachen Pitbreite. Auf Grund dieser Eigenschaft des Trägermaterials wirken sich kleine Kratzer oder Staubpartikel auf der CD-Oberfläche kaum aus. Man geht davon aus, dass Staub oder Kratzer, die kleiner als 0,5 mm sind, keine Lesefehler des Laufwerks nach sich ziehen.

Trifft der Laserstrahl auf ein Pit, muss er wegen der Pittiefe eine längere Strecke zurücklegen als bei einem Land. Die Differenz beträgt etwa die halbe Wellenlänge des Strahls. Dadurch löschen sich die von Pits und Lands reflektierten Strahlen über Interferenz teilweise aus. Bei Übergängen zwischen Pits und Lands ist der reflektierte Strahl also deutlich schwächer. Er durchläuft nun den umgekehrten Weg bis zum Spiegel. Dort wird er abgelenkt und trifft auf eine Fotodiode, die die Amplitudenschwankungen erkennt.

Leseverfahren von CD-ROM-Laufwerken

Wenn die relative Geschwindigkeit des Laserstrahls über der Pitspur konstant ist, spricht man von CLV. Die Umdrehungsgeschwindigkeit der CD nimmt von innen nach außen ab. Diese Technik findet in Audio-CD-Playern Anwendung. Die Datentransferrate bleibt über die gesamte Spieldauer der CD konstant.

Manche CD-ROM-Laufwerke drehen, ähnlich wie Festplatten, mit konstanter Winkelgeschwindigkeit. Diese Technik wird mit CAV bezeichnet. Dabei dreht die CD immer gleich schnell. Dadurch nimmt die Datentransferrate von innen nach außen zu.

Mit immer schnelleren CD-ROM-Laufwerken bringt die CAV-Technologie Probleme mit sich: Wenn die Umdrehungsgeschwindigkeit der CD zu hoch ist, erhöht sich die Wahrscheinlichkeit von Lesefehlern. Wählt man hingegen eine niedrigere Umdrehungsgeschwindigkeit, verschenkt man Performance. Der Kompromiss heißt PCAV. Im inneren Bereich der CD bleibt die Umdrehungsgeschwindigkeit wie bei CAV konstant. Im äußeren Bereich bremst die CD allmählich ab, sodass die Datentransferrate wie bei CLV konstant bleibt.

Datenkodierung

Beim Lesen tastet der Laserstrahl die Metallschicht entlang der Spur ab. Trifft er auf einen Übergang zwischen einem Pit und einem Land oder umgekehrt, wird diese Zustandsänderung als ein Channel-Bit mit dem Wert 1 interpretiert. Die übrigen Stellen ergeben Null-Channel-Bits. Das Channel-Bit ist die kleinste Informationseinheit auf der CD.

Pits und Lands müssen eine Länge von mindestens drei und höchstens elf Channel-Bits haben. Wenn Pits oder Lands kürzer als drei oder länger als elf sind, werden die Übergänge nicht richtig erkannt. Durch diese Beschränkung sind nicht beliebige 0-1-Kombinationen möglich. Das ist auch der Grund dafür, dass mehr als acht Channel-Bits notwendig sind, um die 2^8 = 256 Kombinationsmöglichkeiten eines Byte darzustellen. 14 Channel-Bits stellen auf der Pitspur ein Byte dar.

Die Umwandlung von 14 Channel-Bits in ein Byte erfolgt durch die EFM-Modulation. Die Dekodierung beim Auslesen geschieht über eine Tabelle, die in der Steuerungselektronik jedes Laufwerks implementiert ist.

Zwischen zwei 14-Channel-Bit-Folgen werden je drei so genannte "Merge-Channel-Bits" eingefügt. Wenn der EFM-Code eines Bytes mit einem Channel-Bit 1 endet und der Code des nächsten Bytes mit Channel-Bit 1 beginnt, kann man nämlich bei der Kodierung ohne Merge-Channel-Bits die minimale Pitlänge nicht mehr einhalten. Der Platzbedarf für ein Byte Information vergrößert sich damit auf 17 Channel-Bits.

Um die Daten richtig auslesen zu können, benötigt man ein Format, in dem die einzelnen Bits auf der CD-Oberfläche organisiert werden. Auf den nächsten Seiten wird dieses Datenformat beschrieben.

Frames und Sektoren - Aufbau der Daten

Um Daten effektiv speichern zu können, werden mehrere Bytes zu größeren Blöcken zusammengefasst. Die kleinsten dieser zusammenhängenden Informationseinheiten einer CD nennt man Frames. Ein Frame besteht aus 588 Channel-Bits, von denen nur 408 Bit - das sind 24 Byte - Nutzdaten enthalten.

Am Anfang jedes Frames steht ein Synchronisationsmuster. Daran erkennt das Laufwerk den Beginn eines neuen Frames. Als Nächstes kommt ein so genanntes Control-Byte, dessen acht Bits mit P bis W bezeichnet werden und das Kontrollinformationen speichert. Nach den 24 Byte Nutzdaten folgen acht Byte Fehlerkorrektur.

Aufbau eines Frames

Verwendung

Channel-Bits

Synchronisation

24 + 3 = 27

Control-Byte

14 + 3 = 17

Daten

24 x (14 + 3) = 408

Fehlerkorrektur

8 x (14 + 3) = 136

Summe

588

Die Frames sind in Sektoren zusammengefasst. Ein Sektor enthält 98 Frames und umfasst somit 3234 Byte. Diese setzen sich aus den Control-Byte, den Nutzdaten und dem Fehlerkorrektur-Byte der einzelnen Frames zusammen.

Die Anordnung der Daten auf der CD wurde erstmals 1982 von Sony und Philips unter dem Namen Red Book veröffentlicht. Das Red Book beschreibt das Format der Audio-CD, alle anderen Formate basieren auf dieser Spezifikation.

Die Control-Bytes, Subchannel und die TOC

Jedes Frame auf der CD enthält ein Control-Byte. Dieses beinhaltet weiterführende Informationen für den CD-Player. Die 8 Bits werden mit P, Q, R, S, T, U, V und W bezeichnet. Die 98 Control-Bits gleicher Bezeichnung innerhalb eines Sektors bilden jeweils einen Subcode-Block.

Der P-Kanal

Die Bits des P-Kanals markieren die Anfänge von Tracks auf der CD, sowie das Lead-in und das Lead-out. So kann der CD-Spieler jederzeit den aktuellen Track anzeigen.

Innerhalb des Lead-in-Bereichs enthält der P-Kanal nur Null-Bits. Am Ende des Eingangssignals befindet sich eine 2 bis 3 Sekunden lange Startmarkierung aus Eins-P-Bits. Diese Markierung endet vor dem Beginn des Tracks. Dauert die Pause zwischen zwei Tracks mehr als 2 bis 3 Sekunden, verlängert sich auch die Länge der Startmarkierung. Bei kürzeren Pausen bleibt die Markierung 2 bis 3 Sekunden lang.

Vor dem Ende des letzten Tracks der CD befindet sich eine weitere Markierung, danach wird der P-Kanal bis zum Ende des Aufzeichnungsbereiches in 0,5-Sekunden-Abständen abwechselnd auf 0 und 1 gesetzt. Daran erkennt der Player das Ende einer CD.

Der Q-Kanal: Modus 1

Der Q-Subcode-Kanal enthält unter anderem das Inhaltsverzeichnis der CD sowie die abgelaufene Zeit, die am Player angezeigt wird. Ein Q-Kanal Subcode-Block setzt sich wie folgt zusammen:

Die ersten beiden Bits eines Subcode-Blocks dienen zur Synchronisation. Darauf folgen 4 Steuerungsbits. Das erste Bit hiervon setzt fest, ob es sich bei der Audio-CD um eine 2- oder 4-Kanalaufnahme handelt. Ein weiteres bestimmt, ob die CD von DAT- oder MiniDisk-Recordern ohne weiteres digital kopiert werden kann. Das letzte Steuerungsbit zeigt an, ob die Audio-CD mit Pre-Emphasis aufgenommen wurde. Wenn ja, wird im Player automatisch die De-Emphasis-Schaltung aktiviert.

Die vier Adressierungsbits legen fest, von welcher Art die Information der Q-Daten im betreffenden Block ist. Man unterscheidet hierbei drei Modi:

Die Daten beim Modus 1 enthalten im Lead-in-Bereich die TOC. Diese speichert die 72 Bit Q-Daten als 8 Byte mit jeweils zwei hexadezimalen Ziffern wie folgt:

Im Signalbereich der CD werden hier Indexnummern sowie die abgelaufene Zeit und die Gesamtspieldauer übertragen.

Die Zeitangaben auf der CD erfolgen in Minuten, Sekunden und Frames, wobei beim Audio-CD-Spieler 75 Frames in der Sekunde übertragen werden.

Der Q-Kanal: Modus 2 + 3

Im Modus 2 enthalten die Q-Daten eine Katalognummer, welche die CD eindeutig identifiziert (vergleichbar mit einem Strichcode). So können sich beispielsweise manche Audio-CD-Spieler für jede CD einzeln eine bestimmte Programmreihenfolge "merken". Ebenso funktionieren auch die Anfragen an CDDB-Datenbanken. Durch die Anfrage mit Hilfe der Katalognummer werden CD-Titel, Interpret und die Namen der einzelnen Stücke ausgegeben.

Darüber hinaus wird hier die laufende Gesamtspielzeit weiter übertragen.

Bei Q-Daten im Modus 3 wird der ISRC übertragen. Der Code gibt Auskunft über Land, Eigentümer, Aufnahmejahr und Seriennummer einer CD.

Am Ende jedes Subcode-Blocks steht noch ein 16 Bit langer Fehlererkennungscode.

Die Subcode-Kanäle R bis W

Die mit den Buchstaben R bis W bezeichneten Subcode-Kanäle werden zusammengefasst und zusammen ausgewertet. Ursprünglich war dieser Bereich als Speicherplatzreserve gedacht. Bei den meisten Audio-CDs sind die Bits dieser Kanäle mit 0 überschrieben.

Es gibt zwei CD-Standards, die die R-W-Kanäle gebrauchen: CD+G/M und CD Text. Bei beiden werden die Subcode-Bits R bis W eines Sektors in vier Pakete zu je 24 Frames aufgeteilt. Die Control-Bytes der ersten zwei Frames bilden das Synchronisationswort.

Die einzelnen Pakete beginnen mit einem Mode- und einem Item-Feld. Sie sind jeweils 3 Bit lang und definieren zusammen mit dem 6-Bit-breiten Anweisungsfeld die Art das Datenfeldes, in dem die Nutzdaten stehen. Die Q- und P-Frames (die Bezeichnungen haben nichts mit dem P- und Q-Subchannel zu tun) dienen zur Fehlerkorrektur.

Diese Nutzdaten enthalten Bilder, Texte oder MIDI-Informationen. CD-I-Player können Bild- und Textdaten ausgeben. Neuere Audio-CD-Player wie der Denon DCD 755, Marantz CD 5000, Pioneer PF-F 107, Technics SL-MC 7 oder Sony CDP-CD 535 zeigen mittlerweile CD-Text an. Das CD-Textformat erlaubt für eine zukünftige Playergeneration auch die Verwendung von JPEG-kodierten Bildern und Menüstrukturen.

Fehlererkennung und Fehlerkorrektur

Manchmal sind die Daten auf der CD nicht mehr vollständig lesbar, etwa in Folge von großen Kratzern. In so einem Fall braucht man Verfahren, um erstens diese Fehler aufzuspüren und um sie zweitens mittels der vorhandenen Daten zu rekonstruieren.

Das beste Verfahren zur Fehlererkennung ist das Hinzufügen von Paritätsbits zu den aufgenommenen Nutzdaten. Dabei wird etwa zu jedem Daten-Byte noch ein Bit mitgespeichert. Der Wert dieses Bit ist 0, wenn die Anzahl der Eins-Bits im Daten-Byte gleich Null oder eine gerade Zahl ist, ansonsten nimmt das Paritätsbit den Wert 1 an. Wird ein Bit falsch gelesen, kann dieser Fehler erkannt werden. Durch die Verwendung mehrerer Paritätsbits, die aus verschiedenen Kombinationen der Nutzdaten gebildet werden, kann man fehlerhafte Bits genau lokalisieren, sodass auch eine Korrektur möglich ist.

Dieses Verfahren lässt sich beliebig verfeinern, aber mit steigender Fehlererkennungsrate steigt auch die zu übertragende Datenmenge auf Grund der größer werdenden Anzahl der Paritätbits.

Einzelne Fehler, wie falsch abgebildete Bits, können leicht erkannt und korrigiert werden. Treten Fehler in aufeinander folgenden Gruppen auf, spricht man von Flächenfehlern oder Bursts. Hier ist der Korrekturaufwand größer. Flächenfehler kommen bei CDs oft vor, etwa in Form von radialen Kratzern.

Flächenfehler korrigiert ein Laufwerk durch Interleaving. Dabei werden die Daten vor der Aufzeichnung so umverteilt, dass aufeinander folgende Werte auf dem Speichermedium niemals benachbart sind. Beim Lesen werden nun die Daten wieder in ihre ursprüngliche Reihenfolge gebracht (De-Interleaving). Tritt nun ein Flächenfehler auf dem Medium auf, werden die Daten durch das De-Interleaving so umverteilt, dass daraus mehrere Einzelfehler entstehen, die mit Hilfe von Paritätsbits korrigiert werden.

Die Verfeinerung dieser Technik nennt man Cross Interleaving; dabei werden die Daten mehrere Male in kürzeren als auch in längeren Intervallen verschachtelt.

Der Fehlererkennungs- und Fehlerkorrekturcode bei CDs heißt CIRC. Hierbei werden für Einzelfehler Paritätsprüfungen benutzt und Flächenfehler durch das Cross Interleaving zu Einzelfehlern umgewandelt.

Fehler, die trotz CIRC nicht korrigierbar sind, könnten bei Audio-CDs hörbare Klicks erzeugen. Um solchen Effekten vorzubeugen, sind in Audio-CD-Spielern Verdeckungsschaltungen eingebaut, die den nicht eindeutig lesbaren Wert bei der Wiedergabe ausblenden. Manchmal wird der fehlende Wert auch durch Interpolation der Nachbarstellen ersetzt. Der Hörer bekommt in den meisten Fällen durch solche Schaltungen gar nicht mit, dass hier ein nicht behebbarer Fehler auftrat.

EFM-Demodulation

Bei der Wiedergabe der CD trifft der von der Pitspur reflektierte Laserstrahl auf einen Fotodetektor. Dieser setzt Schwankungen im optischen Signal in Spannungsschwankungen um. Das so erzeugte Signal gleicht einer hochfrequenten Sinuskurve und wird RF-Signal genannt. Die eigentliche Information ist in den Nulldurchgängen der RF-Signalkurve enthalten.

Das RF-Signal wird erst in ein Rechtecksignal umgewandelt, dessen NRZI-Form dann in die NRZ-Form gebracht wird. Diese Form des Signals ist für die nachfolgenden digitalen Schaltungen besser erkennbar.

Zuerst werden die Synchronisationsmuster am Anfang jedes Frames identifiziert. Danach trennt ein Signalprozessor die 14 Channel-Bits jedes EFM-kodierten Bytes von den drei Merge-Channel-Bits. Anhand der EFM-Tabelle gewinnt man dann die ursprünglichen Bytefolgen wieder.

Ausblick

Seit fast 20 Jahren gibt es die CD. Am grundsätzlichen Aufbau und den technischen Daten hat sich seit dem nichts geändert. Lediglich neue Einsatzgebiete forderten andere Anordnungen der Informationen. Der Ausgangspunkt war jedoch immer der Red-Book-Standard.

Die Format-Fragen sind heute weit gehend geklärt. Die CD-ROM stößt aber zunehmend an ihre physikalischen Grenzen, gemeint ist die Speicherkapazität von 650 MByte respektive 700 MByte bei den nicht-standard-konformen CDs mit Überlänge. Die DVD mit bis zu 17 GByte Speicherplatz soll neue Anwendungen und Einsatzbereiche schaffen. Ob ihr das in den nächsten Jahren im PC-Bereich gelingt, ist allerdings fraglich. Seit Jahren versucht die DVD einen Trend zu erzeugen. Erfolg kann sie jedoch nur im Heim-Kino-Markt verbuchen. Und wer weiß, vielleicht kommen in zwei-drei Jahren völlig neue Speichertechnologien, und überrennen die DVD. Gute Ansätze sind bereits beim US-Hersteller C3D zu erkennen. ClearCard heißt dort die kreditkartengroße Speicherdisk, die sich noch im Prototypen-Stadium befindet. Bis zu 20 Datenschichten speichern rund 400 MByte pro Quadratzentimeter. Das ergibt insgesamt beachtliche 10 GByte, wie tecChannel.de bereits berichtete. (nha)