Das optische 400g-Modul verstehen

Dec 16, 2025|

Der400G optisches Modulstellt einen grundlegenden Wandel in der Art und Weise dar, wie Rechenzentren ihre Verbindungsstruktur aufbauen. Diese Transceiver arbeiten mit 400 Gigabit pro Sekunde und nutzen PAM4-Signalisierung (Pulse Amplitude Modulation 4-Level) über acht elektrische Leitungen-mit jeweils 50 Gbit/s-, um Bandbreite zu bündeln, für die noch vor wenigen Jahren vier separate 100G-Verbindungen erforderlich gewesen wären. Der IEEE 802.3bs-Standard regelt diese Spezifikationen, und große MSA-Gruppen, darunter QSFP-DD und OSFP, haben konkurrierende Formfaktordefinitionen vorangetrieben, die weiterhin Beschaffungsentscheidungen bei Hyperscale-Betreibern und Unternehmensnetzwerken gleichermaßen beeinflussen.

Die Weiterentwicklung der Bandbreite ist mit einer gewissen Unvermeidlichkeit verbunden, die Branchenveteranen mittlerweile erwarten. Der Sprung von 10G auf 40G fühlte sich damals bedeutsam an. Dann kam 100G und plötzlich redeten alle über Spine-Leaf-Architekturen und Ost-West-Verkehrsmuster. Aber 400G? Dieser Übergang war anders.

Das NRZ-Modulationsschema, das uns von 1G bis 25G gute Dienste geleistet hat, konnte wirtschaftlich einfach nicht über 100G hinaus skaliert werden. Die Physik wurde teuer. Die Signalintegrität wurde zum Albtraum. Man könnte NRZ zwar technisch stärker vorantreiben,-aber die Kostenkurven machten für den Masseneinsatz keinen Sinn. Also stellte die Branche auf PAM4 um.

Was PAM4 macht-und das ist es wert, verstanden zu werden, wenn Sie die Infrastruktur spezifizieren-ist die Codierung von zwei Bits pro Symbol statt einem. Vier Amplitudenstufen statt zwei. Doppelter Datendurchsatz ohne Verdoppelung der Baudrate. Der Kompromiss? Ihr Signal-zu-Verhältnis muss im Vergleich zu NRZ um etwa 10 dB beeinträchtigt werden. Das ist nicht trivial. Aus diesem Grund wird jedes 400G-Modul mit integrierter Vorwärtsfehlerkorrektur ausgeliefert und der DSP (digitaler Signalprozessor) ist zu einer so wichtigen Komponente in diesen Transceivern geworden.

20240618103224

Ich verfolge schon seit Jahren die Debatte zwischen QSFP-DD und OSFP auf Messen und bei Beschaffungsbesprechungen. Beide Seiten haben stichhaltige Argumente. Keiner von beiden hat definitiv gewonnen.

QSFP-DD ist aus der QSFP-DD MSA-Allianz hervorgegangen, deren Killer-Feature die Abwärtskompatibilität ist. Sie haben eine Reihe von QSFP28-Modulen, die Sie noch nicht ersetzen möchten? Sie passen direkt in einen QSFP-DD-Käfig. Die Abmessungen-18,35 mm Breite, 89,4 mm Länge – behalten den gewohnten Formfaktor bei. Sie können 36 Ports in einer 1U-Frontplatte unterbringen. Das entspricht einem Gesamtdurchsatz von 14,4 Tbit/s, wenn Sie jeden Steckplatz bestücken. Für Betreiber, die schrittweise aufrüsten, ist dies von enormer Bedeutung.

OSFP verfolgte einen anderen Ansatz. Die Octal Small Form-factor Pluggable-Gruppe sagte: Vergessen Sie die Abwärtskompatibilität, optimieren wir das Wärmemanagement und die zukünftige Skalierbarkeit. Mit einer Breite von 22,58 mm und einer Länge von 107,8 mm verfügen OSFP-Module über mehr Oberfläche zur Wärmeableitung. Sie unterstützen Leistungsumfänge von bis zu 15-20 Watt gegenüber der 12-15-W-Obergrenze von QSFP-DD. Wenn Sie kohärente Optik betreiben oder 800G planen, wird dieser Spielraum relevant.

NVIDIA hat sich für seine Quantum-2 InfiniBand-Plattform ganz auf OSFP verlassen. Das ist nicht nichts. Aber Enterprise-Switches von Cisco und Arista liefern immer noch überwiegend QSFP-DD-Ports.

Wenn Sie jemals auf ein Datenblatt gestarrt haben und sich gefragt haben, warum DR4 weniger kostet als FR4, obwohl es sich bei beiden um „400G-Module“ handelt, sind Sie nicht allein. Die Nomenklatur folgt Mustern, aber diese Muster haben Ausnahmen und die Ausnahmen haben ihre eigene Logik.

SR (kurze Reichweite): Multimode-Faser, 850 nm Wellenlänge. Der 400G-SR8 nutzt acht parallele Spuren von 50G PAM4 über einen MPO-16-Anschluss. Die Reichweite liegt bei etwa 100 Metern auf OM4-Fasern und 70 Metern auf OM3-Fasern. Es gibt auch SR4, das mithilfe von schnelleren VCSELs 100 G in jede der vier Lanes packt. Gleiche Reichweite, weniger Fasern. Die 400G-SR4.2-Variante (manchmal auch BIDI genannt) wird mit der bidirektionalen Übertragung clever, indem sie zwei Wellenlängen in jede Richtung überträgt, um 400G über nur vier Fasern zu erreichen.
DR4: Single-Mode-Faser, 1310 nm, 500 Meter. Dies ist das Arbeitspferd für Intra-Rechenzentrumsverbindungen, die länger sind, als SR verarbeiten kann. Jede der vier optischen Spuren überträgt 100G PAM4 über ein dediziertes Glasfaserpaar. MPO-12-Anschluss. Die Breakout-Fähigkeit ist hier von Bedeutung. -Ein DR4 kann in vier unabhängige 100G-DR-Links aufgeteilt werden, was beim Anschluss älterer 100G-Geräte hilfreich ist.
FR4: Zwei Kilometer, Single--Modus. Hier lohnt sich die Getriebearchitektur. Das Modul nimmt acht elektrische 50G-Lanes auf, wandelt sie über DSP in vier optische 100G-Lanes um und multiplext dann alle vier wellenlängen-auf ein einzelnes Faserpaar unter Verwendung von CWDM4-Abständen (1271, 1291, 1311, 1331 nm). Duplex-LC-Stecker. Viel übersichtlichere Verkabelung als der parallele Ansatz von DR4.
LR4 und darüber hinaus: Gleiches Wellenlängenschema wie FR4, jedoch optimiert für eine Reichweite von 10 km. ER4 schiebt auf 40 km. ZR4 erreicht 80 km, erfordert aber eine kohärente Erkennung.-Völlig andere Technologie, anderer Preis, anderer Anwendungsfall. Der 400ZR-Standard von OIF zielt speziell auf Metro-DCI-Anwendungen ab, bei denen Sie steckbare kohärente Optiken in einer Schalterblende benötigen.

202406181032262

Jeder 400G-Transceiver enthält einen digitalen Signalprozessor. Jeder einzelne. Dies ist nicht optional-PAM4-Modulation funktioniert einfach nicht ohne ausgefeilte Signalkonditionierung.

Was macht der DSP eigentlich? Feed-Forward-Entzerrung zur Kompensation von Kanalverlusten. Entscheidungsrückkopplungsausgleich für inter-Symbolinterferenzen. Takt- und Datenwiederherstellung, um das Timing aus dem empfangenen Signal zu extrahieren. FEC-Kodierung beim Senden, FEC-Dekodierung und Fehlerkorrektur beim Empfang. Fügen Sie in kohärenten Modulen die chromatische Dispersionskompensation und das Polarisationsmodus-Dispersionsmanagement zu dieser Liste hinzu.

Der DSP verbraucht Strom. Vieles davon. In vielen 400G-Modulen ist der DSP für mehr als die Hälfte des gesamten Stromverbrauchs verantwortlich. Marvell, Broadcom und Inphi (jetzt Teil von Marvell) stehen im Wettbewerb um die Verkleinerung von Prozessknoten und die Verbesserung der Effizienz. Der Sprung von 7-nm- auf 5-nm-DSPs hat zu erheblichen Energieeinsparungen in der Größenordnung von 20 % bei gleicher Funktionalität geführt.

Es gibt eine anhaltende Debatte darüber, ob DSPs in den Switch-ASIC selbst integriert werden sollten (was manche als „linear pluggable optics“ oder LPO bezeichnen). Das Argument lautet: Wenn Sie die Signalverarbeitung bereits auf dem Switch durchführen, warum sollten Sie sie dann in jedem Transceiver replizieren? Das Gegenargument betrifft die Modulinteroperabilität und die praktischen Herausforderungen bei der Qualifizierung von Optiken über verschiedene Switch-Plattformen hinweg. Das wird sich in den nächsten Jahren abspielen.

Erinnern Sie sich noch daran, als alle davon ausgingen, dass InP-Laser (Indiumphosphid) 400G dominieren würden? Die Erzählung veränderte sich.

Intel und Cisco setzten schon früh auf die Silizium-Photonik-, indem sie optische Komponenten mithilfe von Standard-CMOS-Fertigungsprozessen auf Siliziumsubstrate integrieren. Bei dem Versprechen ging es immer um die Kosten im Maßstab. Herkömmliche diskrete Optiken erfordern den manuellen Zusammenbau von Laserchips, Modulatoren und Fotodetektoren, jeweils aus unterschiedlichen Materialien. Mit der Siliziumphotonik können Sie einen Großteil der optischen Engine auf einem einzigen Chip aufbauen.

Die heute ausgelieferten 400G-DR4-Silizium-Photonikmodule bieten überzeugende Wirtschaftlichkeit für Hyperscale-Implementierungen. Sie sind noch nicht allgemein günstiger als EML-basierte Alternativen--, aber die Kostenentwicklung begünstigt Silizium, da die Fab-Erträge steigen. Auch der Stromverbrauch profitiert, insbesondere im Modulatorbereich.

Allerdings ergibt Silizium einen mittelmäßigen Laser. Das Problem der indirekten Bandlücke ist nicht gelöst. Selbst Silizium-Photonikmodule verwenden daher typischerweise einen externen InP- oder GaAs-Verstärkungschip, der hybrid-in die Siliziumplattform integriert ist. Es ist eine elegante Technik, aber „Siliziumphotonik“ bleibt eine eher ehrgeizige Terminologie.

Ein voll bestückter 400G-Switch läuft heiß. Daran führt kein Weg vorbei.

Bedenken Sie: 32 Ports mit 400G-DR4-Modulen, die jeweils 10–12 Watt verbrauchen. Das sind 320–384 W allein von den Transceivern, vor Berücksichtigung der Schalter-ASIC, des Speichers, der Lüfter und der Stromumwandlungsverluste. Die thermische Dichte in einer modernen Rechenzentrumsreihe hat sich in den letzten fünf Jahren verdoppelt. Facility-Teams hassen uns.

Der größere Formfaktor von OSFP berücksichtigt diese etwas{0}größere Oberfläche, bessere Luftstromkanäle und integrierte Kühlkörperdesigns, die direkt mit Switch-Kühlsystemen verbunden werden können. QSFP-DD-Module hängen stärker von der thermischen Architektur der Host-Ausrüstung ab. Beides ist nicht „falsch“, aber die thermischen Überlegungen sollten unbedingt Ihre Entscheidung über den Formfaktor beeinflussen, wenn Sie für anhaltend hohe{4}Bandbreiten-Arbeitslasten bauen.

Bei diesen Dichten stößt die Luftkühlung an ihre praktischen Grenzen. Flüssigkeitskühlung-Kühlplatten auf Switch-ASICs, möglicherweise Eintauchen ganzer Racks-ist kein Exot mehr. Es handelt sich lediglich um eine teure Infrastruktur, deren Spezifizierung und Wartung die Einrichtungen immer noch lernen müssen.

Eine Funktion, die nicht genug Beachtung findet: 400G-Module können oft für den Breakout-Betrieb konfiguriert werden und stellen dabei mehrere Schnittstellen mit niedrigerer Rate-für das Hostsystem dar.

Aus einem 400G-SR8 können zwei 200G-SR4-Links oder zwei 100G-SR4-Links mit halber Rate oder sogar acht unabhängige 50G-Kanäle (die „kanalisierte“ oder SR8-C-Variante) werden. Ein 400G-DR4 kann auf vier 100G-DR-Verbindungen aufgeteilt werden – nützlich, wenn Sie einen 400G-Switch-Port mit vier separaten 100G-Servern verbinden müssen.

Hier wird die Verkabelung interessant. Ein MPO-12-zu-4xLC-Duplex-Breakout-Kabelbaum nimmt einen einzelnen DR4-Port und verteilt ihn auf vier unabhängige SMF-Paare. Netzwerkarchitekten lieben diese Flexibilität, aber die Auswirkungen auf das Kabelmanagement sind real. Ihr strukturierter Verkabelungsplan muss Breakout-Szenarien vom ersten Tag an berücksichtigen, andernfalls werden Sie sechs Monate nach der Bereitstellung Ad-hoc-Patchkabel verlegen.

Die Branche bewegt sich schnell. . 800G-Transceiver werden jetzt ausgeliefert-hauptsächlich SR8- und DR8-Varianten für AI-Cluster-Verbindungen. Macht 400G dadurch obsolet? Nicht einmal annähernd.

Das 400G-Ökosystem ist ausgereift. Die Modulkosten sind deutlich gesunken. Die Interoperabilität zwischen den Anbietern ist gut etabliert.- Für die meisten Unternehmens- und Cloud-Netzwerkanforderungen stellt 400G das Optimum an Leistung, Kosten und betrieblicher Vertrautheit dar. Es wird noch viele Jahre lang der führende Anbieter für Leaf-Spine Fabrics und allgemeine -Rechenzentrumskonnektivität bleiben.

800G und schließlich 1,6T werden in KI-/ML-Umgebungen dominieren, in denen GPUs Trainingsdaten mit absurden Geschwindigkeiten übertragen müssen. Anderer Markt, andere Anforderungen, andere Budgetgespräche. Die meisten Netzwerke müssen dieser Kurve nicht folgen.

400g Optical Module

Einige Dinge haben wir auf die harte Tour gelernt:

Die EEPROM-Kompatibilität von Modulen ist wichtiger, als die Anbieter zugeben. „Kompatible“ Transceiver, die in einem Switch-Modell einwandfrei funktionieren, können bei einem anderen Switch-Modell mit demselben ASIC, aber unterschiedlicher Firmware Fehler verursachen. Planen Sie Testzeit ein, wenn Sie Optiken von Drittanbietern-qualifizieren.

Der LC-Anschluss an FR4- und LR4-Modulen ist duplex-insgesamt zwei Fasern-, aber der MPO-Anschluss an DR4 und SR8 verwendet APC-Polierung (Angled Physical Contact). Das Mischen von APC- und UPC-Anschlüssen führt zu einer Rückflussdämpfung von über 20 dB und zeitweiligen Fehlern. Die Farbcodierung existiert aus einem bestimmten Grund.

PAM4-Module verschiedener Hersteller können leicht unterschiedliche FEC-Implementierungen haben. Die Standards lassen Raum für Interpretationen. Wenn Sie auf einer Verbindung unerklärlich viele korrigierte Fehler feststellen, versuchen Sie, ein Ende gegen ein Modul desselben-Anbieters auszutauschen, bevor Sie die Schuld dem Glasfaserwerk geben.

Die Temperatur ist wichtig. Diese Module sind normalerweise für Gehäusetemperaturen von bis zu 70 Grad ausgelegt, die Leistung nimmt jedoch ab, bevor diese Obergrenze erreicht wird. Bleiben Sie cool, wenn Sie ein konsistentes Verhalten wünschen.

Optische 400G-Module haben sich von der Spitzen- zur Mainstream-Infrastruktur entwickelt. Die Technologieentscheidungen-QSFP-DD versus OSFP, parallel versus WDM, Silizium versus diskrete Optik-bergen nicht mehr das gleiche Risiko wie vor drei Jahren. Es gibt robuste Lieferketten. Mehrere qualifizierte Anbieter konkurrieren hinsichtlich Preis und Funktionen. Normungsgremien haben die meisten Randfälle der Interoperabilität geklärt.

Für Netzwerkarchitekten, die heute Bereitstellungen planen, ist das Auswahlgerüst unkompliziert: Passen Sie den Formfaktor an Ihre Switch-Plattformstrategie an, wählen Sie den Transceivertyp (SR/DR/FR/LR) basierend auf den tatsächlichen Reichweitenanforderungen aus und überschreiten Sie nicht die Spezifikationen. Ein 400G-LR4 kostet deutlich mehr als ein 400G-DR4 – wenn Ihre längsten Läufe 300 Meter betragen, verschwenden Sie Ihr Budget, ohne dass Ihnen betriebliche Vorteile entstehen.

Die nächsten Jahre werden schrittweise Verbesserungen bringen: DSPs mit geringerem Stromverbrauch, bessere Silizium-Photonik-Erträge, möglicherweise eine gewisse Standardisierung rund um linear steckbare Architekturen. Aber die grundlegende Technologieplattform hat sich stabilisiert. 400G entsteht nicht mehr. Es handelt sich jetzt nur noch um eine Infrastruktur-von der Art, die Sie mit Zuversicht planen können.

Und ganz ehrlich? Nach dem Chaos der frühen 100G-Ära ist diese Vorhersehbarkeit wertzuschätzen.

← Ein paar: Optisches 400G-Modul: Hauptmerkmale und Vorteile

Der nächste streifen: Sollte ein Fronthaul einer Basisstation 6, 12 oder 24 Module verwenden? →

Anfrage senden

Das optische 400g-Modul verstehen

Warum 400G passierte, als es passierte

Die Formfaktorkriege

Was die Buchstaben tatsächlich bedeuten

Die DSP-Frage

Die Siliziumphotonik kommt ins Spiel

Energie und thermische Realitäten

Breakout-Szenarien

Was 800G für 400G bedeutet

Praktische Überlegungen, über die niemand schreibt

Der Weg nach vorn