Was wird archiviert und was nicht?
Nicht alle Webinhalte lassen sich gleich gut archivieren. Moderne Technologien und Sicherheitsmaßnahmen erschweren die vollständige Erfassung. Die folgenden Bereiche bleiben oft unvollständig oder fehlen ganz im Archiv.
Login-geschützte Bereiche und Paywalls
Mitgliederbereiche, geschlossene Foren und kostenpflichtige Inhalte bleiben für die Wayback Machine unsichtbar. Streaming-Plattformen wie Netflix oder Premium-Bereiche von Nachrichtenseiten werden nicht archiviert.
JavaScript-lastige moderne Websites
Single Page Applications, die auf React, Vue oder Angular basieren, werden oft unvollständig gespeichert. AJAX-geladene Inhalte fehlen häufig. Infinite-Scroll-Bereiche werden meist nur im initial sichtbaren Bereich archiviert.
Von robots.txt blockierte Inhalte
Websites können die Archivierung explizit verbieten. Respektiert eine Website diese Anweisung, erscheint im Archiv der Hinweis, dass die Seite auf Wunsch des Betreibers nicht gespeichert wurde.
Große Mediendateien
Videos werden standardmäßig nicht archiviert. Hochauflösende Bilder fehlen oft oder erscheinen in komprimierter Form. PDF-Dateien über 10 MB werden häufig übersprungen.
03Cookie- und Consent-gesteuerte Inhalte
GDPR-konforme Websites zeigen Cookie-Banner, die den Content blockieren. Die Wayback Machine kann diese Zustimmung nicht erteilen. Das Ergebnis sind Snapshots mit sichtbarem Cookie-Banner, aber ohne darunter liegende Inhalte.
Mobile-Version
Die Crawler simulieren primär Desktop-Browser. Mobile-First-Websites erscheinen daher oft verzerrt oder unvollständig. Separate mobile URLs werden zwar archiviert, aber seltener gecrawlt als Desktop-Versionen.
| Gut archiviert | Nicht oder schlecht archiviert |
|---|---|
|
Statische HTML-Seiten |
Single Page Apps (React, Vue, Angular) |
|
Klassische Seiten in WordPress |
Login-geschützte Bereiche und Paywalls |
|
CSS-Stylesheets |
Personalisierte Inhalte |
|
Bilder bis etwa 5 MB |
4K-Videos und große Mediendateien |
|
Standard-JavaScript |
AJAX-nachgeladene Inhalte |
|
Öffentliche Desktop-Seiten |
Mobile-First-Websites |
|
Von robots.txt erlaubte Seiten |
Von robots.txt blockierte Seiten |






