Quellcode Durchleuchtung: Schlüssel zum digitalen Informationsreichtum
March 13, 2024

In der heutigen digitalen Welt ist der Quellcode einer Website eine wahre Goldgrube an Informationen. Ob Sie ein Entwickler sind, der Fehler beheben muss, ein SEO-Experte, der die Implementierung von Tags überprüfen möchte oder ein Konkurrent, der die Technologien der Konkurrenz erforscht – die Fähigkeit, den Quellcode einer gesamten Website durchsuchen zu können, ist unerlässlich. Doch wie geht man vor, wenn man spezifische Teile des Codes auf einer Website mit zahlreichen Seiten finden möchte?
Zunächst gilt es zu verstehen, dass der Quellcode einer Webseite in zwei verschiedenen Formen existieren kann. Zum einen gibt es den rohen HTML-Code, also den Quelltext, wie er vor der Ausführung jeglichen JavaScripts auf der Seite existiert. Diese Form des Codes ist das, was man üblicherweise sieht, wenn man in einem Browser die Option "Seitenquelltext anzeigen" verwendet. Zum anderen gibt es den gerenderten HTML-Code, der das Endresultat nach der Ausführung und eventuellen Modifikation durch JavaScript darstellt. Dieser ist in der Regel über die "Untersuchen" bzw. "Inspect"-Funktion im Browser sichtbar. Beide Versionen können sich erheblich unterscheiden, daher ist es wichtig, sicherzustellen, dass man durch die korrekte Version des Codes sucht.
Für eine gründliche Analyse des Quellcodes einer Website bieten sich verschiedene Werkzeuge und Methoden an. Eine Möglichkeit ist die Verwendung von spezialisierten Tools wie Ahrefs Site Audit oder den kostenlosen Ahrefs Webmaster Tools, die eine Suche durch den rohen HTML-Code oder den durch JavaScript gerenderten Code aller gecrawlten Seiten einer Website ermöglichen. Solche Tools sind besonders nützlich, um Analytics-Tags zu verifizieren, Seiten zu identifizieren, die bestimmte Skripte oder Stylesheets aufrufen, unerwünschte Code-Injection zu entdecken oder die Technologien der Wettbewerber zu erforschen.
Um den JS-gerenderten HTML-Code zu durchsuchen, muss ein Crawl im Site Audit oder in den Ahrefs Webmaster Tools mit aktivierter "JavaScript ausführen"-Option gestartet werden. Nach Abschluss des Crawls kann im "Page Explorer" über den erweiterten Filter nach einem spezifischen Codefragment gesucht werden.
Für die Suche im rohen HTML empfehlen sich einige zusätzliche Schritte. Zunächst muss das JavaScript-Rendering in den Crawl-Einstellungen deaktiviert werden und sicherstellen, dass alle Seiten vom Crawler entdeckt werden können. Dies ist entscheidend für Websites, bei denen Seiteninhalte (einschließlich interner Links) über JavaScript generiert werden, da der Crawler des Site Audits nicht automatisch alle Seiten über den rohen HTML-Code finden könnte. In solchen Fällen ist es ratsam, dem Tool eine Liste mit Start-URLs, sogenannte "Seeds", zur Verfügung zu stellen. Diese können entweder durch die Nutzung von Sitemaps oder durch eine benutzerdefinierte URL-Liste in den "URL Sources" bereitgestellt werden.
Aber nicht nur spezialisierte SEO-Tools bieten die Möglichkeit, den Quellcode zu durchsuchen. Auch Entwicklertools in modernen Browsern wie Chrome DevTools bieten Funktionen, die beim Durchforsten des Quellcodes helfen können. So ermöglicht beispielsweise die globale Suche in den Chrome DevTools (erreichbar über Control + Shift + F), das Durchsuchen aller HTML-, CSS- und JavaScript-Dateien, die auf dem aktuellen Tab verwendet werden, einschließlich Frames/iFrames.
Darüber hinaus gibt es weitere Methoden, wie das Speichern aller Netzwerkanfragen als HAR-Datei mit Inhalt im Netzwerk-Tab der Chrome DevTools und das anschließende Durchsuchen der HAR-Datei in einem Texteditor oder in einem Chromium-basierten Browser.
Für diejenigen, die nicht auf spezialisierte SEO-Tools zurückgreifen möchten oder können, gibt es Alternativen wie das Durchsuchen von Dateien und Ordnern mit Programmen wie Notepad++. Manche Entwickler nutzen auch Web-Scraping-Techniken, um den Quellcode zu sammeln und durchsuchen zu können, allerdings sind solche Methoden komplexer und bewegen sich in einer rechtlichen Grauzone, insbesondere wenn die Website nicht im Besitz des Suchenden ist.
Abschließend ist zu sagen, dass das Durchsuchen des Quellcodes einer gesamten Website eine anspruchsvolle Aufgabe ist, die sowohl technisches Verständnis als auch das Wissen um die richtigen Tools und Methoden erfordert. Mit den hier vorgestellten Techniken können Webentwickler, SEO-Fachleute und Analysten jedoch tiefe Einblicke in die Struktur und Funktionsweise einer Website erlangen und somit zu einem besseren Verständnis und einer optimierten Performance beitragen.