Kanonische Webseitenwahl: Schlüsselstrategie für SEO in der digitalen Welt
April 5, 2024

In der digitalen Welt, in der Suchmaschinenoptimierung (SEO) eine Schlüsselrolle für die Sichtbarkeit von Webinhalten spielt, ist die Wahl der kanonischen Webseite ein zentrales Thema. Google, der Gigant unter den Suchmaschinen, hat einen komplexen Prozess entwickelt, um aus mehreren ähnlichen Webseiten die sogenannte kanonische Version auszuwählen. Diese kanonische Version wird bevorzugt in den Suchergebnissen angezeigt und beeinflusst maßgeblich die SEO-Effizienz von Websites.
Was ist eine kanonische Webseite?
Eine kanonische Seite ist die von einem Publisher oder Suchmaschinenbetreiber als die Hauptversion einer Reihe von doppelten oder ähnlichen Seiten angesehene Version. Für Publisher und SEO-Experten ist diese Hauptversion oft die ursprüngliche Seite oder die Version, von der sie glauben, dass sie am stärksten ist und somit am besten für das Ranking in Suchmaschinen geeignet ist.
Google jedoch betrachtet die kanonische Seite aus einer anderen Perspektive. Statt auf die Präferenzen der Website-Betreiber zu achten, konzentriert sich Google darauf, aus einer Gruppe von Duplikaten die Version auszuwählen, die die Gruppe am besten repräsentiert – basierend auf verschiedenen Signalen, die über jede Version gesammelt wurden.
Warum gibt es überhaupt Duplikate?
Es gibt viele Gründe, warum eine Website Duplikate von Seiten haben könnte. Einige der häufigsten Ursachen sind:
- Regionale Varianten: Zum Beispiel Inhalte, die sowohl für die USA als auch für das Vereinigte Königreich bestimmt sind und in derselben Sprache, aber unter verschiedenen URLs verfügbar sind.
- Gerätevarianten: Beispielsweise eine Seite mit einer mobilen und einer Desktop-Version.
- Protokollvarianten: Zum Beispiel HTTP- und HTTPS-Versionen einer Website.
- Website-Funktionen: Beispielsweise die Ergebnisse von Sortier- und Filterfunktionen auf einer Kategorieseite.
- Zufällige Varianten: Zum Beispiel eine versehentlich für Crawler zugängliche Demoversion einer Website.
Signale zur Auswahl der kanonischen Seite
Google verwendet eine Vielzahl von Signalen, um die kanonische Version einer Webseite zu bestimmen. Dazu gehören explizite Hinweise von Website-Betreibern, wie beispielsweise das rel="canonical"-Tag im HTML-Code einer Seite, aber auch weniger offensichtliche Faktoren wie die Bedeutung einer einzelnen Seite im Internet.
Zum Beispiel sind interne Verlinkungen, die Verwendung der bevorzugten URL im Sitemap und permanente Weiterleitungen (Redirects) Hinweise, die Google dabei helfen, die gewünschte kanonische URL des Website-Betreibers zu identifizieren. Google bevorzugt außerdem HTTPS-URLs gegenüber HTTP-URLs und tendiert dazu, "schönere" URLs als kanonisch auszuwählen.
Duplikat-Cluster und ihre kanonischen Seiten
Nachdem Google den Inhalt einer Seite erfasst hat, gruppiert es diese mit ähnlichen Seiten in sogenannten Duplikat-Clustern. Jeder dieser Cluster erhält eine kanonische Version, welche die Inhalte in den Suchergebnissen für alle anderen Versionen repräsentiert. Die anderen Versionen im Cluster werden zu alternativen Versionen, die in unterschiedlichen Kontexten bereitgestellt werden können, zum Beispiel wenn ein Nutzer nach einer sehr spezifischen Seite aus dem Cluster sucht.
Wichtige Punkte zur Auswahl kanonischer Seiten
- Der Hauptinhalt wird als "Centerpiece" einer Seite bezeichnet.
- Google berechnet eine Vielzahl von Signalen für jede entdeckte Seite.
- Signale sind Daten, die für die "weitere Verarbeitung" nach der Entdeckung von Webseiten verwendet werden.
- Einige Signale sind von den Publishern kontrollierbar, wie Hinweise (und vermutlich Direktiven). Das von Illyes erwähnte Signal ist das rel="canonical"-Link-Attribut.
- Andere Signale liegen außerhalb der Kontrolle des Publishers, wie die Bedeutung der Seite im Kontext des Internets.
- Einige Duplikatseiten können als alternative Versionen dienen.
- Alternative Versionen von Webseiten können ebenfalls ranken und sind sowohl für Google als auch für den Publisher nützlich für Rankingzwecke.
Machine Learning und die Gewichtung von Signalen
Google nutzt Machine Learning, um die Gewichtung der verschiedenen Signale zu berechnen, anstatt sich auf menschliche Eingaben zu verlassen. Diese Gewichtungen können sich unterscheiden; so haben beispielsweise Weiterleitungen ein höheres Gewicht als das HTTP/HTTPS-URL-Signal.
Zusammenfassung
Die Auswahl der kanonischen Seite ist ein komplexer Prozess, der von einer Vielzahl von Faktoren beeinflusst wird. Webmaster müssen darauf achten, konsistente Signale an Google zu senden, um ihre bevorzugte kanonische URL zu fördern. Jedoch hat letztendlich Google das letzte Wort, welche Seite als kanonisch ausgewählt wird. Da sich die Gewichtungen der Signale im Laufe der Zeit ändern können, ist es für Webmaster wichtig, aktuelle SEO-Praktiken zu befolgen und ihre Strategien entsprechend anzupassen.