Duplicate Content – Keine Abstrafung durch google, ABER…

Duplicate Content wird immer wieder genannt, wenn es um Suchmaschinenoptimierung geht. Häufig haben Webseitenbetreiber die Angst, dass ihre Seite Rankings verliert oder sogar durch google bestraft bzw. abgestraft wird, wenn sie Duplicate Content nutzen. Das wichtigste gleich vorweg: Duplicate Content wird durch google nicht abgestraft. Aber es kann Auswirkungen auf das Ranking haben.

Zunächst was ist Duplicate Content. Die Kollegen von Sistrix haben das auf ihrer Hilfeseite eigentlich perfekt beschrieben:

Unter Duplicate Content (engl. für „doppelter Inhalt“), oft auch als „DC“ abgekürzt, ist das Vorhandensein von identischen Inhalten (Content) auf einer oder mehrere Websites zu verstehen. Man unterscheidet zwischen internem Ducplicate Content und externem Duplicate Content.

– Sistrix.de

Interner DC ist im Prinzip immer dann vorhanden, wenn auf der eigenen Seite unter verschiedenen URLs der gleiche Inhalt auftaucht. Hierzu gibt es zwei typische Fälle:

  1. Duplicate Content bei ähnlichen Produkten in Onlineshops
  2. Duplicate Content weil die Seite sowohl mit www. als auch ohne www. sowie mit https und ohne https (also mit und ohne SSL-Verschlüsselung) aufrufbar ist

Der zweite Punkt gehört zum kleinen 1×1 der Suchmaschinenoptimierung ist ist sehr einfach zu beheben. Es braucht entsprechende .htaccess Einträge, welche sogenannte 301-Weiterleitungen enthalten. Jede SEO Agentur und jede Werbeagentur, welche hier nicht automatisch und ungefragt für den Kunden tätig werden, sind ihr Geld nicht wert.

Es gibt auch noch andere Möglichkeiten eine 301-Weiterleitung einzubauen, z.B. via php-Header, aber aus unserer Sicht ist ein Eintrag in der .htaccess die sauberste und einfachste Lösung.

Die .htaccess braucht, um den DC von https/http und www/no-www zu vermeiden zwei Einträge. An der Stelle sei angemerkt, dass es verschiedene Schreibweisen für diese Redirects (Weiterleitungen) gibt und diese hier nur ein Beispiel ist. Im Web finden sich auch für Laien zahlreiche 301-Generatoren und WordPress bietet eine Vielzahl an 301-Redirect Plugins.

RewriteCond %{HTTPS} off
RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

RewriteCond %{HTTP_HOST} !^www\.orange-raven\.de$ [NC]
RewriteRule ^(.*)$ https://www.orange-raven.de/$1 [L,R=301]

Erstere leitetet jede Anfrage sofort auf die https:// Variante der Seite um und zweitere leitet immer auf die www Variante um.

Wer also versucht die Seite „https://www.orange-raven.de“ aufzurufen wird sofort auf „https://www.orange-raven.de“ umgeleitet. Das ist wichtig, da google jede einzelne Variante der URL sonst als eigene Seite identifiziert und dementsprechen Duplicate Content annimmt. So gesehen ist es also aus Sicht von google eigentlich auch externer DC, der übersichtlichkeit wegen ordnen wir es hier aber zum internen DC. (Auch wenn einige SEO Kollegen hier vielleicht protestieren)

Bevor wir zu Punkt 1 beim Internen DC kommen, müssen wir zum externen DC gehen, da die Lösung für beides im Prinzip miteinander zusammenhängt.

Externer DC wird dann erzeugt, wenn auf verschiedenen Seiten der gleiche Inhalt vorherrscht.

Warum ist das ein Problem?

Dazu aus der google Webmasterhilfe:

Gelegentlich wird Content jedoch bewusst auf verschiedenen Domains dupliziert mit der Absicht, das Ranking bei Suchmaschinen zu beeinflussen oder mehr Zugriffe auf sich zu ziehen. Derart unfaire Verhaltensweisen können zu einer negativen Nutzererfahrung führen, da den Besuchern im Grunde derselbe Content in einer Reihe von Suchergebnissen angezeigt wird.

Google will also vermeiden, dass Seite B den Inhalt von Seite A kopiert um besser als Seite A zu ranken und diese somit zu verdrängen.

Wenn google also Duplicate Content erkennt, wird es keine der Seiten direkt abstrafen. Es gibt keinen DC-Penalty! Aber google wird anhand verschiedener Kriterien prüfen, welcher der beiden Versionen der relevantere ist und nur diesen listen. Der andere wird entweder gar nicht in die Suchergebnisse aufgenommen oder aber landet in den Ergebnissen sehr weit hinten.

Das bringt uns zunächst zum internen DC zurück. Was wenn auf verschiedenen Seiten (z.B. Produktseiten) sehr ähnliche oder gleiche Texte stehen?

Sofern auf den Seiten noch weitere, produktspezifische Informationen stehen ist das überhaupt kein Problem. Die google Algorithmen erkennen den Kontext und können differenzieren, dass es sich um verschiedene, aber ähnliche Produkte handelt und werden diese entsprechend listen.

Nur wenn ein und der selbe Inhalt unter verschiedenen URLs aufrufbar ist, wird google sich das scheinbar relevanteste Ergebnis aussuchen. Tritt dies zu häufig auf, interpretiert google die Seite als „wenig gepflegt“ und wird sie im Vergleich zu Mitbewerbern schlechter ranken. Hier ist man also gezwungen mit 301- und 302-Weiterleitungen zu arbeiten (301 = Permanente Weiterleitung, 302 = Temporäre Weiterleitung).

Und was bedeutet das für den externen Content?

Man darf den Content anderer Seiten durchaus verwenden (zumindest aus google Sicht, Urheberrecht bleibt davon natürlich unberührt). Man darf dann aber nicht damit rechnen zu diesem Thema vor dem ursprünglichen Artikel zu landen. Am besten gibt man direkt einen Backlink zum Artikel an um google damit zu sagen „der Inhalt stammt von da“. Das bringt zwar für die eigene Seite keinen Vorteil, aber der Artikel kann ja trotzdem für die Nutzer interessant sein und das wiederum bringt Nutzersignale und damit doch einen positiven Rankingfaktor.

Dann gibt es noch den speziellen Fall, dass man woanders Content produziert hat (z.B. als Gastbeitrag) und diesen auch auf der eigenen Seite verwenden will. Es gilt das gleiche wie oben oder aber man verlinkt vom Gastbeitrag auf den eigenen Beitrag und stellt somit sicher, dass google den Beitrag auf der eigenen Seite mit hoher Wahrscheinlichkeit bevorzugt.

Die einzige Ausnahme für google bilden Seiten, welche keinerlei eigenen Content haben. Stellt google das fest, wird die Seite als unrelevant aus den Suchergebnissen verbannt bzw. sehr weit nach hinten versetzt. Diebstahl lohnt sich also nicht.

Fazit

Duplicate Content ist erst einmal nichts schlimmes und an einigen Stellen kaum zu vermeiden. Wenn man ein paar Spielregeln beachtet, wird es der Seite nicht schaden aber eben auch nicht direkt nützen.

Wichtig ist, dass man 301-Weiterleitungen setzt um internen DC zu vermeiden und Content von anderen Seiten nur kopiert, wenn es wirklich nützlich ist. Im Normalfall mit Verlinkung auf die Quelle.