von André Hoek
Suchmaschinen gibt es an jeder Ecke des Webs. So viele werden gar nicht gebraucht. Und tatsächlich, nur wenige bringen tatsächlich auch Besucher. Die größten 15 reichen da normalerweise völlig aus. Von den anderen kommt aller Wahrscheinlichkeit nach eh kaum etwas. Da ist es sinnvoller ein paar gute Links zu tauschen.
Im Jahr 2003 begann der Suchmaschinenriese Google, Webseiten abzustrafen, die doppelte Inhalte verwendeten. Hintergrund dieser Aktion war eine auffällige Häufung von Webseiten gleichen Inhalts in den vorderen Positionen der SERPs (search engine results pages = Suchmaschinen-Ergebnisseiten). Für die nach Informationen Suchenden, war dieser Umstand mehr als lästig. Die Abstrafungsaktion sah wie folgt aus.
Google listete die Seiten mit einem guten Ranking und einem hohen Pagerank weiterhin vorn in den SERPs und verbannte alle anderen Seiten ins Nirwana der Suchmaschinen-Ergebnisseiten. In Einzelfällen wurden auch die Webseiten bevorzugt, die als erste mit dem fraglichen Content online waren.
Wie kommt es zu doppeltem Content?
Die meisten Webmaster arbeiten lange und hart, um ihre Webseiten mit interessanten und relevanten Texten zu füllen oder lassen diese von einem professionellen Autor gegen Bezahlung erstellen. Nun gibt es immer wieder Zeitgenossen, die sich diese Arbeit oder die Kosten ersparen möchten. Per Copy and Paste werden Texte von fremden Webseiten herausgenommen und in die eigene Seite eingebaut. Der Grund ist hier meistens die Unlust oder die Unfähigkeit, eigene Texte zu verfassen.
Wieder andere schicken Spider durch das Netz, die Textinhalte im großes Stil von anderen Webseiten entführen. Diese Texte werden dann automatisiert und mit Links versehen, durch das Internet gespamt. Plötzlich tauchen die eigenen Inhalte in diversen Gästebüchern und Foren auf.
Aber auch Unachtsamkeit von Webmastern, die versehentlich gleiche Inhalte unter verschiedenen Datei-Namen abspeichern, kann zu doppeltem Content führen.
Ebenso können übereifrige SEOs in die Duplikate-Content-Falle tappen. So sieht man es immer wieder mal, dass Subdomains exakte Spiegelbilder der Hauptdomain sind oder die gleichen Inhalte, um den Suchmaschinen mehr Content vorzugaukeln, zwei-, drei- und vierfach auf ein und derselben Domain existieren.
Ein weiterer Fall von doppeltem Content entsteht, wenn Inhalte der gleichen Webseite einmal mit dem Vorsatz „www.“ und einmal ohne diesen zu erreichen sind. Aus diesem Grund sollte man auch mit den entsprechenden Einstellungen in den Google-Webmastertools äußerst sorgfältig umgehen. Derselbe Effekt tritt übrigens auch ein, wenn die Startseite einmal unter www.IhreDomain.de und einmal unter www.IhreDomain.de/index.html zu erreichen ist. Entsprechende Einstellungen können im Quelltext durch Veränderungen in der internen Verlinkung oder in der .htaccess vorgenommen werden.
Welcher Schaden kann entstehen?
In den Suchmaschinenergebnisseiten taucht auf einmal eine andere Internet -Domain mit den eigenen Inhalten deutlich besser gelistet auf. Der Grund dafür könnte sein, dass die Webseite mit den gestohlenen Inhalten über deutlich mehr Backlinks verfügt als die eigene Seite. Irgendwann glaubt Google dann, dass diese Seite die Rechte an dem fraglichen Content besitzt. Das Ende vom Lied kann sein, dass die Ursprungsseite eine massive Abstrafung erfährt oder ganz aus dem Suchmaschinenindex ausgeschlossen wird.
Wenn die Umstände äußerst ungünstig liegen, besteht sogar die Gefahr eines so genannten Hijackings. Das bedeutet im Klartext, die eigenen Inhalte werden in den Suchmaschinenergebnisseiten unter einer anderen Domain angezeigt. Dieser Fall stellt aber eher die Ausnahme dar.
Nun gibt es viele Webmaster, die Einnahmen durch Werbung oder andere Quellen mit ihren Webseiten generieren. Werden diese Webseiten plötzlich wesentlich schlechter gelistet, so ist der Schaden sehr schnell in harten Euros zu beziffern.
Wie kann man sich schützen?
Zuallererst ist es wichtig, doppelten Content überhaupt zu entdecken. Hierbei leistet die Webseite www.Copyscape.com gute Dienste. Man hat dort die Möglichkeit, seine URL einzugeben und Copyscape listet in Sekundenschnelle alle Webseiten im Internet auf, die Texte Ihrer Webseite verwenden. Nach einer Anmeldung auf dieser Webseite, kann man auch noch nicht veröffentlichte Texte dahingehend überprüfen, ob diese bereits in irgendeiner Form im Internet existieren.
Die nächste Möglichkeit ist, die Programmierung der Webseite auf einen der oben genannten Fehler zu überprüfen. Ein weiterer Schritt wäre das konsequente Aussperren der Text-Spider. Dies kann man zum einen mit der .htaccess erledigen. Allerdings ist hier der Aufwand sehr hoch. Hilfestellung bietet das php-Script von www.bot-trap.de.
Ich habe doppelten Content entdeckt, was kann ich tun?
Der erste Weg ist immer eine E-Mail, sowie ein Anruf bei dem Webmaster, bei dem man eigenen Content entdeckt hat. Man fordert diesen höflich, jedoch bestimmt auf, die fraglichen Inhalte unverzüglich zu entfernen. Kommt der Webmaster dieser Aufforderung nicht nach, so kann man sofort klagen, auf Unterlassung wegen Urheberrechtsverstößen und gegebenenfalls auf Schadenersatz. Dies allerdings hilft nichts wenn der Opponent ein “Profi” ist, der mit Bots arbeitet. Der weiß genau was geschieht. Hier ist alle Mühe vergebens.
Erstveröffentlichung 22.04.2008




Wenn ich das jetzt richtig verstehe,dann reicht es,in den webmaster tools von google die einstellung mit www oder ohne anzugeben und dann wäre das problem mit dem doppelten Content Bereits erledigt? Liesst der google sp denn noch meine webseite aus,wenn ich die text sp ablehne?ja auch nicht sinn der sache!
Der Aussage bezüglich Suchmaschinen würde ich nicht zustimmen. Ich finde es nicht sinnvoll, auf bestimmte Suchmaschinen hin zu optimieren. tatsächlich muss man Inhalte für den Nutzer optimieren, dann sind sie auch gut für ALLE Suchmaschinen. IMO werden Spezialsuchmaschinen immer mehr an Bedeutung gewinnen.
toller artikel darauf machen wir gerne einen link bei uns!
Und welche kostenlosen Alternativen gibt es noch? Copyscape scheint an sich ein sehr guter Dienst zu sein, aber leider kostenpflichtig. Wäre doch interessant zu wissen, wo es noch so etwas ähnliches gibt.