Dr.Web - Das Online Magazin für Seitenbetreiber

SEO: Der neue Canonical-Tag - ein Werkzeug gegen doppelten Content

Werbung

Doppelter Content ist gefürchtet. Mit dem "Canonical Tag" soll alles besser werden. Es lässt sich fortan bestimmen, welche URL bei den Suchmaschinen gelistet werden soll. Das sollte helfen, so manche Ängste zu zerstreuen.

Die Verhaltensweise des Suchmaschinenbetreibers Google ist schon ein wenig verwunderlich. Erst kürzlich wurde gemeldet, doppelter Content auf der gleichen Webseite würde nicht zu einer Abstrafung führen. Nun hat Google gemeinsam mit Microsoft und Yahoo einen neuen Meta-Tag ins Leben gerufen, mit dem sich die Konsequenzen aus internem doppelten Content verhindern lassen. Googles Aussage, dass interner doppelter Content kein Problem sei, entsprach wohl doch nicht ganz der Wahrheit.

Bevor wir nun aber auf den neuen Tag eingehen, stellt sich die Frage, wie doppelter Content überhaupt entsteht. Es geschieht nicht nur durch Textklau oder Autoblogs (wobei es sich quasi um einen automatisierten Textklau handelt), sondern auch unbeabsichtigt. Hier nun die häufigsten Ursachen für internen doppelten Content:

  • Eine Domain ist sowohl mit als auch ohne “www” aufrufbar.
  • Es besteht eine Doppelung bei der Internationalisierung (zum Beispiel einmal nur “.de” und einmal “.de.de”)
  • Die Seite ist unter zwei verschiedenen URLs aufrufbar (zum Beispiel einmal mit der Endung “.de” und einmal mit der Endung “.html”)
  • Die Tracking Parameter verursachen zwei verschiedene URLs (zum Beispiel einmal mit der normalen Endung “.de” und einmal mit der Endung “.de/source=11“)

Sollte eines dieser Beispiele zutreffen, hat man wegen des identischen Seiteninhalts doppelten Content und man wird unter Umständen mit den Folgen leben müssen. Dabei ist man ein wenig den Launen der Suchmaschinen ausgeliefert. Denn Google könnte durchaus erkennen, dass es sich um internen doppelten Content handelt. In diesem Fall würden die beiden URLs als identische Seiten behandelt werden. Gerade bei einer URL mit “www” und einer URL ohne “www” geschieht dies recht häufig. Doch es kann auch anders laufen und Google behandelt die beiden URLs wie jeden anderen Fall von doppelten Content.

Das würde heißen, dass nach der Identifizierung die beiden URLs zusammengefasst werden. Während eine URL dann zum Stellvertreter ernannt und bei den Suchmaschinen weiterhin gelistet wird, verschwindet die andere URL ins Nirwana und bleibt von den Suchmaschinen unberücksichtigt. Welche der beiden URLs dabei zum Stellvertreter gewählt wird, entscheidet die Suchmaschine für gewöhnlich anhand der internen und externen Verlinkungen. Der Seitenbetreiber kann also keinen direkten Einfluss darauf nehmen.

Genau dies ändert sich nun durch den Canonical Tag. Dank dieses HTML-Attributs darf der Seitenbetreiber selber entscheiden, welche URL der Stellvertreter ist. Diese URL wird dann bei den Suchmaschinen gelistet und ihr wird auch die Gewichtung beider Seiten zugesprochen, die aus den Verlinkungen resultiert. Die Anwendung dieses Tags gestaltet sich denkbar einfach. Im Head-Bereich der auserwählten Seite ist lediglich folgendes einzugeben.

<link rel=”canonical” href=”http://www.richtigeURL.de/”>

Als Vorsichtsmaßnahme könnte man dieses Werkzeug auf allen Seiten einsetzen, um im Falle doppelten Contents keine Konsequenzen fürchten zu müssen.

Kein Nutzen bei externem doppelten Content

Die unerlaubte Verwendung fremder Inhalte ist eines der größten Ärgernisse in der Welt des WWWs und dennoch kommt es regelmäßig vor. Sollte ein Fremder die eigenen Texte unerlaubt verwenden, so ist dies nicht nur moralisch verwerflich. Auch wirtschaftliche Konsequenzen können die Folge sein. Schließlich ist es nicht auszuschließen, dass die Seite des Diebes letztendlich bei Google gelistet wird und die eigene Seite nicht. Leider stellt der Canonical Tag in solchen Fällen keine Hilfe dar, denn er hat lediglich bei internem doppelten Content einen Nutzen. Wird man zum Opfer vom Textklau, muss man das Problem also weiterhin mit anderen Methoden aus der Welt schaffen. (tm)

Über Oliver Jensen

Gravatararbeitet als freiberuflicher Texter und Journalist und ist für Zeitschriften, Redaktionen und verschiedene Firmen tätig. Bevor er diesen Werdegang einschlug, konzentrierte er sich auf die dramaturgischen Aufgaben, wobei er ein Theaterstück und Drehbücher für Kurzfilme und Showreels schrieb. Website. Weitere Beiträge für Dr. Web: 130

Verwandte Artikel

Bookmarken! Diese Icons verlinken auf Bookmark Dienste bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • MisterWong
  • del.icio.us
  • TwitThis
  • Hype
  • StumbleUpon
  • Facebook
  • Google Bookmarks
  • Linkarena
abstimmenabstimmenabstimmenabstimmenabstimmen (No Ratings Yet)

28 Kommentare zu “SEO: Der neue Canonical-Tag - ein Werkzeug gegen doppelten Content”

  1. 1
    9.07.2009 20:52

    In der Praxis muss sich noch zeigen wie das angewendet wird. Vor allem bei Seiten die Inhalte syndizieren.

    Auch die URL kann sich durchaus öfters ändern, sei es durch eine manuelle Korrektur oder ein anderes CMS.

    Mal schauen wie es sich entwickelt...

    Antwort

  2. 2
    Helen
    9.07.2009 21:12

    Moment mal! Soll auf jeder Einzelseite nur den Grundpfad der ganzen Seite angeben oder oder den Pfad zur einzelseite: ? Gemäß Google das letztere.

    Im Head gibt es doch ohnehin schon mehrere absolute Links wie etwa der zum Shotcut Icon. Wenn man hier konsequent ist, kann Google eindeutig erkennen, ob man mit oder ohne "www." geführt werden will. Letztlich könnte Google ja auf auf den Moment zurückgreifen, wo man seine Seite zur Indexierung angemeldet hat.

    Darüber hinaus kann die Unklarheit ja nur bei Seiten ohne xml-Sitemap gelten. Darin sieht ein Eintrag ja so aus:

    http://www.domain.de/index.htm
    0.5
    2009-06-12
    weekly

    Mit so einer Sitemap wird man einheitlich angegeben.

    Antwort

  3. 3
    Helen
    9.07.2009 21:13

    Sorry, detailliertere Kommentare mit Codebeispielen sind leider nicht möglich.

    Antwort

  4. 4
    9.07.2009 21:24

    Hallo,

    es gibt kein Canonical-Tag, weil canonical der Wert des rel-Attributs ist und rel ist wiederum das Attribut des link-Tags.

    Google selbst spricht von link-Tag in Verbindung mit canonical:

    http://googlewebmastercentral.

    Now, you can simply add this <link> tag to specify your preferred version:

    <link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />

    Antwort

  5. 5
    9.07.2009 23:05

    Bitte sprecht mir nach: "Es gibt weder einen ALT-Tag, noch einen Canonical-Tag!" Canonical ist ein Attributwert!!! Profis sollten diese Unterscheidung genauso selbstverständlich beherrschen, wie den zwischen Element und Tag!!!

    Antwort

  6. 6
    Helen
    9.07.2009 23:39

    Jens, vor der Präpositionalphrase mit "wie" sollte kein Komma stehen. Profis sollten den Unterschied zwischen Vergleichssätzen und Präpositionalphrasen genauso selbstverständlich beherrschen.

    Antwort

  7. 7
    Jupp
    10.07.2009 07:54

    @Helen :-))

    Antwort

  8. 8
    10.07.2009 08:25

    @Jens: 1. hat jeder verstanden, wie dieses "Tag" angewendet wird, 2. kommt Klugscheißerei nirgendwo gut an

    Schönen Tag noch

    Antwort

  9. 9
    10.07.2009 09:25

    Ist schon herrlich wie hier mit anonymen Kommentaren auf Kritik eingegangen wird ... gell "Hellen" und "Jupp"? ;-) würde mich nicht wundern, wenn "Hellen" und "Jupp" zufälligerweise die gleiche IP haben. Arm ist so etwas.

    @domingos,

    Kritik als Klugscheißerei zu bezeichnen kommt noch weniger gut an. Zu deinem ersten Punkt: nein, es hat nicht jeder Verstanden, speziell die Anfänger nicht, die "laufen" auch weiterhin rum und erzählen dann in den diversen Foren nicht nur etwas von alt-Tags sondern auch von canonical-Tags.

    Ein SEO würde es auch anmerken, wenn man mal einfach offpage- und onpage-Optimierung durcheinander wirft. Dich als Texter würde es auch stören, wenn man ein Ausrufezeichen als Komma betitelt und kein vernünftiger Mensch würde dann deine Kritik als Klugscheißerei bezeichnen.

    Antwort

  10. 10
    10.07.2009 09:51

    abseits der grammatikalischen Fragen, hätte ich noch eine: Was macht man aus Inhalten, die auf tags-, category- und archiv-Seiten stehen, also wenn die einzelnen per permalink zu erreichenden Inhalte auf einer Seite zusammengefasst sind. Sind das nicht auch doppelte Inhalte?

    Antwort

  11. 11
    10.07.2009 10:04

    perun und jens haben recht, trotzdem ist in der praxis häufig von "tag" die rede oder die nähe zu selbigem groß. das lässt sich bei google gleich zehntausendemal finden auf der suche nach "canonical tag".

    auch experten wie http://www.seomoz.org/blog/can rücken tag und canonical zusammen. da ist es nicht verwunderlich wenn oliver jensen das auch tut und hier gleich gar keinen unterschied mehr sieht.

    er sollte sich präzise ausdrücken, ja, ich kann aber verstehen wie es zustande kommt.

    das/den "alt-tag" kriegt ihr auch nicht mehr aus der welt. dazu ist es zu oft falsch gemacht worden.

    Antwort

  12. 12
    10.07.2009 10:29

    @Sven: Die häufige Fehlnutzung von Begriffen ist noch lange keine Begründung für eine Profi, den falschen Begriff zu nutzen. Er könnte im Gegenteil auf die korrekte Nutzung hinweise und nicht einfach resignieren. Letzteres war teil der Rechtschreibreform, die häufig gemachte Fehler in Schulaufsätzen im Nachhinein legitimiert hat.

    Es mag ja Korinthenkackerei für die meisten sein, ich finde aber, daß man auf Seiten, die sich stark an Anfänger richten, auf korrekte Termini achten sollte. Es ist eigentlich kein Zusatzaufwand. Und der Anfänger bekomtm gleich den korrekten Sprachschatz.

    Und wenn "SEO-Experten" den Unterschied zwischen Element, Tag, Attribut und Wert kennen, dann sind sie leider sehr seltsame Experten und keine Entschuldigung.

    Ich gebe auch bei Kunden nie auf, den ALT-Tag zu korrigieren. Und ich lasse auch nicht den Eindruck stehen, eine Textversion oder ein Schriftenskalierer mache eine Seite barrierefrei. Das gehört in die gleiche Kategorie.

    Antwort

  13. 13
    10.07.2009 11:17

    Lernt einfach draus und macht nen erklärenden Artikel dazu. Was ist ein Tag? Was ist ein Element? Was ist eine Eigenschaft? Was ein Attribut? Gibts schon 1000 Mal im Netz doch Content ist King. Warum auf so einer Seite nicht nochmal erklären? Dann verstehts vlt. der Letzte.

    Ich gebe zu, auch ab und zu den falschen Begriff auf der Zunge zu haben. Doch Entschuldigung suche ich eigentlich keine dafür. Dadurch dass sich was Falsches einbürgert, wird es noch nicht richtiger.

    Nur mal so zum Nachdenken.

    Gruß
    HW

    Antwort

  14. 14
    10.07.2009 12:17

    Btw. ich hätte auch fast in meinem Artikel "nofollow" - Tag geschrieben :)

    Antwort

  15. 15
    10.07.2009 13:05

    Das schöne an diesem Attribut finde ich, dass viele darüber berichtet haben, jedoch alle Portale/Seiten und Co das Ding nicht einsetzen.

    Antwort

  16. 16
    10.07.2009 15:15

    Ich schreibe für einen Auftraggeber gerade Kurz-Texte für internationale Sehenswürdigkeiten - die natürlich je eine eigene Website sein sollen. Weiß jemand, wie viele Zeichen (oder Wörter) das Mindestmaß sind, damit Google den Content überhaupt als eigenständige Seite akzeptiert? L.G. Eva Ihnenfeldt

    Antwort

  17. 17
    Andi
    13.07.2009 22:09

    Sorry, aber könnte es trotzdem noch mal jemand so erklären, daß es für einen Nicht-Profi auch verständlich ist?

    Das Ding muß auf jeder Unterseite stehen, nicht nur auf der Startseite richtig?

    Warum werden hier keine relativen Pfade genommen, wie sonst immer empfohlen wird?

    Gebe ich den Namen der Webseite an, oder die jeweilige Unterseite der Webseite?

    Falls zweiteres der Fall sein sollte, also mit Unterseite,dann wird das für Typo3-Seiten ganz schön schwierig zum Einbauen...!?!

    Vielen Dank an euch!

    Antwort

  18. 18
    21.07.2009 14:33

    Nun wurde ich doch eines besseren belehrt. Bisher dachte ich das der Canonical-Tag auch extern funktioniert. Na ok, da stellt sich schon einem die Frage wie Google & Co da herausfinden sollen welche Seite die echte ist wenn der Content Dieb gleich den Tag mit klaut. In meinem Blog nutze ich das Plugin All in One SEO Pack und da ist der Tag schon enthalten. Ob es nun wirklich jedem etwas bringt wird die Zukunft zeigen. Probleme mit internen doppelten content hatte ich noch nie oder nicht das ich wüßte.

    Antwort

  19. 19
    Gabber
    24.08.2009 15:19

    Alte links per 302 auf die neuen umleiten und gut ist es.
    Welche links die eigene Seite / das eigene System produziert sollte man halt schon wissen im normal Fall?

    So what? Ist nicht wirklich nen Problem :-)

    Antwort

  20. 20
    Trigor
    14.10.2009 15:29

    Sicherlich ist dieses Canonical-Attribut nur für bestimmte Websites interessant. Duplicate Content entsteht häufig in Shops, wo Produkte unter verschiedenen Kategorien zu finden sind.

    Mit Hilfe des Attributs kann man den Suchmaschinen mitteilen, welche der inhaltlich gleichen Seiten die Hauptseite sein soll.

    Wichtig dabei ist, dass dies (bisher) nur innerhalb einer Domain funktioniert, wobei auch Subdomains berücksichtigt werden.

    Gerüchten zufolge soll aber Google angeblich gegen Ende des Jahres auch die domainübergreifende Zuweisung akzeptieren...

    Warten wir ab, welche Probleme das noch aufwirft.

    Antwort

  21. 21
    5.01.2010 15:38

    Vielen Dank!
    Bisher bei meinen SEO-Prüfungen spuckte das Programm immer aus, dass ich doppelten Content hätte. Dank dieses Beitrages habe ich es nicht mehr!

    Antwort

  22. 22
    9.02.2010 19:49

    Ein Lob an Mudder, das fällt mir auch immer wieder auf?! Sollte man nun canonical nutzen, oder nicht? Solange alles über htaccess gesteuert wird, ist es ja auch eigentlich egal, oder wertet Google dennoch aus?

    Antwort

  23. 23
    MDatze
    1.03.2010 10:52

    Gibt es jetzt schon Erfahrungswerte, wie diese neue "Funktion" von Google akzeptiert und beachtet wird. Ich möchte gern meine Seiten auf eine neue interne URL-Struktur umstellen, aber habe bereits einmal sehr schlechte Erfahrung mit simpler Weiterleitung gemacht...

    Antwort

  24. 24
    18.05.2010 02:51

    Nun, aber wenn auch die duplizierte Seite das canonical-"Tag" nutzt? Was dann? Das kann man ja selbst dem dümmsten klau-bot beibringen. Was wird dann als original gesehen wenn der Spammer der Seite X kopiert, entsprechend auch mehr backlinks (durch Spam) generiert?

    Antwort

Trackbacks

  1. Für die Blogger unter uns - das Canonical-Tag... | granad sein Block!
  2. Double-Content mit Canonical-Attribut verhindern | kulturbanause blog
  3. Links der Woche #5 : Webdesign - SEO - Webprogrammierung
  4. Duplicate Content effektiv vermeiden - SEO.at

Meine Meinung

Bitte beachten Sie: Werbung und Spam sind unerwünscht und können eine Rechnung zur Folge haben. Woher kommen die Bilder neben den Kommentaren?