SEO: Der neue Canonical-Tag – ein Werkzeug gegen doppelten Content

Doppelter Content ist gefürchtet. Mit dem „Canonical Tag“ soll alles besser werden. Es lässt sich fortan bestimmen, welche URL bei den Suchmaschinen gelistet werden soll. Das sollte helfen, so manche Ängste zu zerstreuen.

Die Verhaltensweise des Suchmaschinenbetreibers Google ist schon ein wenig verwunderlich. Erst kürzlich wurde gemeldet, doppelter Content auf der gleichen Webseite würde nicht zu einer Abstrafung führen. Nun hat Google gemeinsam mit Microsoft und Yahoo einen neuen Meta-Tag ins Leben gerufen, mit dem sich die Konsequenzen aus internem doppelten Content verhindern lassen. Googles Aussage, dass interner doppelter Content kein Problem sei, entsprach wohl doch nicht ganz der Wahrheit.

Bevor wir nun aber auf den neuen Tag eingehen, stellt sich die Frage, wie doppelter Content überhaupt entsteht. Es geschieht nicht nur durch Textklau oder Autoblogs (wobei es sich quasi um einen automatisierten Textklau handelt), sondern auch unbeabsichtigt. Hier nun die häufigsten Ursachen für internen doppelten Content:

  • Eine Domain ist sowohl mit als auch ohne “www” aufrufbar.
  • Es besteht eine Doppelung bei der Internationalisierung (zum Beispiel einmal nur “.de” und einmal “.de.de”)
  • Die Seite ist unter zwei verschiedenen URLs aufrufbar (zum Beispiel einmal mit der Endung “.de” und einmal mit der Endung “.html”)
  • Die Tracking Parameter verursachen zwei verschiedene URLs (zum Beispiel einmal mit der normalen Endung “.de” und einmal mit der Endung “.de/source=11“)

Sollte eines dieser Beispiele zutreffen, hat man wegen des identischen Seiteninhalts doppelten Content und man wird unter Umständen mit den Folgen leben müssen. Dabei ist man ein wenig den Launen der Suchmaschinen ausgeliefert. Denn Google könnte durchaus erkennen, dass es sich um internen doppelten Content handelt. In diesem Fall würden die beiden URLs als identische Seiten behandelt werden. Gerade bei einer URL mit “www” und einer URL ohne “www” geschieht dies recht häufig. Doch es kann auch anders laufen und Google behandelt die beiden URLs wie jeden anderen Fall von doppelten Content.

Das würde heißen, dass nach der Identifizierung die beiden URLs zusammengefasst werden. Während eine URL dann zum Stellvertreter ernannt und bei den Suchmaschinen weiterhin gelistet wird, verschwindet die andere URL ins Nirwana und bleibt von den Suchmaschinen unberücksichtigt. Welche der beiden URLs dabei zum Stellvertreter gewählt wird, entscheidet die Suchmaschine für gewöhnlich anhand der internen und externen Verlinkungen. Der Seitenbetreiber kann also keinen direkten Einfluss darauf nehmen.

Genau dies ändert sich nun durch den Canonical Tag. Dank dieses HTML-Attributs darf der Seitenbetreiber selber entscheiden, welche URL der Stellvertreter ist. Diese URL wird dann bei den Suchmaschinen gelistet und ihr wird auch die Gewichtung beider Seiten zugesprochen, die aus den Verlinkungen resultiert. Die Anwendung dieses Tags gestaltet sich denkbar einfach. Im Head-Bereich der auserwählten Seite ist lediglich folgendes einzugeben.

<link rel=”canonical” href=”http://www.richtigeURL.de/”>

Als Vorsichtsmaßnahme könnte man dieses Werkzeug auf allen Seiten einsetzen, um im Falle doppelten Contents keine Konsequenzen fürchten zu müssen.

Kein Nutzen bei externem doppelten Content

Die unerlaubte Verwendung fremder Inhalte ist eines der größten Ärgernisse in der Welt des WWWs und dennoch kommt es regelmäßig vor. Sollte ein Fremder die eigenen Texte unerlaubt verwenden, so ist dies nicht nur moralisch verwerflich. Auch wirtschaftliche Konsequenzen können die Folge sein. Schließlich ist es nicht auszuschließen, dass die Seite des Diebes letztendlich bei Google gelistet wird und die eigene Seite nicht. Leider stellt der Canonical Tag in solchen Fällen keine Hilfe dar, denn er hat lediglich bei internem doppelten Content einen Nutzen. Wird man zum Opfer vom Textklau, muss man das Problem also weiterhin mit anderen Methoden aus der Welt schaffen. ™

arbeitet als freiberuflicher Texter und Journalist und ist für Zeitschriften, Redaktionen und verschiedene Firmen tätig. Bevor er diesen Werdegang einschlug, konzentrierte er sich auf die dramaturgischen Aufgaben, wobei er ein Theaterstück und Drehbücher für Kurzfilme und Showreels schrieb.

Sortiert nach:   neueste | älteste | beste Bewertung
Reduxo
Gast

In der Praxis muss sich noch zeigen wie das angewendet wird. Vor allem bei Seiten die Inhalte syndizieren.

Auch die URL kann sich durchaus öfters ändern, sei es durch eine manuelle Korrektur oder ein anderes CMS.

Mal schauen wie es sich entwickelt…

Helen
Gast
Moment mal! Soll auf jeder Einzelseite nur den Grundpfad der ganzen Seite angeben oder oder den Pfad zur einzelseite: ? Gemäß Google das letztere. Im Head gibt es doch ohnehin schon mehrere absolute Links wie etwa der zum Shotcut Icon. Wenn man hier konsequent ist, kann Google eindeutig erkennen, ob man mit oder ohne „www.“ geführt werden will. Letztlich könnte Google ja auf auf den Moment zurückgreifen, wo man seine Seite zur Indexierung angemeldet hat. Darüber hinaus kann die Unklarheit ja nur bei Seiten ohne xml-Sitemap gelten. Darin sieht ein Eintrag ja so aus: http://www.domain.de/index.html 0.5 2009-06-12 weekly Mit so… Read more »
Helen
Gast

Sorry, detailliertere Kommentare mit Codebeispielen sind leider nicht möglich.

Perun
Gast

Hallo,

es gibt kein Canonical-Tag, weil canonical der Wert des rel-Attributs ist und rel ist wiederum das Attribut des link-Tags.

Google selbst spricht von link-Tag in Verbindung mit canonical:

http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

Now, you can simply add this <link> tag to specify your preferred version:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish&quot; />

Jens Grochtdreis
Gast

Bitte sprecht mir nach: „Es gibt weder einen ALT-Tag, noch einen Canonical-Tag!“ Canonical ist ein Attributwert!!! Profis sollten diese Unterscheidung genauso selbstverständlich beherrschen, wie den zwischen Element und Tag!!!

Helen
Gast

Jens, vor der Präpositionalphrase mit „wie“ sollte kein Komma stehen. Profis sollten den Unterschied zwischen Vergleichssätzen und Präpositionalphrasen genauso selbstverständlich beherrschen.

Jupp
Gast

@Helen :-))

domingos
Gast

@Jens: 1. hat jeder verstanden, wie dieses „Tag“ angewendet wird, 2. kommt Klugscheißerei nirgendwo gut an

Schönen Tag noch

Perun
Gast
Ist schon herrlich wie hier mit anonymen Kommentaren auf Kritik eingegangen wird … gell „Hellen“ und „Jupp“? ;-) würde mich nicht wundern, wenn „Hellen“ und „Jupp“ zufälligerweise die gleiche IP haben. Arm ist so etwas. @domingos, Kritik als Klugscheißerei zu bezeichnen kommt noch weniger gut an. Zu deinem ersten Punkt: nein, es hat nicht jeder Verstanden, speziell die Anfänger nicht, die „laufen“ auch weiterhin rum und erzählen dann in den diversen Foren nicht nur etwas von alt-Tags sondern auch von canonical-Tags. Ein SEO würde es auch anmerken, wenn man mal einfach offpage- und onpage-Optimierung durcheinander wirft. Dich als Texter würde… Read more »
Omar
Gast

abseits der grammatikalischen Fragen, hätte ich noch eine: Was macht man aus Inhalten, die auf tags-, category- und archiv-Seiten stehen, also wenn die einzelnen per permalink zu erreichenden Inhalte auf einer Seite zusammengefasst sind. Sind das nicht auch doppelte Inhalte?

Sven Lennartz
Gast

perun und jens haben recht, trotzdem ist in der praxis häufig von „tag“ die rede oder die nähe zu selbigem groß. das lässt sich bei google gleich zehntausendemal finden auf der suche nach „canonical tag“.

auch experten wie http://www.seomoz.org/blog/canonical-url-tag-the-most-important-advancement-in-seo-practices-since-sitemaps rücken tag und canonical zusammen. da ist es nicht verwunderlich wenn oliver jensen das auch tut und hier gleich gar keinen unterschied mehr sieht.

er sollte sich präzise ausdrücken, ja, ich kann aber verstehen wie es zustande kommt.

das/den „alt-tag“ kriegt ihr auch nicht mehr aus der welt. dazu ist es zu oft falsch gemacht worden.

Jens Grochtdreis
Gast
@Sven: Die häufige Fehlnutzung von Begriffen ist noch lange keine Begründung für eine Profi, den falschen Begriff zu nutzen. Er könnte im Gegenteil auf die korrekte Nutzung hinweise und nicht einfach resignieren. Letzteres war teil der Rechtschreibreform, die häufig gemachte Fehler in Schulaufsätzen im Nachhinein legitimiert hat. Es mag ja Korinthenkackerei für die meisten sein, ich finde aber, daß man auf Seiten, die sich stark an Anfänger richten, auf korrekte Termini achten sollte. Es ist eigentlich kein Zusatzaufwand. Und der Anfänger bekomtm gleich den korrekten Sprachschatz. Und wenn „SEO-Experten“ den Unterschied zwischen Element, Tag, Attribut und Wert kennen, dann sind… Read more »
Heike Werneburg
Gast

Lernt einfach draus und macht nen erklärenden Artikel dazu. Was ist ein Tag? Was ist ein Element? Was ist eine Eigenschaft? Was ein Attribut? Gibts schon 1000 Mal im Netz doch Content ist King. Warum auf so einer Seite nicht nochmal erklären? Dann verstehts vlt. der Letzte.

Ich gebe zu, auch ab und zu den falschen Begriff auf der Zunge zu haben. Doch Entschuldigung suche ich eigentlich keine dafür. Dadurch dass sich was Falsches einbürgert, wird es noch nicht richtiger.

Nur mal so zum Nachdenken.

Gruß
HW

Frank Mey
Gast

Btw. ich hätte auch fast in meinem Artikel „nofollow“ – Tag geschrieben :)

Mudder
Gast

Das schöne an diesem Attribut finde ich, dass viele darüber berichtet haben, jedoch alle Portale/Seiten und Co das Ding nicht einsetzen.

Eva Ihnenfeldt
Gast

Ich schreibe für einen Auftraggeber gerade Kurz-Texte für internationale Sehenswürdigkeiten – die natürlich je eine eigene Website sein sollen. Weiß jemand, wie viele Zeichen (oder Wörter) das Mindestmaß sind, damit Google den Content überhaupt als eigenständige Seite akzeptiert? L.G. Eva Ihnenfeldt

trackback

[…] By granad – Posted on 10 July 2009 Da wurde ich gerade aufgrund eines Artikel bei Dr. Weblog auf ein Problem aufmerksam, dass auch ich mit meiner URL […]

trackback

[…] Link: Dr. Web – SEO: Das neue Canonical-Attribut […]

Andi
Gast

Sorry, aber könnte es trotzdem noch mal jemand so erklären, daß es für einen Nicht-Profi auch verständlich ist?

Das Ding muß auf jeder Unterseite stehen, nicht nur auf der Startseite richtig?

Warum werden hier keine relativen Pfade genommen, wie sonst immer empfohlen wird?

Gebe ich den Namen der Webseite an, oder die jeweilige Unterseite der Webseite?

Falls zweiteres der Fall sein sollte, also mit Unterseite,dann wird das für Typo3-Seiten ganz schön schwierig zum Einbauen…!?!

Vielen Dank an euch!

Micha
Gast

so schwer auch wieder nicht:-)

# In die Constants:

canonicalbase = http://consultingdienste.de
[treeLevel = 0]
canonicalbase = http://consultingdienste.de
[global]

# In’s Setup:
###############################
#
# Kanonische URL
#
###############################

temp.canonical = COA
temp.canonical.wrap =
temp.canonical.1 = TEXT
temp.canonical.1 {
value = http://consultingdienste.de/
wrap=|
}
temp.canonical.2 = TEXT
temp.canonical.2 {
typolink {
parameter.data=TSFE:id
returnLast=url
addQueryString = 0
addQueryString.method = GET
}
}

#### UND DANN

page.headerData.15 < temp.canonical

müsste laufen …

LG

Micha

trackback

[…] nicht mehr. Trotzdem wissen viele gar nicht welchen Sinn es macht und wo man es am Besten einsetzt. DrWeb und […]

Andreas
Gast

Nun wurde ich doch eines besseren belehrt. Bisher dachte ich das der Canonical-Tag auch extern funktioniert. Na ok, da stellt sich schon einem die Frage wie Google & Co da herausfinden sollen welche Seite die echte ist wenn der Content Dieb gleich den Tag mit klaut. In meinem Blog nutze ich das Plugin All in One SEO Pack und da ist der Tag schon enthalten. Ob es nun wirklich jedem etwas bringt wird die Zukunft zeigen. Probleme mit internen doppelten content hatte ich noch nie oder nicht das ich wüßte.

Gabber
Gast

Alte links per 302 auf die neuen umleiten und gut ist es.
Welche links die eigene Seite / das eigene System produziert sollte man halt schon wissen im normal Fall?

So what? Ist nicht wirklich nen Problem :-)

Trigor
Gast

Sicherlich ist dieses Canonical-Attribut nur für bestimmte Websites interessant. Duplicate Content entsteht häufig in Shops, wo Produkte unter verschiedenen Kategorien zu finden sind.

Mit Hilfe des Attributs kann man den Suchmaschinen mitteilen, welche der inhaltlich gleichen Seiten die Hauptseite sein soll.

Wichtig dabei ist, dass dies (bisher) nur innerhalb einer Domain funktioniert, wobei auch Subdomains berücksichtigt werden.

Gerüchten zufolge soll aber Google angeblich gegen Ende des Jahres auch die domainübergreifende Zuweisung akzeptieren…

Warten wir ab, welche Probleme das noch aufwirft.

trackback

[…] vor der Indexierung durch Suchmaschinen zu schützen. Besonderes Augenmerk wird im Artikel auf Canonical Tags […]

Jens P.
Gast

Vielen Dank!
Bisher bei meinen SEO-Prüfungen spuckte das Programm immer aus, dass ich doppelten Content hätte. Dank dieses Beitrages habe ich es nicht mehr!

Kim
Gast

Ein Lob an Mudder, das fällt mir auch immer wieder auf?! Sollte man nun canonical nutzen, oder nicht? Solange alles über htaccess gesteuert wird, ist es ja auch eigentlich egal, oder wertet Google dennoch aus?

MDatze
Gast

Gibt es jetzt schon Erfahrungswerte, wie diese neue „Funktion“ von Google akzeptiert und beachtet wird. Ich möchte gern meine Seiten auf eine neue interne URL-Struktur umstellen, aber habe bereits einmal sehr schlechte Erfahrung mit simpler Weiterleitung gemacht…

Florian
Gast

Nun, aber wenn auch die duplizierte Seite das canonical-„Tag“ nutzt? Was dann? Das kann man ja selbst dem dümmsten klau-bot beibringen. Was wird dann als original gesehen wenn der Spammer der Seite X kopiert, entsprechend auch mehr backlinks (durch Spam) generiert?

Rene
Gast

Ah…herrlich – schönen Dank für diesen ausführlichen Bericht, das erspart mir doch in Zukunft einiges an arbeit.

René
Gast

Hallo, muss ich das für jede Untersetie machen oder reicht es aus, die Hauptdomain anzugeben?

Stefan
Gast

Da kann man ja extrem viel falsch machen. Wenn man diesen Tag falsch einsetzt sind leider auch die richtigen seiten direkt verschwunden. Also vorsichtig damit umgehen.

trackback

[…] empfohlen (siehe hierzu: JTL-Shop3-Neuinstallation ? JTLWiki). Stimmt so nicht ganz. Dank des Canoncial Tag gibts das Problem mit DC ja nicht mehr. Allerdings ist es trotzdem sinnvoll die Website […]

Lüders
Gast

Vielen Dank für den Artikel zum Thema Duplicate Content im Rahmen der Suchmaschinenoptimierung.

Werde es mal auf einigen Seiten testen und sehen was passiert. Sollte dies tatsächlich den gewünschten Erfolg bringen, ist es wohl eine der einfachsten Möglichkeiten Duplicate Content in den Griff zu bekommen.

wpDiscuz

Mit der Nutzung unseres Angebots erklärst du dich damit einverstanden, dass wir Cookies verwenden. Weitere Informationen

Wir verwenden Cookies, um Inhalte und Anzeigen zu personalisieren, Funktionen für soziale Medien anzubieten und die Zugriffe auf unsere Website zu analysieren. Dadurch geben wir nicht personenbezogene Informationen zur Nutzung unserer Website an unsere Partner für soziale Medien, Werbung und Analysen weiter. Nähere Informationen findest du in unserer Datenschutzerklärung. Durch die Weiternutzung unserer Website (oder das ausdrückliche Klicken auf "Einverstanden") gehen wir davon aus, dass du mit der Verwendung von Cookies einverstanden bist.

Schließen