Robot-Fänger: Wann kommen die Bots von Google und Co.?

Werbung

von Berthold Krayer

Jeder will es wissen: Wann und wie oft indexieren die Robots von Google und Co. meine Seiten? Und auf welchen Seiten meines Projektes tummeln sie sich mit Vorliebe?

In den Logfiles immer wieder Ausschau zu halten, ist zeitaufwändig. Wer auf Software und lange Quellcodes verzichten will, dem sei folgender Codeschnipsel empfohlen.

Der Codeschnipsel ist in PHP geschrieben und kann mittels Include-Befehl schnell in die gewünschte(n) Seite(n) eingebaut werden.

 <?php include("robotfaenger.php"); ?>
    

Das Script erkennt die Spider von Google, MSN, Fireball, Alexa, Exalead und Fast. Es notiert Datum und Uhrzeit, die URL, den Host und die IP-Adresse des Bots.

      <?php 
    $trackurl = $_SERVER['PHP_SELF'] ; 
    $trackUserAgent =strtolower($_SERVER['HTTP_USER_AGENT']); 
    if (stristr($trackUserAgent ,"archiver")) {$trackrobot="Alexa";}
    
    if (stristr($trackUserAgent ,"exabot")) {$trackrobot="Exalead";}
    
    if (stristr($trackUserAgent ,"fast")) {$trackrobot="Fast";}
    
    if (stristr($trackUserAgent ,"firefly")) {$trackrobot="Fireball";}
    
    if (stristr($trackUserAgent ,"googlebot")) {$trackrobot="Google";}
    
    if (stristr($trackUserAgent ,"msnbot")) {$trackrobot="MSN";}
    
    $trackdate = date('Y-m-d'); 
    $tracktime = date('H:i:s'); 
    $trackhost = $_SERVER['HTTP_HOST']; 
    $trackaddr = $_SERVER['REMOTE_ADDR']; 
    $referer = $_SERVER['HTTP_REFERER']; 
    if ($trackrobot != "") { 
    // Suchmaschinen // 
    $eingeloggt = "
    trackrobot= $trackrobot
    trackurl= $trackurl 
    trackdate= $trackdate
    tracktime= $tracktime
    trackhost= $trackhost
    trackaddr= $trackaddr
    ";
    mail (webmaster@eineseite.de, "Der $trackrobot war da!", "$eingeloggt");
    } ?> 

Diese Daten können auf verschiedene Weise genutzt oder übermittelt werden. Möchte man eine Statistik errechnen, empfiehlt sich das Speichern in eine MySQL-Datenbank oder Textdatei. Im hier vorgestellten Fall wird eine Email gesendet. So ist man stets zeitnah informiert. Dies lohnt sich vor allem für kleine und besonders für neue Websites.

Weitere Beiträge:

Über Gastautor

DrWeb.de ist die "Grande Dame" des deutschen Bloggings und seit nunmehr 14 Jahren im Internet aktiv. Das beliebte Magazin richtet sich dabei an Webworker, Selbstständige, IT-Entscheider, Seitenbetreiber sowie Marketing-Verantwortliche und bietet einen Überblick im undurchdringlichen Dschungel zahlreicher "Geld verdienen im Internet" Konzepte. Werden Sie jetzt Gastautor und profitieren Sie von der großen Reichweite und den Markennamen DrWeb.de.

, ,

Noch keine Kommentare vorhanden!

Hinterlasse eine Antwort

Bitte bei weiteren Kommentaren per Email benarichtigen! Auch möglich: Abo ohne Kommentar.

Spam protection by WP Captcha-Free