Logo
Startseite | PLUS Start | Shop | Mediadaten | Kontakt | Impressum | 4,549 Artikel Merker

YaCy: Verteiltes Suchen


Anzeige

von Rene Schmidt

YaCy ist eine P2P-Suchmaschine. Ziel ist eine freie und umfassende Suchmaschine, auch wenn das bisher erst in Ansätzen klappt. Warum das nicht illegal ist und weshalb trotz weniger Suchtreffer viele Nutzer die Software verwenden sollten.

P2P ... wer denkt da nicht zuerst an illegale' Tauschbörsen? In der Tat wird der Begriff nahezu ausschließlich für das unerlaubte Tauschen von urheberrechtlich geschützten Inhalten verwendet. Das allerdings zu Unrecht, denn Peer-2-Peer im IT-Zusammenhang beschreibt lediglich die Organisationsstruktur eines Netzwerks - mehr nicht.

YaCy Logo

Das P2P-Prinzip wird oft eingesetzt, wenn nach dem Client-Server-Prinzip arbeitende Systeme an Leistungsgrenzen stoßen oder deren Betrieb teuer ist. Gute Suchmaschinen sind extrem teuer im Betrieb. Speicherplatz, Rechen- und Leitungskapazität gehen ins Geld. Zudem hat sich mit Google ein Unternehmen etabliert, dass die Web-Suche fast monopolisiert hat - ähnlich wie Microsoft bei Betriebssystemen.

Die hohen Kosten und die Gefahr, dass ein Unternehmen kontrolliert, was im Netz gefunden wird oder was nicht, hat einige Software-Entwickler bewogen, alternative Suchmaschinenkonzepte zu entwickeln und umzusetzen.

YaCy
"Yet another Cyberspace" (kurz: YaCy) soll eine von wirtschaftspolitischen Interessen befreite Alternative zu etablierten Suchmaschinen-Anbietern werden. Durch das P2P-Prinzip werden die Kosten auf möglichst viele Schultern verteilt. Allerdings installiert sich niemand eine Suchmaschine und beginnt mit dem Absuchen des WWW, um "später einmal" eine Google-Alternative zu haben. Als "Lockmittel" haben die YaCy-Entwickler der Suchmaschine einen Proxy-Server spendiert, der besuchte Webseiten zwischenspeichen kann.

Das funktioniert so wie ein Browser-Cache, nur das auch andere Rechner im lokalen Netzwerk diesen Cache transparent mitbenutzen können. Das kann die Internet-Anbindung entlasten und Seitenaufrufe beschleunigen. Aus diesem Cache bedient sich auch YaCys Web-Crawler, der die Seiten indiziert und gegebenenfalls noch einige tiefere Ebenen der Websites in diesen Vorgang einbezieht. Die Indizes tauscht die Suchmaschine dann mit anderen aktiven YaCy-Instanzen im Internet aus.

Im "Junior-Modus" liefert die Suchmaschine keine überzeugenden Ergebnisse. Die Suchmaschine kann meist direkt nach der Installation aufgrund einer strengen Firewall oder aufgrund von Routing-Problemen keine Indizes mit anderen YaCy-Peers austauschen und wird daher unter Umständen als unterprivilegiert eingestuft.

Um in den "Senior-Modus" zu gelangen, muss der eigene YaCy-Peer über den TCP-Port 8080 vom Internet aus erreichbar sein. Die Suchergebnisse sind in diesem Betriebsmodus deutlich besser, aber immernoch Welten von der Qualität und Quantität entfernt, die Altavista, Google und Co. bieten. Das Projekt ist noch jung, noch nicht sehr verbreitet und hat noch Kinderkrankheiten. Zum Beispiel versteht die Suchmaschine keine deutschen Umlaute.

Installation
Wer sich davon nicht abschrecken lässt und mitwirken will, das Ziel einer freien und umfassenden Suchmaschine zu erreichen wird von den YaCy-Machern aufgefordert, das Programm zu installieren. Die Suchergebnisse werden besser, je mehr YaCy-Peers am Projekt teilnehmen.

obenswert: Die Software läuft auf allen Plattformen, auf denen Java2 läuft und steht unter der GPL. Die Software muss praktisch nicht installiert werden - herunterladen, entpacken, starten. Das gilt für sowohl für MacOS X als auch für Windows und Linux.

Bei Webbrowsern, die den Proxy-Cache nutzen sollen, muss als Proxy die IP-Adresse des YaCy-Peers eingestellt werden. Nachdem YaCy gestartet wurde, ist das in Deutsch und Englisch verfügbare Admin-Interface über http://localhost:8080/ zu erreichen. Als erstes sollten die frischgebackenen YaCy-Administratoren die Weboberfläche unter "Settings" ein Passwort einstellen, damit Unbefugte keine Änderungen an den Einstellungen vornehmen können. Das Suchformular ist unter http://localhost:8080/index.html verfügbar.

Sicherheit
Wenn sozusagen der eigene Browser-Cache auf Wanderschaft geht, stellt sich automatisch die Frage nach dem Datenschutz. Die deutsche YaCy-FAQ beruhigt: "Alle Seiten, die beim Laden GET- oder POST-Parameter verwenden, sowie die Seiten die Cookies oder Passwortschutz verwenden, werden vom Indizieren ausgenommen". Im Zweifel können die Java-Sourcen inspiziert werden. Ein YaCy-Peer im Senior-Modus muss "von außen" erreichbar sein. In der Standardeinstellung gilt das aber nur für den Austausch von Index-Daten. Fremde Nutzer können den eigenen YaCy-Peer also nicht dazu nutzen, anonym im Internet zu surfen. (tm)

Links:

Erstveröffentlichung 02.09.2005

Über René Schmidt

GravatarRene Schmidt hat als Frontend-Entwickler bei Pixelpark Solutions und als Projektmanager bei Tiscali und Nikotel gearbeitet. Er arbeitet seit 2001 als Freiberufler und bietet Dienstleistungen rund ums Web an: Produktion von dynamischen Websites in PHP, Javascript/YUI, XHTML/CSS; Linux-Systemadministration für Webserver. In seiner Freizeit schreibt er Fachartikel zu diesen Themen oder übersetzt sie vom Englischen ins Deutsche. Referenzen gibt es in seinem Blog. Website. Weitere Beiträge für Dr. Web: 89

Verwandte Artikel

Bookmarken! Diese Icons verlinken auf Bookmark Dienste bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • MisterWong
  • del.icio.us
  • TwitThis
  • Hype
  • StumbleUpon
  • Facebook
  • Wikio DE
  • YahooMyWeb

Meine Meinung

Bitte beachten Sie: Werbung und Spam sind unerwünscht und können eine Rechnung zur Folge haben. Woher kommen die Bilder neben den Kommentaren?