Schlagwort-Archive: Suchmaschinen

Vom Suchen, Finden und Gefunden werden

Das Internet gibt es schon sehr viel länger als den durchschnittlichen Surfer. Als das sogenannte ARPAnet entstand, war von bunten Internetseiten noch lange nicht zu denken. Die Informationsmenge war überschaubar, der Nutzen hauptsächlig militärisch und wissenschaftlich.

Doch mit der Einführung von intuitiven Betriebsystemen und dem wachsenden Markt für Heim-PCs wurde auch das Internet in der Mitte der 1990er Jahre für die Öffentlichkeit interessant. Die ersten Internetadressen wurden in die Werbung eingeschmuggelt ("Mehr Informationen auf sat1.de ") und so langsam fragte auch ich mich, was dieses "Internet" macht. AOLs Lockangebote hielten her (60 Stunden im Monat gratis*) und mit Mails, Instand Messenging und dem weltweiten Web wurden meine Interessen geweckt.

Etwa zu jener Zeit, genau am 7. September 1998, machte sich in den USA ein Startup-Unternehmen auf die Beine, das komplette Internet auf seine Unmengen an zusammengebundenen Standard-PCs zu laden, die so einen riesigen Cluster bilden, um auf Anfrage die Suchergebnisse auszugeben.
Die zwei Gründer dieses Unternehmens hatten einen bis dahin einzigartigen Algorithmus gefunden, der es ermöglichte, die Seiten auf Grund der Verlinkungen und Querverlinkungen zu bewerten und somit eine hohe Trefferrate der Ergebnisse zu ermöglichen. Andere Suchmaschinen waren zu der Zeit nicht in der Lage dazu. Die Rede ist von Google .

Da die Flut an Informationen im Internet immer größer wird, muss man Google für sich nutzen lernen. Entweder man findet nicht das, was man sucht oder man wird als Webseitenbetreiber einfach nicht im Internet gefunden.

Google zum Suchen nutzen

Das Wichtigste ist, dass man sich vorher genau überlegt, wonach man eigentlich sucht und welche Informationen im selben Kontext stehen. Es gibt zu jedem Suchbegriff eine Ergebnismenge X. Diese umfasst nicht selten mehr als 10.000 Ergebnisse. Studien belegen, dass ein Google-Sucher meist nur die ersten 5 Seiten der Ergebnisse durchforstet. Jedoch kann schon auf Seite 6 das gewünschte Ergebnis kommen. Ich behaupte, dass fast jede sinnvoll gestellte Suchanfrage bereits das gewünschte Ergebnis auf Seite 1 bekommt.
Je nach Suchwunsch muss man den Suchbegriff ausdehnen oder eingrenzen.

Ergebnismenge vergrößern

Beispiel: Ich habe Schwierigkeiten mit Ubuntu und suche nach einem Befehl oder einer Datei zur Problemlösung
Eine ganz schlechte Suche wäre nun "Ubuntu Problem".
Daher: Wie lautet konkret das Problem? Der Archiv-Manager von Ubuntu, File-Roler, öffnet und entpackt keine RAR-Dateien, "Ubuntu File-Roler RAR" wäre eine gute Möglichkeit, doch kann man hierbei die Suche ausweiten, um den Erfolg auf gute Hilfstellungen zu erhöhen, in dem man davon ausgeht, dass nicht nur bei Ubuntu das Problem auftreten wird, sondern bei allen Linux-Distributionen, die File-Roler nutzen: "Linux File-Roler RAR" lieferte mir brauchbare Informationen, um das Problem zu lösen.

Zwar würde "Ubuntu File-Roler RAR" auf Grund des guten Portals ubuntuusers.de sicherlich auch helfen, aber das ist ein linuxspezifisches Problem. Wenn man sich vorstellt, man hat eine Distribution ohne solche Community-Portale, dann sieht man mit der reduzierten Suche, z.B. "Red Hat File-Roler RAR" schon alt aus, zumal Red Hat-Nutzer schon eher zur Profiliga gehören und solche Probleme lieber allein lösen, statt zu fragen.

Ergebnismenge verkleinern

Ein anderes Beispiel ist eine Software aus dem Unternehmensbereich, diese heißt Big Brother. Gibt man diesen Suchbegriff ein, so erscheint als erstes in Mengen die Fernsehsendung. Auf den ersten 2 Seiten findet man so gut wie nichts anderes. Danach würde mir noch "1984" einfallen, das den Begriff erst prägte. Danach irgendwann sollte man Ergebnisse der Software erwarten können. Selbst der Begriff "Big Brother Download" bringt nicht das gewünschte Ergebnis, da auch die Fernsehsender Downloads anbieten.
Daher die Frage: was macht die Software eigentlich? Geräte überwachen – in der Fachsprache "Monitoring". Somit lautet die erfolgbringende Anfrage "Big Brother Monitoring", da weder der Fernsehsender noch George Orwells "1984" mit Monitoring im Zusammenhang steht und ein K.O.-Kriterium darstellt.

Entspezifizieren

Häufig sucht man auf Grund einer Fehlermeldung nach einer Lösung. Das ist prinzipiell ein guter Ansatz. Wichtig ist dabei, dass die Fehlermeldung mit Anführungsstriche geklammert werden, damit Google nicht nach jedem Wort, sondern nach der gesamten Phrase sucht. Jedoch sollten Angaben, die nicht konstant zur Fehlermeldung gehören, rausgenommen werden, um die Reichweite zu erhöhen:

"Beim Aufruf der Datei explorer.exe trat folgender Fehler auf: Die Funktion callfind() in der Datei syscontrol.dll gab eine unbekannte Ausnahme zurück."
Etwas später tritt dieser Fehler auf:
"Beim Aufruf der Datei rundll.exe trat folgender Fehler auf: Die Funktion uniqueResult() in der Datei syscontrol.dll gab eine unbekannte Ausnahme zurück."

Sinnvoll wäre nun den Stamm der Fehlermeldung ermitteln, wenn man davon ausgeht, das andere bereits ähnliche Fehlermeldungen in irgendwelche Foren geschrieben haben, also: "Beim Aufruf der Datei x trat folgender Fehler auf: Die Funktion x in der Datei syscontrol.dll gab eine unbekannte Ausnahme zurück." So, das würde natürlich nicht klappen, da in der Phrase zwei Platzhalter enthalten sind. Daher wird das einfach gesplittet: "Beim Aufruf der Datei"  "trat folgender Fehler auf: Die Funktion" "in der Datei syscontrol.dll gab eine unbekannte Ausnahme zurück."

Somit hat man das Muster gebildet, die auf jede verwandte Fehlermeldung klappt – zusätzlich kann man die Funktionen mit angeben, jedoch wird sie kaum zwei Mal auf einer Internetseite erscheinen, daher bietet sich hier der ODER-Operator an: "Beim Aufruf der Datei"  "trat folgender Fehler auf: Die Funktion" "in der Datei syscontrol.dll gab eine unbekannte Ausnahme zurück." (callfind OR uniqueResult)

Durch Google gefunden werden

Betreibt man eine eigene Präsenz im Internet, sei es beruflich, gewerblich oder privat, so ist es nahezu das wichtigste, dass man durch die Suchmaschinen gefunden wird.
Da die Suchmaschinenriese Google nazu uneingeschränkter Marktführer ist, konzentriere ich mich nun erstmal darauf.

Es erstes ist es wichtig zu wissen und zu verstehen, wie Google seinen Index erstellt. Ausgehend von wenigen Seiten durchsucht Google den Inhalt und katalogisiert ihn. Stellt es dabei fest, dass auf der aktuellen Seite Links (egal ob interne oder externe) vorhanden sind, so werden diese URLs gespeichert und aufgerufen. Diese werden ebenfalls wieder durchsucht, katalogisiert und nach Links durchforstet.
Das ist also wie die Katalogisierung eines Baumes, ausgehend vom Stamm wandert die Suchmaschine bis zum kleinsten Blatt. Verzweigungen stellen dabei die Internetseiten dar.

Je mehr Seiten auf die Eigenen verweisen, desto besser

Die Philosophie von Google besagt, dass gute, informative und lesenswerte Internetseiten häufiger Links von anderen Seiten bekommen, denn Links setzt man in der Regel nur, wenn es sich auch lohnt. Daher ist die Anzahl der Querverweise auf eine Seite ein entscheidendes Qualitätsmerkmal für Google. Die Qualität lässt sich am PageRank (Der Erfinder des Algorithmusses und Google-Mitbegründer heißt übrigens Larry Page…) messen. Nach diesem PageRank entscheidet sich auch Google die Reihenfolge der Suchergebnisse.

Jedoch setzt sich der eigene PageRank auch danach zusammen, welchen PageRank die verweisenden Seiten haben. Zwei Links von heise.de und spiegel.de auf die eigene Seite bringen unter Umständen einen bedeutend höheren PageRank als 20 Links von kleinen Webseiten.

Verlinkt

Da die Google-Suchmachine sich über Links im Netz fortbewegt, bekommen Webseiten, die die Kette unterbrechen und eine Art "Sackgassensite" darstellen einen schlechteren PageRank. Allerdings führen Linkfluten und bloße Aufzählungen von Adressen ebenfalls zu einer Abstufung.

Suchmaschinen-Spam 

So wurden große Unternehmen aus dem Index genommen, weil sie an andere Firmen Links zu deren Seiten verkauften. Diese Links waren in der Fußzeile zu finden und für die meisten Besucher unsichtbar. Dieses Verhalten ist jedoch von der Google-Software aufgeflogen.

Ebenfalls von Google verachtet werden Doorwaypages. Diese Seiten beinhalten haufenweise Stichwörter zu bestimmten Themen auf gut situierten Seiten, leiten den Besucher nach dem Klick aber auf andere Seiten weiter. Diese Technik verstößt gegen die Richtlinien von Google.

Google Webmastertools

Wen es interessiert, was der Google-Bot alles erfasst hat, wenn er auf der Seite suchte, kann sich bei Google anmelden und dann Webmastertools auswählen. Um zu beweisen, dass man der Besitzer der URL ist, muss man entweder eine bestimmte Datei hochladen oder einen Meta-Eintrag auf der Startseite hinzufügen. Danach kann man auf Statistiken zugreifen, sich Fehler beim Crawlen anzeigen lassen, häufige Suchanfragen und externe Links auflisten lassen.

Regelwerk

Zusammfassend lässt sich also folgendes sagen:

  • Hochwertiger Inhalt ist unerlässlig, denn
    • große (hoher PageRank) Seiten verlinken nur so auf die Seite
    • hohe Anzahl an Verlinken lassen sich nur so verwirklichen
  • selbst auf andere Seiten verlinken
  • SEO/SEF bei Blogsoftware oder Content Management Systemen einschalten
  • Meta-Keywords einrichten
  • Google-Richtlinien beachten und sich nicht auf SPAM einlassen

Empfehlung:

Wer sich tiefergehend speziell mit Google beschäftigen möchte, dem sei wärmstens das Buch "Die Google-Story" von David A. Vise zu empfehlen.