Wie funktionieren Suchmaschinen?

Vermarktung  |  4 Min. Lesezeit

Veröffentlicht am 14. Oktober 2019

Suchmaschinen sind zu einem essentiellen Bestandteil der Nutzung des Internets geworden. Sie durchsuchen zwar nicht das komplette Internet, sondern nur das World Wide Web, aber greifen auf Milliarden von Webseiten zurück, die sich auf Millionen von Webservern befinden. Wie eine Suchmaschine funktioniert, weiß nur ein geringer Teil der Benutzer, auch wenn sie einfach zu bedienen sind und für die nötige Orientierung und Auffindbarkeit von Inhalten im Internet sorgen.

Sobald wir von einer Suchmaschine sprechen, denken die meisten Menschen an den Anbieter Google. Das liegt daran, dass Google einen Marktanteil von rund 93% hat. Neben Google gibt es aber noch weitere Suchmaschinenanbieter wie Bing und Yahoo.

Funktionsweise

Eine Suchmaschine lässt sich grob als ein Computerprogramm zusammenfassen, das im Internet auf Anfrage nach Antworten bzw. Lösungen sucht.
Durch Suchmaschinen können Nutzer gezielt das World Wide Web durchsuchen oder auch nur durchstöbern. Nach der Eingabe von Suchbegriffen (Keywords) als Befehl, beginnt die Suchmaschine das Internet nach den gefragten Begriffen zu durchsuchen. Nicht in die Suche involviert sind Dienste, wie zum Beispiel Datenübertragung (FTP), der E-Mail Verkehr und Chatforen.

Suchmaschinen sammeln und speichern ununterbrochen neue oder aktualisierte Dokumente sowie Informationen – die Arbeit einer Suchmaschine beginnt also bereits vor einer Suchanfrage.

Die wesentlichen Bestandteile und Aufgaben einer Suchmaschine sind:

  • Crawling
  • Indexing
  • Ranking (Ergebnisliste)

Die eigentliche Fähigkeit der Suchmaschine ist das Erkennen von relevanten Internetseiten für einen bestimmten Suchbegriff.

Ablauf und Funktion einer Web-Suchmaschine (Google)

Was ist Crawling?

Um einem Benutzer ein Suchergebnis liefern zu können, sind sogenannte „Crawler“ oder „Spider“ notwendig. Diese sind Internet- oder Suchroboter, die automatisiert und kontinuierlich Daten erfassen, die anschließend auf Servern gespeichert werden. Zur Erfassung einer Webseite muss diese allerdings öffentlich sein, wobei der Crawler auch manuel vom Website-Betreiber ausgeschlossen werden kann. Sollte der Crawler auf einer Seite unerwünscht sein, kann dieser mittels robots.txt ausgeschlossen werden.

Die Crawler gelangen von Seite zu Seite, indem sie über die Links bereits indexierter Seiten, auch bekannt als „Harvesting“, immer weiter springen und währenddessen Daten zurück zum Server senden. Hauptsächlich HTML-Seiten, aber auch PPT- oder PDF-Dateien und auch Bilder sowie Videos können von einem Crawler erfasst werden.
Ein Crawler besucht bereits vorhandene Websites in unterschiedlichen Abständen, um so mögliche Änderungen zu registrieren. Je nach Häufigkeit der Veränderungen erscheint dieser auch in kürzeren Abständen. Domains werden gründlicher erfasst, wenn sie eine hohe Popularität haben – zum Beispiel einen hoher PageRank.

Was ist Indexing?

Das Herzstück einer Suchmaschine ist der Index – eine Liste der angesammelten Daten durch den Crawler. In diesem Suchmaschinenindex werden alle indexierten Inhalte des World Wide Web kategorisiert und sortiert (indexiert). Der Index wird bei jedem Crawling aktualisiert.

Diese Informationen werden hier in komprimierter Form gespeichert und werden nach Relevanz strukturiert abgelegt. Dadurch lässt sich der Index schnell und effizient durchsuchen. Kommt es zu einer Suchanfrage greift der Dienst lediglich auf den Index zu, sucht die passenden Seiten und liefert die Ergebnisse an das Frontend bzw. an die SERPs (Search Engine Result Page), auch bekannt als Benutzeroberflächen der Suchmaschinen.

Google SERP

Search Engine Result Page (Google – Suchbegriff: „hotel buchen“)

Warum tauchen Seiten auf höheren Positionen auf als andere?

Suchmaschinen wollen, dass dem User zu seiner Suche das beste Ergebnis geliefert wird. Die Auswahl bei Tausenden von Websites wird erleichtert, indem sie durch eine automatische Bewertung des Index in eine Reihenfolge gebracht werden, dem Ranking oder auch PageRank (PR). Das Ranking hängt also von der Relevanz ab und wie hilfreich die Seiten für die Suchanfrage eingeschätzt werden.

Aspekte dieser Selektion sind unter anderem die Häufigkeit des Vorkommens von Suchbegriffen (URL, Titel, Beschreibung, Hauptüberschrift), die Anzahl der übereinstimmenden Wörter oder die Verlinkung von anderen Webseiten. Die verschiedenen Betreiber nutzen beim Suchprozess andere Mechanismen und Algorithmen, sodass die Suchmaschinen trotz der gleichen Informationen im Index, unterschiedliche Ergebnisse liefern.

Um eine größere Reichweite zu erreichen und mehr Kunden auf sich aufmerksam zu machen, versuchen Website-Betreiber ihre Platzierungen durch gezielte Suchmaschinenoptimierung (SEO – Search Engine Optimization) zu verbessern.

Weitere Arten von Suchmaschinen

Neben dem gängigsten Suchmaschinenanbieter Google gibt es noch viele weitere, welche sich auf ein bestimmtes Gebiet spezialisiert haben. Viele Dienste funktionieren nach dem gleichen Prinzip, um nach Informationen zu suchen – Crawling und Indexing. Jedoch haben diese Suchmaschinen unterschiedliche Bereiche, Produkte und Daten die sie im Ranking platzieren und dadurch andere Suchergebnisse anzeigen als ihre Wettbewerber.

Beispiele sind:

  • Amazon
  • Youtube
  • eBay
  • Alibaba
  • Quora

Diese Plattformen arbeiten alle als Suchmaschinen und jeder dieser Anbieter zählt Millionen von Nutzern.

Exemplarisch: Wie funktioniert Amazon?

Amazon ist einer der weltweit führenden Produktsuchmaschinen. Hier werden über hundert Millionen Produkte angeboten und die interne Suchmaschine hat nur ein Ziel – Nutzern die richtigen beziehungsweise passenden Produkte zu liefern. Amazon beachtet in seinem Ranking die Frage: Welche Produkte kauft der Suchende am ehesten. Deshalb unterscheidet es sich zum Ranking von Google, welches sich auf die beste Antwort einer Suchanfrage fixiert. Die Suchmaschine von Amazon ist auf interne Daten angewiesen, die sich voll und ganz darauf festlegen, ihrem eigenen Interesse zu dienen. Dadurch wird sichergestellt, dass Produkte, welche die einzelnen User am ehesten kaufen, ganz oben in den Suchergebnissen erscheinen.

Um dies herauszufinden, nutzen sie viele verschiedene Faktoren:

  • Konversionsrate – Wie viele Personen haben bereits ein Produkt gekauft?
  • Relevanz – Wie gut entspricht es den Bedürfnissen des Käufers?
  • Bewertung anderer Käufer – Wie zufrieden sind Nutzer mit einem Produkt, also wie ist Gesamtbewertung des Produktes?

Der Algorithmus optimiert die Ergebnisse automatisch und stellt mit Hilfe dieser Informationen sicher, dass das perfekte Produkt ganz oben auf der Seite angezeigt wird.

Ziele von Suchmaschinen zusammengefasst

Das Ziel aller Suchmaschinen ist es, mit ihren Informationen die Bedürfnisse der Nutzer zu erfüllen. Je nach Bereich der Nachfrage variieren die Anforderungen an die Suchmaschinen. Ziele verschiedener Suchmaschinen:

  • Google: die genaueste Antwort / Lösung für ein Problem bieten
  • Amazon: das richtige Produkt präsentieren
  • Youtube: das relevanteste Video zu zeigen

Ursprünglich veröffentlicht am 14. Oktober 2019, aktualisiert am 22. Oktober 2019

Diesen Artikel weiterempfehlen: