Herzlich willkommen im SEO Forum der ABAKUS Internet Marketing GmbH

Zum Inhalt

  • Leistungen
  • SEO-Wissen
  • Referenzen
  • SEO Agentur
Suchmaschinenoptimierung

Home


Profil


Suche


private Nachrichten


Mitglieder


Anmelden


Registrieren


Letzte Themen

Newsletter abonnieren
  • Schnellzugriff
    • Unbeantwortete Themen
    • Aktive Themen
    • Suche
  • Anmelden
  • Registrieren
  • ABAKUS Foren-Übersicht
  • Erweiterte Suche
  • Suche

registrieren registriertes Mitglied


Anzeige

Anzeige
Erweiterte Suche
 

Datenbank: Suchmaschinen Robots/Spider/Crawler

 können spider erkennen, dass url mit mod_rewrite

Googlebot liest nur index.php?

 
viggen
PostRank 10
PostRank 10
Beiträge: 6249
Registriert: 12.05.2003, 14:44

Beitrag von viggen » 10.08.2003, 14:36

Hier werden alle bekannten Suchmaschinen Robots/Spider/Crawler gelistet.
________________________________________________________________________

Boitho.com-robot/1.1
Spider von der norwegischen Suchmaschine https://www.boitho.com/index.htm.en
(englische Seiten werden gespidert und im Index aufgenommen)
beachtet Robots.txt
bekannte IP: 217.118.38.226 - 217.118.38.234

Um diesen Robot von Ihrer Seite zu bannen geben sie folgende Zeile in Ihre Robots.txt ein

User-agent: boitho.com-robot
Disallow: /

_______________________________________________________________________

Gigabot/1.0
Spider von der englischsprachigen Suchmaschine www.gigablast.com,
beachtet Robots.txt
bekannte IP: 63.236.66.119 | 216.243.113.1

Um diesen Robot von Ihrer Seite zu bannen geben sie folgende Zeile in Ihre Robots.txt ein

User-agent: gigabot
Disallow: /

_______________________________________________________________________

Slurp (slurp/si,slurp/cat)
Spider des Datenproviders Inktomi https://www.inktomi.com/slurp.html
beachtet Robots.txt
bekannte IP: 66.196.64.0 - 66.196.127.255 | 209.131.32.0 - 209.131.63.255

Um diesen Robot von Ihrer Seite zu bannen geben sie folgende Zeile in Ihre Robots.txt ein

User-agent: slurp
Disallow: /


Anmerkung: Wichtiger Robot - Inktomi liefert Daten für MSN und Hotbot
_______________________________________________________________________

Szukacz/1.5
Spider von der polnischsprachigen Suchmaschine https://www.szukacz.pl/
(deutsche und englische Seiten werden gespidert und im Index aufgenommen)
beachtet Robots.txt
bekannte IP: 193.218.115.XXX | 194.181.35.X
bramka.proszynski.pl und brama.proszynski.pl

Um diesen Robot von Ihrer Seite zu bannen geben sie folgende Zeile in Ihre Robots.txt ein

User-agent: szukacz
Disallow: /

_______________________________________________________________________

Anzeige von:

Die Antwort findest du hier: zum Archiv
  • Foren-Übersicht
  • Alle Cookies löschen
  • Kontakt
  • zum ABAKUS Archiv

Flat Style by Ian Bradley

Powered by phpBB® Forum Software © phpBB Limited

Deutsche Übersetzung durch phpBB.de

Datenschutz | Nutzungsbedingungen | Impressum

SEO Agentur | SEO Blog | SEO Online Tools | SEO Dienstleistungen | SEO Workshops | SEO Beratung | Backlinks kaufen | SEO Audit | SEO Tools gratis | SEO-Konkurrenzanalyse


Sie lesen gerade: Datenbank: Suchmaschinen Robots/Spider/Crawler - ABAKUS