Beitragmadeby » 09.10.2024, 07:58 Bing Archive ähnlich wie archive.org ?
Hallo,
gibt es für Bing auch eine Seite ähnlich wie archiv.org ?
Ich kann zwar bei einem Suchergebnis eine Seite im Cache sehen, aber diese ist oft nur wenige Wochen alt.
Mich würden frühere Versionen interessieren.
Oder anders gefragt: Kann man bei Bing irgendwo einsehen, wann eine Seite/Unterseite das erste mal gecrawlt wurde ?
Habt ihr da einen Tipp für mich ?
Beitragstaticweb » 09.10.2024, 08:16 Bing Archive ähnlich wie archive.org ?
> gibt es für Bing auch eine Seite ähnlich wie archiv.org ?
Die Wayback Machine des Das Internet Archive hat nichts mit Google zu tun und gibt es bereits seit fast 30 Jahren. Google hat sie jetzt nur als Ersatz für das eigenes Caching System gewählt.
Beitragstaticweb » 09.10.2024, 08:29 Bing Archive ähnlich wie archive.org ?
> Und deshalb suche ich etwas, wo man einsehen könnte wann Bing erstmalig eine Seite aufgenommen hat.
Wenn du da selbst keine Aufzeichnungen über die Bing Webmaster Tools gesammelt hast wirst du den genauen Zeitpunkt wohl nie erfahren.
Update: Im Bing Site Explorer kann man tatsächlich sehen wann eine Seite entdeckt (nicht indexiert?) wurde. Ich weiß allerdings nicht ob das Datum stimmt wenn man die Seite zwischendurch deindexiert hatte.
Wieder was dazugelernt. Vielleicht sollte man doch öfters mal bei Bing reinschauen.
Beitragmadeby » 09.10.2024, 08:36 Bing Archive ähnlich wie archive.org ?
Ok danke.
Dann mal so gefragt:
Wenn eine Unterseite z.B /Vollmacht von Bing gecrawlt wurde, (Dies kann man über die Logfiles auf dem Server sehen) die Seite aber selbst noch nicht online war, also für das menschliche Auge noch nicht sichtbar.
Ist das doch durchaus möglich ?
Also das Bing die Seite schon gecrawlt hat aber noch nicht online stand oder freigegeben wurde ?
Sie wurde vermutlich dann nun eben nicht in den Suchindex aufgenommen, da diese eben noch nicht freigeschaltet war.
Beitragstaticweb » 09.10.2024, 09:27 Bing Archive ähnlich wie archive.org ?
> Also das Bing die Seite schon gecrawlt hat aber noch nicht online stand oder freigegeben wurde?
Wenn du sie bereits verlinkt hast werden Bots auch versuchen diese zu crawlen. Die werden dann aber einen 4xx zurückbekommen und natürlich wird dann auch nichts indexiert.