Kommentare zu folgendem Beitrag: Wayback Machine: Archive.org feiert 1 Billion gespeicherte Webseiten
Eine Billion Webseiten hat das Internetarchiv von Archive.org mittlerweile gespeichert. Man kann sie über die Wayback Machine abrufen.
Eine Billion Webseiten hat das Internetarchiv von Archive.org mittlerweile gespeichert. Man kann sie über die Wayback Machine abrufen.
Nun, ich halte die Zahl der gespeicherten Webseiten für maßlos übertrieben, aber wenn man jeden Artikel auf einer Webseite, der eine neue URL aufruft, als separate Webseite und nicht als Subdomain definiert, kommt das schon hin. Ich dachte erst, eine Billion als US-Maßeinheit wären nur eine Milliarde gewesen, also ein bisschen wenig. Eine Billion Seiten an sich ist schon wieder naja. Das wären so pauschal ~128 Webseiten pro Mensch auf der Welt.
Das wird auch ein wenig anders gerechnet als gedacht…
Von manchen Seiten gibt es mehr als „eins“ oder „paar“ gespeicherte Abbilder. Von vielen, vor allem intressanten Seiten gibt es manchmal hunderte und mehr „Backups“ von verschieden Jahren und Monaten…
Bin mir sicher, das die Zahl nicht mal untertrieben.
ABER selbst da wird gefiltert, und nicht jede Seite hat aus welchen Gründen auch immer, ein Backup / oder gar mehrere… Beispiele sind vor allem viel bei Crypt-Software zu finden…, oder ehemalige Hacker-Sites.
Jedoch findet man manchmal noch sehr gutes! Also ich finde die Seite genial gut, genauso wie deren Archive.org. ![]()
Als Beispiel hier die „Snapshots“ von der Tarnkappe
Die Seite wurde über 1700 x „gesnappt“ also in verschiedenen Jahren und verschiedenen Tagen… Das zählt jeweils als „gespeicherte Seite!“
ABER was war eigentlich im Jahr 2013 los… ![]()
PS. Gibt Seiten die wurden „oft“ gespeichert, sind aber „raus“
Tarnkappe mit 1700 Sites-Copies liegt eher im Mittelfeld.
Was aber nicht wirklich geklärt ist, ob die 1 Billion nun wirklich verschiedene Seiten oder Unterseiten sind, oder z.b. jedes Backup einer Seite als weitere Seite zählt.
Dadurch wird der Zähler für eine einfache Webpräsenz mit 5 Unterseiten dann bei jedem weiteren Backup um jeweils 6+ Seiten erhöht.
Dennoch finde ich das ganze wirklich eine klasse Sache und freue mich, dass es die Wayback Machine gibt.
Interessant wären sicherlich auch ein paar Zahlen über den Speicher gewesen.
Sag mal @Ghandy
War die Tarnkappe auch schon im Jahr 2009 in deinem Besitz?
Hier ein Screenshot aus dem Jahr 2009 - sieht ja alles so anders aus. ![]()
Eine der meist „gescannten“ Hauptseite wird Google sein…
Immer 18 Millionen „Snapshots“ seit 11.11.1998 ! ![]()
Die „Waybackmaschine“ ist halt wie eine Zeitmaschine…
Mehr als folgendes war an den esten Tagen von Google nicht zu sehen (1998)
Deshalb war es ja auch so erfolgreich. Man musste sich mit Modem einwählen und hatte schlicht keine Lust, ewig zu warten bis die ganzen Werbebanner geladen waren. Ja, Yahoo, du bist gemeint. Good riddance.
Mmhhh…
![]()
Ich kann mich ja täuschen, aber im Fall von Guuble, finde ich ca. 1918 Captures pro Tag in den knapp 27 Jahren, für so ziemlich sinnbefreit!
Tarnkappe.info gibt es erst seit 2014, das waren wir nicht.
In dem Fall sehe ich das auch so, weil ja im Prinzip nur das „Front-End“ in diesem Fall gescannt/gesnappt wird. Für Google Fans vielleicht interessant, wie sich das LOGO von denen in den fast 3 Jahrzehnten verändert hat.
Gab da ja viel kreatives…
Manche Seiten fielen unterm Radar, einige wurde wieder „entfernt“ vielleicht auf Aufforderung irgendwelcher Behörden… / ABER ich mag die Seite.