UsenetArchives.com: 300 Millionen Posts mit 300 GB verfügbar

UsenetArchives.com fängt mit nahezu 300 Millionen einzelnen Postings aus dem Usenet an. Das Archiv ist kostenlos und frei von Werbung.

UsenetArchives.com
UsenetArchives.com Foto Alexandre Dulaunoy, thx! (CC BY-SA 2.0)

Der Kanadier Jozef Jarosciak baut momentan ein neues Archiv für den Textbereich vom Usenet auf. UsenetArchives.com ist kostenlos und frei von jeglicher Werbung. Bisher hat der Betreiber fast 300 Millionen einzelne Beiträge eingefügt. Pro Tag sollen bis zu 10 Millionen neue dazukommen.

UsenetArchives.com archiviert den Textbereich vom Usenet

Der Textbereich vom Usenet entstand bereits Ende der 70er Jahre. Wo heute in den Foren und sozialen Netzwerken diskutiert wird, so hat man dies früher im Usenet getan. Damals haben sich zahlreiche führende Mitarbeiter der IT-Konzerne dort öffentlich ausgetauscht. Die großen acht Newsgroups stellen den Anfang des neuen Archivs dar.

Momentan besteht die Datenbank aus 300 GB, die sich in 292.541.983 einzelne Postings von 8.911 verschiedenen Newsgroups aufspalten. Nach Angaben des Betreibers fügt er täglich zwischen eine bis zu zehn Millionen neue Posts pro Tag hinzu. Wenn Jarosciak mit UsenetArchives.com fertig ist, sollen es bis zu 60.000 einzelne Text Gruppen sein. Alles in allem muss er bis zu zwei Milliarden Beiträge einbinden, wenn das Archiv irgendwann mal vollständig ist.

usenetarchives.com

Neue Konkurrenz zu Google Groups

Natürlich sind einige Beiträge bzw. Newsgroups auch bei den Google Groups verfügbar. Aber niemand weiß, wie lange noch. Google hat dort keine Werbung geschaltet. Das Projekt generiert nichts als Kosten. Außerdem ist bei Google das Archiv bei weitem nicht vollständig, wie Jarosciak schreibt.

Momentan besteht bei UsenetArchives.com noch ein Limit aufgrund der enormen Aktivität der ganzen Webcrawler auf seinem Server. Würde er alles freischalten, würden die Crawler dafür sorgen, dass sein Webserver aufgrund der Masse an zu indizierenden Texten regelrecht in die Knie geht. Bis zum Ende des Jahres soll das Limit für Diskussionen mit mindestens fünf Antworten definitiv wegfallen. Dann werden alle Diskussionen sichtbar sein.


Viel vorgenommen…

Bleibt zu hoffen, dass der Gründer genug Motivation und finanzielle Mittel mitbringt, um sein Projekt langfristig zu betreiben. Die ersten Reaktionen bei Reddit waren zumindest durchweg positiv.

Tarnkappe.info

Lars Sobiraj fing im Jahr 2000 an, als Quereinsteiger für verschiedene Computerzeitschriften tätig zu sein. 2006 kamen neben gulli.com noch zahlreiche andere Online-Magazine dazu. Er ist der Gründer von Tarnkappe.info. Außerdem bringt Ghandy, wie er sich in der Szene nennt, seit 2014 an verschiedenen Hochschulen und Fortbildungseinrichtungen den Teilnehmern bei, wie das Internet funktioniert.