Friday, June 29, 2007

Archive.org: La historia del Archivo de Internet

http://www.microsiervos.com/archivo/internet/historia-archive-org.html

Inside the Intenet Archive es un antiguo pero no por ello menos interesante artículo sobre las interioridades de The Internet Archive (más conocido como Archive.org) – a veces llamado «la Biblioteca de Alejandría de la Web» o también «la mayor colección de pornografía del mundo, en una sola habitación».

Desde 1996 cientos de ordenadores rastrean y guardan «copias» de todo el contenido posible de la Web, o al menos lo que se puede rastrear, se va almacenando para el futuro, como en una gran biblioteca. Esta organización sin ánimo de lucro con el tiempo ha ido creciendo en cuanto a medios y tecnología, y desarrollando servicios prácticos para los usuarios.

Uno de ellos es la popular Wayback Machine, que permite ver una «fotografía» de cómo era una web concreta en distintas épocas, con sólo teclear su dirección. [...]



Los datos del artículo son espectaculares y eso que datan de 2002:
- 10.000 millones de páginas archivadas
- 250 gigabytes nuevos de datos que se añaden cada día
- más de 200 servidores

Según la entrada en la Wikipedia del Archivo Internet ya en 2006 los archivo ocupaban dos petabytes (2.000 terabytes = dos millones de gigabytes) y se añadían 20 terabytes cada mes. Al ritmo actual, los nuevos sitios web tardan entre 6 y 12 meses en ser incluídos.

1 comentarios:

Vyoljann said...

La de bootlegs, secretos de estado, abducciones... ke habran ahi XD