La Biblioteca Nacional de España ha completado su tercera recolección masiva del dominio .es. En este proceso, que permite el depósito legal de las publicaciones en línea, se han guardado aproximadamente 50 TB de información, lo que supone un incremento de más de un 23% con respecto al año pasado.

Desde la entrada en vigor de la Ley 23/2011, los sitios web son objeto de depósito legal y por tanto se consideran parte del patrimonio documental que la Biblioteca Nacional de España tiene el deber de preservar. Por ello, se llevan a cabo recolecciones masivas (normalmente una vez al año) en las que se recopila la información contenida en las webs con dominio .es. Se usa el fichero que proporciona Red.es, entidad con la que la BNE tiene firmado un convenio de colaboración.

Este año los trabajos se han realizado en 42 días, frente a los dos meses que duraron en 2017, y utilizando más de 70 arañas recolectoras, con un límite de 150 megabytes por dominio. Esto ha permitido que un 87% de los 1.900.000 dominios registrados por Red.es se hayan almacenado completos.

Desde la adopción e instalación de NetarchiveSuite como sistema de recolección propio en 2014, la BNE ha llevado a cabo tres recolecciones masivas del dominio .es. Desde 2009 hasta entonces, se habían llevado a cabo gracias a la colaboración con Internet Archive.

Estos procesos se completan con recolecciones selectivas de distinto tipo (temáticas, de evento o riesgo), gestionadas por los conservadores web de la Biblioteca Nacional de España y de los centros de conservación de las Comunidades Autónomas. En total, la colección que las CCAA y la BNE han formado con información patrimonial de la web española supera los 360 TB de información archivada.

Toda esta información es consultable en la BNE y en los centros de conservación de las CCAA que lo han solicitado. De momento, la búsqueda solo es posible por URL, pero el objetivo es ofrecer a medio plazo búsqueda a texto completo en todo el archivo web. Las listas de los sitios web incluidos en las recolecciones selectivas se pueden consultar en línea en la página de la Biblioteca Nacional de España.

Artículo anteriorEl Tesoro del Delfin luce en los nuevos espacios del Prado
Artículo siguienteThe Conversation lanza su edición en español gracias a Fundación Telefónica