Webs capturados

Desde el 21 de Julio de 2006 el sistema ha evolucionado para capturar sistemáticamente y de manera eficaz un número creciente de sitios web. También ha evolucionado el espacio necesario para almacenar y dar acceso a estos datos.

En la exposición de datos estadísticos, nos referimos a “web”, o “sitio web”, como un recurso publicado en Internet que está identificado por una URL independiente. Y nos referimos a “archivo”, como cada uno de los archivos informáticos que contiene un sitio web. Se incluyen otros datos técnicos que pueden ser de interés del público de PADICAT.

Contenidos del repositorio:

 

ConceptoTotal
Número de webs57.993
Número de capturas229.396
Número de ficheros340.279.750
Espacio de ARC (TB)12
Espacio de índices (TB)1
Espacio total (TB)13

 

Procedencia de las capturas

Los recursos depositados en el repositorio proceden: de la captura del dominio .cat; de recursos compilados para crear colecciones monográficas; de páginas web recomendadas por el público de PADICAT; y de recursos digitales de las instituciones que han firmado convenio de cooperación con la Biblioteca de Catalunya.

 

ConceptoNúmero de websNúmero de capturas
Convenios4632.606
Recomendados7043.257
Monográficos3.24936.682
.cat35.17175.494
Total39.587118.039

 

Distribución del tipo de archivo informático que contiene el repositorio PADICAT.

 

TipoFicheros
text/html263.148.45377,33%
image/jpeg37.756.72211,09%
image/gif8.456.9302,49%
image/png5.963.5861,75%
application/pdf5.375.9421,58%
application/atom+xml3.548.7121,04%
text/xml2.302.4670,68%
application/rss+xml2.241.2570,66%
text/css1.792.9740,53%
application/javascript1.388.7950,41%
text/plain1.387.5960,41%
text/dns976.2100,29%
application/x-shockwave-flash903.4660,27%
application/x-javascript683.9540,20%
no-type522.7940,15%
application/xml517.0120,15%
application/octet-stream377.4710,11%
application/msword307.1480,09%
image/pjpeg255.5470,07%
image/jpg208.6740,06%
Altres2.164.0400,64%
Total340.279.750 

Evolución de los monográficos: las colecciones temáticas de PADICAT

Se han realizado ocho monográficos: museos de Cataluña, música folk-rock en Cataluña, campaña electoral de las elecciones al Parlamento Europeo (2009), al Parlamento de Cataluña (2006 y 2010), al Congreso y Senado español (2008), y elecciones municipales (2007 y 2011).

 

ConceptoNúmero de websNúmero de capturasNúmero de ficherosEspacio (GB)
Elecciones al Parlament 2006887754.953.215175
Elecciones Municipales 20076151.74713.641.991457
Folkrock50501.148.31222
Elecciones generales 20081478963.117.638135,11
Eleccions europeas 20091706135.404.291233,05
Museos de Cataluña1.3641.3912.146.133147,49
Elecciones al Parlamento 201080631.21017.202.999707,65
Elecciones Municipales 20111.51847.42917.202.9991.127
Total4.75884.11164.817.5783004,3

 

Más información sobre las colecciones monográficas de PADICAT en las campañas electorales:

Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764