Webs capturados
Desde el 21 de Julio de 2006 el sistema ha evolucionado para capturar sistemáticamente y de manera eficaz un número creciente de sitios web. También ha evolucionado el espacio necesario para almacenar y dar acceso a estos datos.
En la exposición de datos estadísticos, nos referimos a “web”, o “sitio web”, como un recurso publicado en Internet que está identificado por una URL independiente. Y nos referimos a “archivo”, como cada uno de los archivos informáticos que contiene un sitio web. Se incluyen otros datos técnicos que pueden ser de interés del público de PADICAT.
Contenidos del repositorio:
| Concepto | Total |
|---|---|
| Número de webs | 57.993 |
| Número de capturas | 229.396 |
| Número de ficheros | 340.279.750 |
| Espacio de ARC (TB) | 12 |
| Espacio de índices (TB) | 1 |
| Espacio total (TB) | 13 |
Procedencia de las capturas
Los recursos depositados en el repositorio proceden: de la captura del dominio .cat; de recursos compilados para crear colecciones monográficas; de páginas web recomendadas por el público de PADICAT; y de recursos digitales de las instituciones que han firmado convenio de cooperación con la Biblioteca de Catalunya.
| Concepto | Número de webs | Número de capturas |
|---|---|---|
| Convenios | 463 | 2.606 |
| Recomendados | 704 | 3.257 |
| Monográficos | 3.249 | 36.682 |
| .cat | 35.171 | 75.494 |
| Total | 39.587 | 118.039 |
Distribución del tipo de archivo informático que contiene el repositorio PADICAT.
| Tipo | Ficheros | |
|---|---|---|
| text/html | 263.148.453 | 77,33% |
| image/jpeg | 37.756.722 | 11,09% |
| image/gif | 8.456.930 | 2,49% |
| image/png | 5.963.586 | 1,75% |
| application/pdf | 5.375.942 | 1,58% |
| application/atom+xml | 3.548.712 | 1,04% |
| text/xml | 2.302.467 | 0,68% |
| application/rss+xml | 2.241.257 | 0,66% |
| text/css | 1.792.974 | 0,53% |
| application/javascript | 1.388.795 | 0,41% |
| text/plain | 1.387.596 | 0,41% |
| text/dns | 976.210 | 0,29% |
| application/x-shockwave-flash | 903.466 | 0,27% |
| application/x-javascript | 683.954 | 0,20% |
| no-type | 522.794 | 0,15% |
| application/xml | 517.012 | 0,15% |
| application/octet-stream | 377.471 | 0,11% |
| application/msword | 307.148 | 0,09% |
| image/pjpeg | 255.547 | 0,07% |
| image/jpg | 208.674 | 0,06% |
| Altres | 2.164.040 | 0,64% |
| Total | 340.279.750 | |
Evolución de los monográficos: las colecciones temáticas de PADICAT
Se han realizado ocho monográficos: museos de Cataluña, música folk-rock en Cataluña, campaña electoral de las elecciones al Parlamento Europeo (2009), al Parlamento de Cataluña (2006 y 2010), al Congreso y Senado español (2008), y elecciones municipales (2007 y 2011).
| Concepto | Número de webs | Número de capturas | Número de ficheros | Espacio (GB) |
|---|---|---|---|---|
| Elecciones al Parlament 2006 | 88 | 775 | 4.953.215 | 175 |
| Elecciones Municipales 2007 | 615 | 1.747 | 13.641.991 | 457 |
| Folkrock | 50 | 50 | 1.148.312 | 22 |
| Elecciones generales 2008 | 147 | 896 | 3.117.638 | 135,11 |
| Eleccions europeas 2009 | 170 | 613 | 5.404.291 | 233,05 |
| Museos de Cataluña | 1.364 | 1.391 | 2.146.133 | 147,49 |
| Elecciones al Parlamento 2010 | 806 | 31.210 | 17.202.999 | 707,65 |
| Elecciones Municipales 2011 | 1.518 | 47.429 | 17.202.999 | 1.127 |
| Total | 4.758 | 84.111 | 64.817.578 | 3004,3 |
Más información sobre las colecciones monográficas de PADICAT en las campañas electorales:
Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764