Webs capturats
Des del 21 de juliol de 2006 el sistema ha evolucionat per capturar sistemàticament i de manera eficaç un nombre creixent de pàgines web. També ha evolucionat l’espai necessari per emmagatzemar i donar accés a aquestes dades.
En l’exposició de dades estadístiques, ens referim a “web”, o “lloc web”, com un recurs publicat a Internet que està identificat per una URL independent. Ens referim a “captura”, com cadascuna de les captures realitzades en el temps d’un lloc web. I ens referim a “fitxer”, com cadascun dels fitxers o arxius informàtics que conté un lloc web. S’inclouen altres dades tècniques que poden ser de l’interès del públic de PADICAT.
Continguts del repositori
| Concepte | Total |
|---|---|
| Nombre de webs | 58.787 |
| Nombre de captures | 262.937 |
| Nombre de fitxers | 372.932.876 |
| Espai d'ARC (TB) | 12,27 |
| Espai d'índexs (TB) | 1 |
| Espai total (TB) | 13,27 |
Procedència de les captures
Els recursos dipositats al repositori procedeixen: de la captura del domini .CAT; de recursos compilats per crear col·leccions monogràfiques; de pàgines web recomanades pel públic de PADICAT; i de recursos digitals de les institucions que han signat conveni de cooperació amb la Biblioteca de Catalunya.
| Concepte | Nombre de webs | Nombre de captures |
|---|---|---|
| Convenis | 598 | 4.138 |
| Recomanats | 10.980 | 64.827 |
| Monogràfics | 7.184 | 95.228 |
| .cat | 40.025 | 98.744 |
| Total | 58.787 | 262.937 |
Distribució del tipus de fitxer informàtic que conté el repositori PADICAT
| Tipus | Fitxers | |
|---|---|---|
| text/html | 282.840.290 | 75,84% |
| image/jpeg | 42.854.857 | 11,49% |
| image/gif | 9.520.230 | 2,55% |
| image/png | 7.836.033 | 2,10% |
| application/pdf | 5.661.480 | 1,52% |
| application/atom+xml | 4.020.413 | 1,08% |
| text/xml | 2.704.612 | 0,73% |
| application/rss+xml | 2.464.696 | 0,66% |
| text/css | 2.226.545 | 0,60% |
| text/plain | 1.786.454 | 0,48% |
| application/javascript | 1.666.166 | 0,45% |
| text/dns | 1.441.111 | 0,39% |
| application/x-shockwave-flash | 1.339.610 | 0,36% |
| application/xml | 972.565 | 0,26% |
| application/x-javascript | 869.638 | 0,23% |
| no-type | 525.092 | 0,14% |
| application/octet-stream | 400.676 | 0,11% |
| application/msword | 322.765 | 0,09% |
| application/http | 319.700 | 0,09% |
| image/pjpeg | 268.921 | 0,07% |
| Altres | 2.891.022 | 0,78% |
| Total | 372.932.876 | |
Evolució dels monogràfics: les col·leccions temàtiques de PADICAT
S’ha realitzat vuit monogràfics: museus de Catalunya, música folk-rock a Catalunya, campanya electoral de les eleccions al Parlament Europeu (2009), al Parlament de Catalunya (2006 i 2010), al Congrés i Senat espanyol (2008), i eleccions municipals (2007 i 2011).
| Concepte | Nombre de webs noves | Nombre de captures | Nombre de fitxers | Espai (GB) |
|---|---|---|---|---|
| Eleccions al Parlament 2006 | 81 | 775 | 4.953.215 | 175 |
| Eleccions Municipals 2007 | 531 | 1.747 | 13.641.991 | 457 |
| Folkrock | 56 | 56 | 1.148.312 | 22 |
| Eleccions Generals 2008 | 129 | 896 | 3.117.638 | 135,11 |
| Eleccions europees 2009 | 170 | 613 | 5.404.291 | 233,05 |
| Museus de Catalunya | 1.523 | 1.550 | 2.146.133 | 147,49 |
| Eleccions al Parlament 2010 | 967 | 31.210 | 17.202.999 | 707,65 |
| Eleccions Municipals 2011 | 3.346 | 47.429 | 21.766.832 | 1.127 |
| Eleccions Generals 2011 | 304 | 939 | 1.764.159 | 276 |
| Eleccions al Parlament 2012 | 77 | 10.013 | 16.890.655 | 328 |
| Total | 7.184 | 95.228 | 88.036.225 | 3608,3 |
Més informació sobre les col·leccions monogràfiques de PADICAT en les campanyes electorals:
Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764