Webs capturats
Des del 21 de juliol de 2006 el sistema ha evolucionat per capturar sistemàticament i de manera eficaç un nombre creixent de pàgines web. També ha evolucionat l’espai necessari per emmagatzemar i donar accés a aquestes dades.
En l’exposició de dades estadístiques, ens referim a “web”, o “lloc web”, com un recurs publicat a Internet que està identificat per una URL independent. Ens referim a “captura”, com cadascuna de les captures realitzades en el temps d’un lloc web. I ens referim a “fitxer”, com cadascun dels fitxers o arxius informàtics que conté un lloc web. S’inclouen altres dades tècniques que poden ser de l’interès del públic de PADICAT.
Continguts del repositori
Concepte | Total |
---|---|
Nombre de webs | 146.460 |
Nombre de captures | 383.371 |
Espai total (TB) | 54,72 |
Procedència de les captures
Els recursos dipositats al repositori procedeixen: de la captura del domini .CAT; de recursos compilats per crear col·leccions monogràfiques; de pàgines web recomanades pel públic de PADICAT; i de recursos digitals de les institucions que han signat conveni de cooperació amb la Biblioteca de Catalunya.
Concepte | Nombre de webs | Nombre de captures |
---|---|---|
Convenis | 723 | 7.288 |
Recomanats | 12.142 | 86.509 |
Monogràfics | 7.184 | 95.228 |
.cat | 53.186 | 132.267 |
Total | 73.125 | 321.292 |
Distribució del tipus de fitxer informàtic que conté el repositori PADICAT
Tipus | Fitxers | |
---|---|---|
text/html | 470.031.467 | 69,71% |
image/jpeg | 94.859.253 | 14,07% |
image/png | 16.853.933 | 2,50% |
image/gif | 13.146.830 | 1,95% |
application/rss+xml | 9.048.245 | 1,34% |
application/pdf | 8.267.872 | 1,23% |
application/atom+xml | 6.382.130 | 0,95% |
text/xml | 6.274.786 | 0,93% |
text/css | 5.721.966 | 0,85% |
application/json | 5.449.566 | 0,81% |
application/javascript | 5.020.227 | 0,74% |
text/dns | 4.922.473 | 0,73% |
text/plain | 4.870.847 | 0,72% |
application/javascript | 3.930.964 | 0,58% |
application/http | 2.214.667 | 0,33% |
text/javascript | 1.809.139 | 0,27% |
application/x-javascript | 1.735.910 | 0,26% |
application/xml | 1.613.883 | 0,24% |
application/opensearchdescription+xml | 1.362.813 | 0,20% |
Altres | 10.792.070 | 1,60% |
Evolució dels monogràfics: les col·leccions temàtiques de PADICAT
S’ha realitzat vuit monogràfics: museus de Catalunya, música folk-rock a Catalunya, campanya electoral de les eleccions al Parlament Europeu (2009), al Parlament de Catalunya (2006 i 2010), al Congrés i Senat espanyol (2008), i eleccions municipals (2007 i 2011).
Concepte | Nombre de webs noves | Nombre de captures | Nombre de fitxers | Espai (GB) |
---|---|---|---|---|
Eleccions al Parlament 2006 | 81 | 775 | 4.953.215 | 175 |
Eleccions Municipals 2007 | 531 | 1.747 | 13.641.991 | 457 |
Folkrock | 56 | 56 | 1.148.312 | 22 |
Eleccions Generals 2008 | 129 | 896 | 3.117.638 | 135,11 |
Eleccions europees 2009 | 170 | 613 | 5.404.291 | 233,05 |
Museus de Catalunya | 1.523 | 1.550 | 2.146.133 | 147,49 |
Eleccions al Parlament 2010 | 967 | 31.210 | 17.202.999 | 707,65 |
Eleccions Municipals 2011 | 3.346 | 47.429 | 21.766.832 | 1.127 |
Eleccions Generals 2011 | 304 | 939 | 1.764.159 | 276 |
Eleccions al Parlament 2012 | 77 | 10.013 | 16.890.655 | 328 |
Total | 7.184 | 95.228 | 88.036.225 | 3608,3 |
Més informació sobre les col·leccions monogràfiques de PADICAT en les campanyes electorals:
Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Ricard de la Vega (2011). “A ritmo de tweet: archivando elecciones 2.0”. El profesional de la información, vol. 20, nº 3. http://eprints.rclis.org/handle/10760/15764