Coordinació
Biblioteca de catalunya
Col·laboració
CESCA
Patrocini
Generalitat de Catalunya
Suport
Fundació puntCAT
Membre
IIPC
Recolzat en
HERITRIX
nutchwax
WERA
WEBCURATOR
WAYBACK
2007
2006   |   2007   |   2008   |   2009   |   2010




L'HTML predomina a la Web catalana

El PADICAT (Patrimoni Digital de Catalunya), liderat per la Biblioteca de Catalunya amb el suport del Centre de Supercomputació de Catalunya, ha realitzat un exhaustiu anàlisi dels formats i tecnologia utilitzada en la Web catalana, en base a una mostra de 1.000 pàgines web de tota índole.

La radiografia d'aquestes 1.000 pàgines web incloses al dipòsit digital del PADICAT permet afirmar que com a mitjana, cada pàgina web de Catalunya ocupa 1,33 GB de volum i conté una mitjana de 33.942 fitxers informàtics. Mai abans s'havia analitzat la composició de la Web catalana amb aquest significatiu mostreig.


Webs incloses al PADICAT/mostra de l'estudi1.004
Captures de diverses edicions de cada web2.720
Número total de fitxers informàtics34.077.807
Mitjana de fitxers per cada pàgina web33.942
Volum total del dipòsit PADICAT1.339,24 GB
Mitjana de volum per cada pàgina web1,33 GB



D’altra banda, es confirma en l'estudi que els formats més habituals a la Internet catalana són l'html (71,69%), gif (2,45%), i pdf (1,32%), seguits d'altres tipus menys habituals. Per als responsables del PADICAT, la presència majoritària de formats tan populars com aquests, que sumen el 82,5% del total de formats existents a la Web catalana, permet dibuixar un futur positiu pel que fa a la preservació dels recursos digitals a Internet.

FormatFitxers Volum (GB) % Fitxers % Volum
text/html24.429.679592,4571,69%55,83%
image/jpg2.416.055123,817,09%11,67%
image/gif834.0196,792,45%0,64%
application/pdf449.983167,341,32%15,77%
no-type75.0700,160,22%0,02%
image/png72.9051,510,21%0,14%
application/x-shockwave- flash68.3795,620,20%0,53%
application/msword42.1505,310,12%0,50%
text/plain39.96215,770,12%1,49%
text/css35.6680,170,10%0,02%
text/xml35.5830,460,10%0,04%
application/x-javascript23.8820,180,07%0,02%
image/pjpeg14.5140,380,04%0,04%
audio/mpeg10.31941,10,03%3,87%
application/atom+xml10.2640,050,03%0,00%
image/bmp10.2022,230,03%0,21%
audio/x-ms-wma8.86925,780,03%2,43%
application/download8.1220,30,02%0,03%
application/zip5.73011,490,02%1,08%
application/xml5.3960,050,02%0,00%
application/vnd.ms-excel5.2220,550,02%0,05%


La Biblioteca de Catalunya, que forma part de l'International Internet Preservation Consortium amb 26 institucions més, té amb el PADICAT l'objectiu de preservar les pàgines web de Catalunya, per garantir-ne el seu accés permanent. El PADICAT compta amb l'adhesió de 287 institucions de tot tipus.

tornar




Les eleccions municipals de 2007, a PADICAT.

El PADICAT mostra la presència dels candidats polítics a Internet en les darreres eleccions municipals amb més de 5.000 recursos digitals


La web del PADICAT (Patrimoni Digital de Catalunya), impulsat per la Biblioteca de Catalunya, ha incorporat al seu fons una àmplia col·lecció digital sobre les passades eleccions municipals, celebrades el 27 de maig de 2007.

Del 17 d'abril al 27 de juny s'han compilat 5.073 versions de 594 pàgines web de partits, webs institucionals d'una selecció de 48 municipis, blocs personals i webs de 278 caps de llista i 130 mitjans de comunicació, entre d'altres. En termes d'emmagatzematge d'informació, això suposa un volum d'informació de més de 450 GB i 13 milions de fitxers.

El PADICAT permet a l'usuari accedir a aquells recursos que encara es troben a la xarxa, però també permet recuperar informació històrica de webs que ja no es troben operatives, o que han modificat el seu contingut. D'aquesta manera, des de la web del Padicat es pot tenir accés a tot un conjunt d'informació diversa que permet fer el seguiment, des de les diferents perspectives, de l'evolució de les darreres eleccions a Internet.

L'anàlisi de les dades que ha realitzat la Biblioteca de Catalunya possibilita entendre quina és la presència i evolució dels candidats polítics municipals, per mitjà de l'anàlisi de la selecció de les pàgines web capturades (http://www.padicat.cat/docs/Especial_eleccions_municipals2007.pdf).

La Biblioteca de Catalunya va iniciar el juny de 2005 el projecte Padicat per tal de recollir i preservar tota la producció cultural, científica i de caràcter general catalana produïda en format digital. El Padicat compta amb la col·laboració tecnològica del Centre de Supercomputació de Catalunya (CESCA) i té un pressupost de 766.000 euros. En els últims mesos el Padicat ha entrat a formar part de l'International Internet Preservation Consortium, un grup de biblioteques nacionals que estan confeccionant els respectius arxiu web.

Des de la creació del PADICAT, la Biblioteca de Catalunya ha arribat a acords de col·laboració amb 275 institucions per fer que les versions històriques de les seves pàgines web siguin consultables a través de la web del Padicat de manera permanent. Entre altres, hi col·laboren diverses administracions, ajuntaments, empreses, universitats, col·legis professionals, institucions del sector cultural i mitjans de comunicació.

vegeu monogràfic

tornar




El PADICAT arriba als 200 col·laboradors, gràcies al conveni amb la UPC, i duplica en dos mesos les entitats adherides

La Biblioteca de Catalunya (BC) i la Universitat Politècnica de Catalunya (UPC) han signat un conveni de cooperació, pel qual la UPC s'adhereix al PADICAT. Aquesta és l'entitat número 200 que ha entrat a formar part del conjunt d'empreses, administracions, col·legis professionals i associacions de tot tipus que, des de l'onze de setembre passat, s'han adherit al projecte que la BC, en col·laboració amb el CESCA (Centre de Supercomputació de Catalunya) i el suport de la Secretaria de Telecomunicacions i Societat de la Informació de la Generalitat de Catalunya, està duent a terme. L'objectiu del projecte és adquirir, preservar i fer accessible el coneixement i la informació d'Internet per a les generacions futures de Catalunya i crear l'arxiu web de Catalunya. Amb aquest conveni, s'ha duplicat el nombre d'institucions adherides al PADICAT en poc més de 2 mesos, des que el passat 5 de març, la companyia teatral "El Tricicle" signés el conveni número 100.

El projecte PADICAT se centra en tres línies de treball: la compilació massiva dels recursos digitals publicats a Internet, com les pàgines web que tenen domini .CAT; la promoció de línies de recerca de determinats esdeveniments de la vida pública catalana, con la campanya a Internet durant les passades eleccions al Parlament de Catalunya; i l'impuls de la cooperació amb les institucions representatives de la societat civil catalana, per assegurar que les diferents versions de les seves produccions digitals s'incorporin al PADICAT de manera sistemàtica.

Per impulsar de manera conjunta el Patrimoni Digital de Catalunya, a banda de la UPC, la BC ha signat convenis de col·laboració amb altres 199 institucions que donen suport al projecte, essent els més recents els ajuntaments de Parets del Vallès, Santa Perpètua de Mogoda, les Franqueses del Vallès i Lloret de Mar; els col·legis professionals de Delineants de Tarragona, de Logopedes de Catalunya, l'Il·lustre Col·legi d'Advocats de Manresa i Col·legi Oficial d'Odontòlegs i Estomatòlegs de Catalunya; entitats culturals com el Museu de la Mediterrània, Publicacions de l'Abadia de Montserrat i l'Institut del Teatre; empreses com Simon Holding SL i Companyia d'Aigües de Sabadell S.A.; les universitats Universitat Abat Oliba CEU i Escola SUperior de Disseny ESDi; i un llarg etcètera.

Pel fet de pertànyer al PADICAT aquestes dues-centes institucions s'asseguren la preservació digital de les seves pàgines web i la seva inclusió al Patrimoni Digital de Catalunya, alhora que permeten a la ciutadania l'accés obert i permanent als recursos que són fruit del coneixement i l'expressió dels creadors del segle XXI, ja siguin aquests recursos digitals de caràcter cultural, educatiu, científic o administratiu.

tornar



PADICAT prepara les eleccions municipals

La Biblioteca de Catalunya, a través del projecte Patrimoni Digital de Catalunya (PADICAT), farà un seguiment especial de la informació que aparegui a internet sobre la campanya de les eleccions municipals del 27 de maig. Aquesta informació s'inclourà en el dipòsit de la Biblioteca, tal i com ja es va fer amb les anteriors eleccions al Parlament. En concret, es preveu la compilació de 1.600 recursos digitals d'un total de 450 seus web, que permetran comprendre, en el futur, l'evolució de la campanya electoral a una selecció de 50 municipis catalans. El dipòsit permetrà tenir permanentment accessibles blocs dels candidats, webs dels partits polítics i mitjans de comunicació local.

Aquest seguiment especial serà possible gràcies al fet que el projecte PADICAT ha duplicat la seva capacitat de captura de pàgines web per mitjà de l'adquisició de dos nodes Proliant DL360 G4p que s'afegeixen als dos nodes que ja funcionaven en les instal·lacions del Centre de Supercomputació de Catalunya (CESCA) per a les tasques de captura, processament i difusió dels recursos digitals de Catalunya.

El PADICAT té per objectiu la conservació de les pàgines web un cop aquestes s'actualitzen o desapareixen.

tornar



Cent institucions ja s'han adherit al PADICAT

La Biblioteca de Catalunya (BC) ha signat un conveni de cooperació amb la companyia de teatre "El Tricile", pel qual s'adhereix al projecte PADICAT (Patrimoni Digital de Catalunya). Aquesta és l'entitat número 100 que ha entrat a formar part del conjunt d'empreses, administracions, col·legis professionals i associacions de tot tipus que, des de l'onze de setembre passat, s'han adherit al projecte que la BC, en col·laboració amb el CESCA (Centre de Supercomputació de Catalunya) i el suport de la Secretaria de Telecomunicacions i Societat de la Informació de la Generalitat de Catalunya, està duent a terme. L'objectiu del projecte és adquirir, preservar i fer accessible el coneixement i la informació d'Internet per a les generacions futures de Catalunya i crear l'arxiu web de Catalunya.

El projecte PADICAT se centra en tres línies de treball: la compilació massiva dels recursos digitals publicats a Internet, com les pàgines web que tenen domini .CAT; la promoció de línies de recerca de determinats esdeveniments de la vida pública catalana, com la campanya a Internet durant les passades eleccions al Parlament de Catalunya; i l'impuls de la cooperació amb les institucions representatives de la societat civil catalana, per assegurar que les diferents versions de les seves produccions digitals s'incorporin al PADICAT de manera sistemàtica.

Per impulsar de manera conjunta el Patrimoni Digital de Catalunya, a banda de la companyia "Tricicle", la BC ha signat convenis de col·laboració amb altres 99 institucions que donen suport al projecte, essent els més recents els ajuntaments d'Olot, Tarragona, Les Borges Blanques, Sant Cugat del Vallès i Sant Sadurní d'Anoia; els col·legis professionals d'Advocats de Barcelona, de Mediadors d'Assegurances de Lleida, d'Enginyers Tècnics Industrials de Manresa, d'Ambientòlegs de Catalunya, de Fisioterapeutes de Catalunya, de Censors Jurats de Comptes de Catalunya, i l'Associació de Mestres Rosa Sensat; entitats culturals com la companyia Dagoll Dagom, Òmnium Cultural, la Federació de Joventuts Musicals de Catalunya, Taller de Músics i el Museu del Joguet de Catalunya; empreses com Girbau, Giró i Pimec; les universitats Pompeu Fabra, Oberta de Catalunya, Ramon Llull, Rovira i Vrgili, de Vic, i de Lleida; mitjans de comunicació com Vilaweb, E-notícies, Grup Comunicació 21; partits polítics com Convergència Democràtica de Catalunya i Ciutadans pel Canvi; entitats esportives com la Federació Catalana d'Hípica, Catalana de Bàsquetbol, Lleida Bàsquet, i la Federació d'Entitats Excursionistes de Catalunya; i associacions com el Casal Lambda i la Unió de Consumidors de Catalunya, entre moltes altres.

Pel fet de pertànyer al PADICAT aquest centenar d'institucions s'asseguren la preservació digital de les seves pàgines web i la seva inclusió al Patrimoni Digital de Catalunya, alhora que permeten a la ciutadania l'accés obert i permanent als recursos que són fruit del coneixement i l'expressió dels creadors del segle XXI, ja siguin aquests recursos digitals de caràcter cultural, educatiu, científic o administratiu.

tornar



La BC se suma al Consorci Internacional de Preservació d'Internet

La Biblioteca de Catalunya ha entrat a formar part de l'International Internet Preservation Consortium (Consorci Internacional de Preservació d'Internet), creat el 2003 i dedicat a la preservació digital, és a dir, a la conservació dels continguts de les pàgines web un cop aquestes s'actualitzen o desapareixen. D'aquesta manera, les institucions que en formen part asseguren la pervivència de la producció digital dels seus respectius àmbits territorials.

L’acord entre la Biblioteca i el Consorci Internacional de Preservació d'Internet s'emmarca en una de les línies prioritàries del Departament de Cultura i Mitjans de Comunicació de promoure les noves tecnologies com a instrument per a la difusió i preservació de la cultura.

L’International Internet Preservation Consortium (IIPC) té com a objectius adquirir, preservar i fer accessible el coneixement i la informació d'Internet per a les generacions futures de tot el món, promovent l'intercanvi global i les relacions internacionals.

Amb la seva inclusió en aquest organisme internacional, la Biblioteca de Catalunya se situa al costat d'altres catorze biblioteques i institucions d'arreu del món pioneres en preservació del patrimoni digital. Així mateix, la participació de la Biblioteca de Catalunya en aquest organisme li permet millorar el seu programa informàtic i compartir experiències amb altres centres que també treballen per a la preservació del patrimoni digital.

Membres
A més de la Biblioteca de Catalunya, l'IIPC està integrat per: la British Library (Biblioteca Nacional del Regne Unit), la Biblioteca Nacional d'Austràlia, la Biblioteca Nacional de França, la Biblioteca de dinamarca, la Biblioteca Nacional de Finlàndia, la Biblioteca Nacional d'Holanda, la Biblioteca Nacional de Suècia, la Biblioteca Nacional i Universitària d'Islàndia, la Biblioteca i Arxiu de Canadà, la Library of Congress (Biblioteca del Congrés dels Estats Units), la Biblioteca Nacional de Noruega, l'Internet Archive dels Estats Units, l'Administració Nacional d'Arxius i Enregistraments dels Estats Units i The European Archive Foundations (Fundació Europea d'Arxius).

Tots els membres de l'IIPC tenen en funcionament projectes que permeten capturar, processar i preservar les pàgines web que es produeixen als seus països. La Biblioteca de Catalunya va iniciar el projecte PADICAT (Patrimoni Digital de Catalunya) el juny de 2005, i compta amb la col·laboració del CESCA (Centre de Supercomputació de Catalunya) i el suport de la Secretaria de Telecomunicacions i Societat de la Informació de la Generalitat de Catalunya, amb un pressupost de 766.000 euros.

D'altra banda, cal recordar que la Biblioteca de Catalunya va adherir-se el passat mes de gener al projecte de Biblioteques de Google, juntament amb altres quatre biblioteques catalanes, per a digitalitzar centenars de milers de llibres de domini públic i posar-los a disposició dels usuaris d'Internet, unint-se, així, a les biblioteques de les universitats de Harvard, Oxford, Stanford i Califòrnia, entre d'altres centres de referència mundial.

tornar



Les eleccions de 2006, a PADICAT

La web del projecte PADICAT (Patrimoni Digital de Catalunya), impulsat per la Biblioteca de Catalunya, ha incorporat al seu fons una àmplia col·lecció digital sobre les passades eleccions al Parlament de Catalunya, celebrades l'1 de novembre de l'any 2006.

En total, s'han seleccionat més de 600 recursos digitals de 83 pàgines web de partits polítics amb i sense representació parlamentària, webs institucionals, blogs personals, webs de candidats, mitjans de comunicació, fundacions polítiques i societats de recerca, entre d'altres. En termes d'emmagatzematge d'informació, això suposa un volum d'informació de més de 150 GB.

El projecte permet a l'usuari accedir des d'una sola base de dades a aquells recursos que encara es troben a la xarxa, però també permet recuperar informació històrica de webs que ja no es troben operatives. D'aquesta manera, des de la web de Padicat es podrà tenir accés a tot un conjunt d'informació diversa que permetrà fer el seguiment, des de les diferents perspectives, de l'evolució de la campanya electoral catalana a Internet.

La Biblioteca de Catalunya va iniciar el juny de 2005 el projecte Padicat per tal de recollir i preservar tota la producció cultural, científica i de caràcter general catalana produïda en format digital. El projecte compta amb la col·laboració tecnològica del Centre de Supercomputació de Catalunya (CESCA) i té un pressupost de 766.000 euros.

Des de la creació del PADICAT, la Biblioteca de Catalunya ha arribat a acords de col·laboració amb una seixantena d'institucions per fer que les versions històriques de les seves pàgines web siguin consultables a través de la web del Padicat de manera permanent. Entre altres, hi col·laboren diverses administracions, ajuntaments, empreses, universitats, col·legis professionals, institucions del sector cultural i mitjans de comunicació.

vegeu monogràfic

tornar