Coordinació
Biblioteca de catalunya
Col·laboració
CESCA
Patrocini
Generalitat de Catalunya
Suport
Fundació puntCAT
Membre
IIPC
Recolzat en
HERITRIX
nutchwax
WERA
WEBCURATOR
WAYBACK
2006
2006   |   2007   |   2008   |   2009   |   2010




Signat el conveni de cooperació entre la Biblioteca de Catalunya i la fundació puntCAT per la preservació de les pàgines web.

El passat 10 de novembre de 2006 la Biblioteca de Catalunya va signar el conveni de cooperació amb la Fundació puntCAT per tal d’incloure els recursos digitals amb domini.CAT al dipòsit Patrimoni Digital de Catalunya (PADICAT). L'acte de signatura va comptar amb la presència de la directora de la BC, Dolors Lamarca, i el president de la Fundació puntCAT, Joan Francesc Gras.

La Fundació puntCAT és una entitat privada sense ànim de lucre que té per objectiu promoure tota mena de d'activitats relacionades amb la creació, gestió i control del registre del nom de domini .CAT i, en general, de la promoció de la llengua i la cultura catalanes a l'àmbit d'Internet i de les noves tecnologies de la informació. És en aquesta línia de treball on conflueixen les estratègies d’ambdues institucions.

El conveni de cooperació permetrà al PADICAT accedir a les pàgines web amb domini .CAT per incloure-les al dipòsit, garantint així la preservació d’aquests continguts que componen la web catalana. En total hi ha registrats uns 18.000 dominis .CAT.

PADICAT és un dipòsit destinat a recollir i preservar tota la producció cultural, científica i de caràcter general catalana produïda en format digital. Compta amb un pressupost aproximat de 800.000 euros i pretén implicar, per mitjà d'acords de cooperació, a 300 institucions representatives de la societat civil catalana.

tornar



Presentació del dipòsit Patrimoni Digital de Catalunya

S'ha presentat el dipòsit Patrimoni Digital de Catalunya (PADICAT) a la Sala de Llevant de la Biblioteca de Catalunya (BC). L'acte ha comptat amb la presència de la directora de la BC, Dolors Lamarca, la secretària de Telecomunicacions i Societat de la Informació del Departament de la Presidència, Marta Continente, el coordinador del projecte PADICAT, Ciro Llueca, el director del CBUC, Lluís Anglada i el director del CESCA, Miquel Huguet.

PADICAT és un dipòsit destinat a recollir i preservar tota la producció cultural, científica i de caràcter general catalana produïda en format digital. Compta amb un pressupost aproximat de 800.000 euros i pretén implicar, per mitjà d'acords de cooperació, a 300 institucions representatives de la societat civil catalana. Com ha comentat el coordinador de PADICAT, Ciro Llueca, "l'objectiu del projecte és garantir als ciutadans l'accés permanent a les pàgines web que es realitzen a Catalunya, o sobre Catalunya".

Un exemple de la utilitat de PADICAT és l'acció de captura focalitzada sobre les eleccions al Parlament de Catalunya. S'han definit una sèrie de recursos digitals (partits polítics amb i sense representació parlamentària, blocs personals, webs dels candidats, mitjans de comunicació, recursos digitals institucionals, fundacions polítiques i societats de recerca, etc.) i la periodicitat de captura necessària per assegurar, en el futur més immediat, poder accedir a les diferents versions d'aquesta producció digital, per Llueca, "essencial per entendre un esdeveniment clau de la societat catalana com han estat aquestes eleccions. Serà com visitar l'hemeroteca digital dels esdeveniments preelectorals, i postelectorals".

El dipòsit, que té previst emmagatzemar 10 TB d'informació un cop consolidat el 2009, es troba disponible en tres idiomes, català, castellà i anglès, i permet realitzar cerques per data, tipus de document i domini, entre d'altres. També dóna accés a l'històric de cada web capturat per veure la seva evolució i ofereix la possibilitat de participar activament proposant webs susceptibles de formar part del Patrimoni Digital de Catalunya.



tornar




PADICAT, la memòria d'internet

Coincidint amb la celebració de la Diada Nacional de Catalunya s'ha posat en operació pública el servidor Patrimoni Digital de Catalunya (PADICAT), un nou dipòsit destinat a recollir i preservar tota la producció cultural, científica i de caràcter general catalana produïda en format digital.

La història de la humanitat és la història del seu llegat. Antigament, les tradicions, el saber i la cultura d'un poble es transmetia de forma oral. En el segle XV, amb l'arribada de la impremta i amb ella l'accés al coneixement escrit, la preservació del patrimoni va restar millor garantida gràcies a un nou format, el paper, que permetia la seva recopilació i preservació a les biblioteques. Avui dia, la Societat de la Informació ha posat al nostre abast una altra forma de transmissió del coneixement, l'entorn digital.

PADICAT va iniciar-se com a projecte l'any 2005 i es preveu que estigui plenament consolidat el 2009, any en què tindrà una capacitat de 30 TB i contindrà fins a 100.000 webs i 50 milions d'arxius i donarà accés en línia a bona part de la seva col·lecció. Aquest dipòsit està impulsat per la Biblioteca de Catalunya i compta amb la col·laboració del CESCA com a soci tecnològic i amb el suport de la Secretaria de Telecomunicacions i Societat de la Informació.

El passat 21 de juliol es van començar a recopilar de manera automatitzada els webs susceptibles de formar part del Patrimoni Digital de Catalunya, essent els primers els de l'Ajuntament de Berga i de Palafrugell, i els dels col·legis professionals d'Aparelladors i Arquitectes Tècnics de Tarragona i de diplomats en Treball Social i Assistents Socials de Catalunya.

També s'han iniciat els primers acords per dipòsit voluntari amb aproximadament 100 institucions que han volgut participar al dipòsit. Els organismes susceptibles de formar-hi part són els anomenats agents de la producció digital (autors, editorials, universitats, col·legis professionals, administració, etc.). La cessió voluntària dels seus webs permet solucionar el problema del seu tractament i difusió, i alhora, contribueix a la creació de la memòria històrica digital de Catalunya.

El Patrimoni digital


Les tecnologies de la informació i la comunicació han facilitat que la documentació cultural i científica, a més de la resta d'informació, es presenti en format digital. Aquest fet ha suposat nombrosos avantatges: agilitat i rapidesa en la producció, facilitat d'accés, difusió arreu del món... però també inconvenients, com ara un difícil control, preservació i garantia d'accés permanent. Des de la dècada del noranta, administracions de diversos països han promogut estratègies per solucionar aquests problemes i assegurar la compilació, el tractament, la preservació i la difusió de la producció bibliogràfica publicada a internet. Dipòsits com PADICAT permeten assegurar aquest accés, alhora que preserven el patrimoni digital del país.

Diversos països, a través de les seves biblioteques nacionals, han iniciat accions per assegurar la pervivència de la seva producció digital, ja que un document que no existeixi en un altre format que no sigui l'electrònic original té difícil la seva preservació. Aquest fet és conseqüència de la dificultat de localització, el gran volum i la baixa permanència dels materials publicats a internet (l'UK Web Archiving Consortium fixa en 44 dies la mitjana de vida d'una pàgina web). A més, l'obsolescència del text legal espanyol en matèria de producció digital i la inexistència, en la llei de propietat intel·lectual del producte digital, d'un dret basat en el principi de còpia per a preservació dificulten encara més aquest objectiu.

Per aquest motiu, avui dia ja existeixen diversos dipòsits digitals nacionals com a garantia d'accés a llarg termini als recursos digitals generats en diferents països. Els primers dipòsits dedicats a arxivar el web nacional han estat el suec Kulturarw3 i l'australià Pandora, mentre que una iniciativa de caràcter més ampli és el dipòsit d'abast internacional Internet Archive.

D'aquestes experiències prèvies s'extreuen tres models de dipòsits digitals nacionals: l'integral o exhaustiu, que persegueix la integració automàtica del web a partir de criteris infraestructurals (lingüístics, domini web, ubicació servidor...); el selectiu, dedicat a compilar el web seguint una política selectiva (una temàtica concreta, un espai geogràfic determinat...), i per últim, i fruit d'una combinació dels dos anteriors existeix el model híbrid, en el que es basa PADICAT, que complementa la captura periòdica del web nacional, en aquest cas el web català, amb accions selectives (acords segons interessos temàtics), ampliant l'abast en alguns casos a determinats esdeveniments d'interès social com ara les eleccions autonòmiques del proper mes de novembre.

De manera més concreta, l'abast temàtic de PADICAT se centra en els webs sota el domini .cat, sota altres dominis (.es, .com, .net, etc.) en llengua catalana, ubicats a servidors de Catalunya o altres webs que no compleixen els requisits anteriors però que estan relacionats temàticament amb Catalunya.


El programari

El procés de funcionament de PADICAT consta de tres parts claus: la captura dels recursos, la seva organització i el seu accés permanent. Per a la captura de recursos es fa servir el capturador Heritrix, que explora la xarxa i emmagatzema els webs d'acord amb uns criteris configurats prèviament. Per realitzar la indexació i com a motor de cerca s'utilitza l'eina Nutchwax, inspirada en el cercador Google. Per últim, la consulta es mostra mitjançant Wera, una interfície per a la visualització dels resultats de les cerques.

El dipòsit està desenvolupat amb programari lliure. Concretament, el capturador Heritrix és el mateix programari que fa servir, des de 1996, l'Internet Archive, cosa que garanteix la seva eficiència per a aquest tipus de dipòsits. A més, la resta d'aplicacions que formen part del dipòsit estan gestionades per la mateixa institució, qui també porta a terme el seu desenvolupament.

D'altra banda, PADICAT s'allotja al clúster d'e-informació d'alta disponibilitat del CESCA, on també es troben els altres dipòsits, TDX, RACO i RECERCAT, en els que el Centre també hi participa.

Per tot això, PADICAT confecciona la bibliografia nacional més enllà dels formats tradicionals i esdevé el protagonista de la futura recerca i de la preservació i transmissió del patrimoni digital de Catalunya, entès com un sistema útil per a la societat i les institucions que la formen.


tornar