Història

PADICAT va néixer el 2005 seguint la tendència d’altres biblioteques nacionals en la creació d’arxius web.

Hi ha nombrosos arxius web en funcionament. Els més coneguts són també els que van fer les primeres passes l’any 1996: el suec Kulturarw3; l’australià Pandora, i un conegut repositori d’abast internacional, l’Internet Archive. Quinze anys més tard, podem comptar fins a cinquanta projectes en diverses fases d’implementació, tot i que només un terç d’aquesta xifra són accions consolidades.

L’anàlisi d’aquestes experiències mostra dos models bàsics de polítiques de col·lecció amb una tendència generalitzada cap a un model híbrid. El primer és el model integral o exhaustiu (majoritari, i característic dels països escandinaus en els inicis), que persegueix la integració automàtica de la web a partir de determinats criteris infraestructurals (segons el domini de les pàgines web, segons la ubicació del servidor, etc.). El segon model és el selectiu (assimilat per Austràlia, el Regne Unit o el Japó, entre altres comunitats), dirigit a compilar la web basant-se en una política selectiva (un repertori de recursos digitals corresponents a les diverses àrees del coneixement per a un espai geogràfic concret). Aquests dos models clàssics han donat pas —en el que és a partir de l’experiència inicial danesa, una tendència generalitzada arreu del món— a models híbrids, que complementen la captura periòdica d’un domini geogràfic sencer, amb accions selectives, i amplien aquesta cobertura a diversos esdeveniments d’interès social (eleccions, competicions esportives, guardons culturals) o successos informatius que generen activitat intensa a les xarxes (atemptats, catàstrofes naturals, pandèmies, episodis de la crisi econòmica, debats socials).

Lamentablement, el nombre de dipòsits que permet accedir lliurement a les seves col·leccions és molt limitat, bé per evitar conflictes amb la vulneració dels drets de propietat intel·lectual dels recursos capturats sense autorització expressa, bé perquè les interfícies de recuperació de la informació dipositada no han estat prou desenvolupades.

En la major part dels casos han estat impulsors d’aquests projectes els organismes nacionals de biblioteques i arxius, a més de diverses entitats públiques i privades d’abast nacional o internacional. Representants d’aquests organismes s’agrupen en l’International Internet Preservation Consortium (IIPC) amb la missió de compilar i preservar la informació i el coneixement d’Internet, donar-hi accessibilitat, per a futures generacions de tot el món, i promoure l’intercanvi global i les relacions internacionals.

A Espanya, la Biblioteca de Catalunya va impulsar el projecte PADICAT (Patrimoni Digital de Catalunya) l’any 2005. El 2007, el Govern basc i Eusko Jaurlaritzaren Informatika Elkartea (EJIE, Societat Informàtica del Govern Basc) van crear Ondarenet, l’arxiu electrònic del patrimoni digital basc. Des del 2009, la Biblioteca Nacional de España (BNE) encarrega captures periòdiques del domini .es a l’Internet Archive.

Malgrat la imperfecció dels sistemes informàtics que serveixen a les polítiques nacionals de preservació del patrimoni digital en la xarxa, l’arxiu d’Internet és actualment una realitat arreu del món tecnològicament desenvolupat.

El juny de 2005 la Biblioteca de Catalunya va iniciar la fase preliminar, de planificació, en la qual es va realitzar l'anàlisi dels projectes i recursos existents, els agents implicats en la producció de pàgines web de Catalunya i els aspectes legals que condicionen les pràctiques que es volen dur a terme.

En base a uns paràmetres definits per la BC, el 21 de juliol de 2006 es van començar a recopilar de manera automatitzada els webs susceptibles de formar part del patrimoni digital de Catalunya, essent els primers els de l'Ajuntament de Berga i de Palafrugell, i els dels col·legis professionals d'Aparelladors i Arquitectes Tècnics de Tarragona i de diplomats en Treball Social i Assistents Socials de Catalunya. L'11 de setembre de 2006, coincidint amb la celebració de la Diada Nacional de Catalunya, el portal web de PADICAT es va obrir al públic, amb una trentena de webs emmagatzemats.

El període 2006-08 representa la fase de producció, de pla pilot del projecte, i la fase d'explotació de PADICAT: la captura sistemàtica de les pàgines web de Catalunya. 

El període 2009-2011 ha permès la BC comptar amb un escenari òptim en el qual aquest sistema, que és pioner a Espanya i de referència a Europa, funciona a ple rendiment. Paral·lelament, s’han tancat acords de cooperació amb 450 institucions de tot tipus, i s’ha garantit l’accés en obert, en línia, a tota la col·lecció.

L’11 de setembre de 2011 s’ha inaugurat una nova versió del portal web d’accés als continguts dipositats al PADICAT: 200.000 captures de 45.000 pàgines web, que signifiquen uns 300 milions de fitxers i 10 Terabytes de volum.

 

Més informació sobre l’evolució del PADICAT:

Ciro Llueca; Daniel Cócera; Natalia Torres; Gerard Suades; Gerard de la Vega (2011). “El PADICAT: l’experiència catalana en l’arxiu d’Internet”. Ligall, 31. http://eprints.rclis.org/bitstream/10760/16246/1/llueca_lligall_31_2010_padicat.pdf

Ciro Llueca; Daniel Cócera (2008). "PADICAT: realitat i reptes de 3 anys d'arxiu web de Catalunya". 11es Jornades Catalanes d'Informació i Documentació. Barcelona: COBDC. http://eprints.rclis.org/archive/00013562/01/llueca_padicat_jornades_2008.pdf

Ciro Llueca (2006). "El projecte PADICAT (Patrimoni Digital de Catalunya) de la Biblioteca de Catalunya". 10es Jornades Catalanes d'Informació i Documentació. Barcelona: COBDC. http://eprints.rclis.org/archive/00006434/01/llueca_padicat.pdf

Biblioteca de Catalunya (2005). Memòria del plantejament del projecte PADICAT (Patrimoni Digital de Catalunya). Barcelona: Biblioteca de Catalunya. http://www.recercat.net/handle/2072/1757