FAQs

 

Preguntas más frecuentes


¿Qué es PADICAT?

Es una iniciativa de la Biblioteca de Catalunya que consiste en capturar, procesar y dar acceso permanente a toda la producción cultural, científica y de carácter general catalana producida en formato digital. En definitiva, el objetivo es archivar la web catalana.

La explicación completa y detallada sobre la finalidad, los objetivos y el funcionamiento se encuentra en el apartado ¿Qué es PADICAT?.

volver
--------------------------------------------------------------------------------

 

¿Qué puedo hacer para que mi web aparezca en PADICAT?

PADICAT tiene diferentes vías de captura de webs: la captura sistemática de webs bajo dominio .cat, la captura de webs de las instituciones con las que la Biblioteca de Catalunya ha firmado un convenio de colaboración, la captura de webs que se consideran pertinentes a partir de la búsqueda por navegación, y la captura de las webs que (comprobada su pertinencia) se incorporan a la colección a través de las recomendaciones de los usuarios.

Si quiere que su web pase a formar parte de la colección de PADICAT, puede enviar sus recomendaciones rellenando un breve formulario en el apartado Propón un sitio web.

A partir de que una web entra a formar parte del repositorio, se captura un mínimo de dos veces al año, pudiéndose incrementar la frecuencia en un futuro.

El lapso de tiempo entre la propuesta y sea visible en nuestra colección, puede oscilar entre los 6 y los 12 meses.

 

volver
--------------------------------------------------------------------------------

 

¿Qué puedo hacer para que mi web NO aparezca en PADICAT?

Se puede evitar formar parte de la colección con la simple inclusión de un fichero robots.txt que impedirá que la web sea visitada por nuestro robot.

El robot que utilizamos se identifica como PADICAT, y sigue el Standard for Robot Exclusion (SRE), lo cual significa que no entra en ninguna web o parte componente de un sitio web que esté protegido con este método, a menos que se haya pactado y autorizado previamente entre la institución y la Biblioteca de Catalunya.

 

volver
--------------------------------------------------------------------------------

 

¿Por qué cuando visito alguna de las webs capturadas, no puedo ver algunas imágenes ni acceder a algunos enlaces?

El propósito de PADICAT es preservar las webs tal y como eran en el momento de la captura. Así mismo, quiere ofrecer a los usuarios la posibilidad de navegar por las webs capturadas de la misma manera que si lo hicieran a través de la web real.

No obstante, de manera frecuente hay elementos que dificultan la visualización óptima de estas webs así como la navegación entre los hiperenlaces. 3 consejos básicos para evitar algunas anomalías en la visualización de las webs capturadas son:


No utilizar direcciones que incluyan la URL a las páginas del mismo web. Así, en vez de:

http://www.ejemplo.cat/imagenes/logotipo.jpg

o bien,

http://www.ejemplo.cat/menu.html,

será más aconsejable:

/imagenes/logotipo.jpg

y

/menu.html


No utilizar la etiqueta (tag) de HTML refresh para redirigir a otra página. Ejemplo:

< html >
< head >
....
< meta http-equiv="refresh" content="2;url=http://exemple.cat" >
....
< /head >
....
< /html >


No incluir pedazos de páginas externas, ya sean imágenes, scripts u otros.



volver
--------------------------------------------------------------------------------

Intento visitar una página web capturada, pero no se acaba de cargar. ¿Hay alguna solución?

En ocasiones el sitio web capturado no acaba de cargarse. A veces ocurre porque el navegador (Firefox, Internet Explorer, etc.) tiene activada la pestaña de habilitación de JavaScript. Desactivando esta opción del navegador se podrán visualizar la mayoría de estas capturas.

Instrucciones para activar / desactivar esta opción en el navegador:

http://support.google.com/adsense/bin/answer.py?hl=es&answer=12654

 

volver

--------------------------------------------------------------------------------

¿Qué captura PADICAT de cada web?

PADICAT captura solo las webs y partes de las webs que son abiertas y accesibles desde Internet. Aparte de respetar las limitaciones que los propietarios de una web puedan articular (ver ¿Qué puedo hacer para que mi web NO aparezca en PADICAT?), PADICAT no entra ni captura ninguna página web que requiera un password, formulario, etc., como puedan ser, por ejemplo, las áreas reservadas a los colegiados de una asociación profesional, o a los suscriptores de una publicación, etc.


volver
--------------------------------------------------------------------------------

 

Recomendé mi web para formar parte de la colección y no la encuentro en la base de datos ¿Por qué?

PADICAT cuenta, actualmente, con 4 servidores ProLiant DL360 G4p trabajando al 100% del rendimiento a tiempo completo. Aún así, la gran cantidad de recursos a capturar, hace que se formen colas de espera, que pueden ralentizar la captura de los recursos propuestos.

Como se explica en ¿Qué puedo hacer para que mi web aparezca en PADICAT?, el plazo entre que una web se propone hasta que aparece en la colección, puede oscilar entre los 6 y los 12 meses.


volver
--------------------------------------------------------------------------------

 

¿Qué volumen de datos y capacidad tiene el repositorio PADICAT?


El volumen de datos almacenados en PADICAT se puede consultar a través del apartado Qué tenemos de nuestra web, cuyas cifras se actualizan periódicamente.



volver
--------------------------------------------------------------------------------

 

¿PADICAT puede capturar y mostrar correctamente todo tipo de webs?

A causa de irregularidades en el software de visualización de archivos y a inconsistencias durante el archivo de estas webs (p.e. exclusiones de robots.txt), algunas webs pueden no mostrarse correctamente (enlaces externos, formularios y cajas de búsqueda, imágenes caídas) o redirigirse a la versión actual de la web.

Las webs que usan estándares de accesibilidad y lenguaje html, no han de tener problemas de captura ni de visualización una vez archivadas en PADICAT. Aunque, por otro lado, hay ciertos elementos que pueden dificultar tanto la captura de los recursos como, sobretodo, la posterior visualización dentro de la colección. Algunas recomendaciones:

Para la captura de la página:

  • robots.txt; PADICAT, por norma general, respeta las webs que utilizan elementos de exclusión.

Para la navegación y visualización de la versión capturada:

Enlaces:

  • enlaces: imágenes, scripts, etc. de otras webs externas. Si estos elementos pertenecen a una web externa, no se mostraran correctamente una vez la web sea capturada por PADICAT. Se recomienda almacenar estos logotipos en el directorio de imágenes de vuestro servidor y utilizar paths relativos en vuestra página.
  • utilizar paths relativos y/o absolutos para construir el enlace en vez de utilizar URLs completas.
  • no utilizar scripts para construir dinámicamente los enlaces.
  • evitar la incrustación de objetos flash donde los enlaces son absolutos.
  • evitar utilizar la etiqueta base href.
  • evitar enlaces a URLs que redireccionan a otra página.

Lenguajes interpretados:

  • evitar la utilización de variables locales en el servidor que nos permiten variar el aspecto de la página que estamos visualizando, como por ejemplo, los cambios de idioma y los cambios dinámicos de menús.

Codificación:

  • PADICAT utiliza la codificación UTF-8 para la visualización de los caracteres. Pueden producirse errores en la visualización de las webs (p.e.: diacríticos, et al.) que utilicen una codificación diferente (p.e.: Latin-1), y esta no esté especificada en el sitio web original. Así pues, se recomienda especificar la codificación utilizada en la web.

Recomendaciones de accesibilidad:

  • se recomienda evitar la utilización de marcos, ya que puede dificultar el proceso de indexación de la página, y, por tanto, la posterior recuperación de esta página en la búsqueda por texto.
  • se recomienda ofrecer alternativas de acceso a la información en aquellas páginas que utilicen código JavaScript, ya que hay dispositivos que no soportan este código o tienen la opción del navegador desactivada.

Otras recomendaciones para los webmasters:

  • utilizar págines con poco peso.
  • no cargar muchas imágenes en la misma página.
  • seguir las normas de accesibilidad (marcos, codificación, etc.).
  • no utilizar espacios en los nombres de los archivos.


volver
--------------------------------------------------------------------------------

 

¿El idioma en que realizo una búsqueda influye en los resultados de esta?

Los índices generados con el software -a partir de las páginas web capturadas- y que se utilizan para la búsqueda de palabras clave son únicos; es decir, son independientes del idioma que el usuario escoge de la interfaz de consulta de PADICAT, y dependen únicamente del idioma en que está escrita la web capturada.

Por tanto, los términos de búsqueda deberían ser independientes del idioma con el que el usuario está navegando por PADICAT. Aún así, se obtendrá un mayor número de resultados si los términos introducidos son en catalán.


volver
--------------------------------------------------------------------------------

 

Ayuda a la búsqueda

Consejos para la búsqueda

  • Para buscar por texto libre, utilice la búsqueda por palabra
  • Para buscar un dominio concreto, utilice la búsqueda por URL

Consejos para la búsqueda avanzada

  • Introduzca uno o más términos a buscar
  • Si procede, especifique el dominio sobre el que quiere realizar la búsqueda
  • Para limitar los resultados a un período de tiempo especifique la fecha de inicio y fin
  • Para seleccionar un formato de archivo para los resultados especifique un tipo
  • Para buscar dentro de un evento seleccione la colección correspondiente; si quiere buscar en todos los recursos seleccione “Todas”

Búsquedas combinadas y/o expertas

  • La palabra puede ser completa o truncada (p.e.: ayu para encontrar ayuntamiento y ayuda)
  • Si introduce uno o más términos a buscar, el sistema recuperará los recursos que contengan todos los términos de búsqueda introducidos
  • Utilice el operador AND para recuperar recursos que contengan todas las palabras introducidas (p.e.: vic AND judíos)
  • Utilice el operador OR para recuperar recursos que contengan alguna de las palabras introducidas (p.e.: educación OR formación)
  • Utilice las comillas ("") para buscar una frase exacta (p.e.: "roda de ter")

 

volver
--------------------------------------------------------------------------------

 

¿Qué contiene PADICAT?
 

En el apartado Webs capturados se puede consultar el número de webs que contiene PADICAT y el número de capturas realizadas en diferentes fechas de estas webs. También se indica cual es el número de ficheros que componen todas las capturas que se encuentran en el repositorio. Estos ficheros son principalmente páginas web, aproximadamente un 70% de html, un 10% de imágenes, 2% de PDF, etc. (para conocer los datos exactos de los tipos de archivos que componen las webs de PADICAT consultar la nota de prensa).
Por último, se muestra el espacio ocupado, que  incluye el tamaño de los archivos comprimidos ARC que almacenan las capturas y la de los índices.

Estos datos se actualizan automáticamente cuando se incorporan nuevos recursos a la colección.


volver
--------------------------------------------------------------------------------

 


Dudas y sugerencias

Si tiene alguna duda que no haya quedado resuelta o alguna sugerencia para realizarnos, lo puede hacer a través del siguiente formulario.


volver