12 mar. 2010

BDU 2: un importante avance en la democratización en el acceso a la información

Luego de un arduo año de trabajo, el proyecto SIU-Bibliotecas del Consorcio SIU puso en marcha la BDU2, un nuevo desarrollo que significa un importante avance en el camino que comenzamos a transitar con la Base de Datos Unificada (BDU). La BDU2, a diferencia de su predecesora, se ocupa de “cosechar” los recursos disponibles en texto completo en los repositorios institucionales o bibliotecas digitales de universidades y otras instituciones de Argentina, y ponerlos a disposición de los usuarios.
En esta nota conversamos con Isabel Piñeiro, Coordinadora del proyecto, y Emiliano Marmonti, informático responsable del desarrollo de la BDU2, quienes nos contaron, en los orígenes de esta iniciativa, qué es el harvesting, qué ventajas genera este nuevo desarrollo y qué se espera del futuro del mismo.


InfoSIU: ¿Cómo surge la BDU2?
Isabel Piñeiro: La BDU2 parte de una iniciativa de nuestro equipo luego de realizar un análisis de la realidad actual, tanto de los repositorios digitales como del futuro de las bibliotecas universitarias y la producción científica hoy.
No nos olvidemos que el SIU fue uno de los impulsores del tema de las bibliotecas digitales en Argentina, que junto con la UNESCO se organizaron cursos sobre el tema y se impulsó la creación de bibliotecas digitales en las universidades. Por eso, cuando comenzaron a surgir estas bibliotecas, que no son muchas, consideramos que para darle continuidad a nuestro proyecto de la BDU era necesario aggiornarla para que se puedan incluir también objetos digitales.
Entonces, la BDU2 tiene como antecedente a la BDU. Digo antecedente porque después de que las bibliotecas subieron sus bases a Internet y surgieron las bibliotecas digitales o repositorios institucionales, surge este proyecto que, por un lado muestra el registro referencial de un documento y por otro permite acceder al documento en texto completo.
Esto es posible porque las instituciones deciden mostrar su producción académica, científica, cultural, y comienzan a poner en la Web los archivos respetando el estándar de metadatos, lo que permite a una persona ver la referencia y a su vez brinda acceso al texto completo.
InfoSIU: ¿Cómo era el proceso antes de la BDU y cuáles son las principales ventajas que introdujo?
Isabel Piñeiro: En primer lugar, la ventaja de la BDU respecto de las bases de datos de las universidades es que en la BDU está todo junto. Por ejemplo, si se hace una consulta a través de los buscadores de la BDU, aparece en qué bibliotecas está el libro que se busca. Entonces si una persona busca un material en una biblioteca y éste no está, se hace una consulta en la BDU y se tramita el préstamo interbibliotecario con esa institución.
Antes, había que acceder a la base de datos de cada biblioteca universitaria. Con el tiempo cada universidad fue armando sus sistemas y con esta iniciativa del SIU lo que hicimos fue unir en una sola base todo lo que estaba disperso. Se facilitó mucho el trabajo.
Ahora bien, la BDU 2 ya no es una base referencial que sólo permite ver dónde está el texto, sino que además posibilita acceder al texto completo digitalizado. Estos textos deben ser de acceso abierto y respetar el protocolo que nos permite hacer este barrido, esta cosecha cuyo término técnico es harvesting.
La “cosecha” se realiza sobre los repositorios institucionales académicos cuyos metadatos cumplan con el estándar internacional que se llama OAI-PMH (Open Archive Initiative - Protocol for Metadata Harvesting). (Ver nota InfoSIU N° 39)
InfoSIU: ¿Existen antecedentes de esta iniciativa en el país o Latinoamérica?
Isabel Piñeiro: Hay antecedentes en Brasil, el IBICT, el Instituto Brasilero de Información en Ciencia y Tecnología está haciendo algo parecido, también en Chile hay un proyecto en marcha con similares características.
Además, hay un proyecto a nivel Latinoamérica que está impulsando una organización llamada CLARA (Cooperación Latinoamericana de Redes Avanzadas), cuyo objetivo es hacer un harvesting latinoamericano, para lo cual es importante que varios países estén avanzando en iniciativas de este tipo.
InfoSIU: ¿Qué instituciones pueden sumar sus repositorios a la BDU2?
Isabel Piñeiro: Cualquier institución que cumpla con el estándar internacional puede integrar la BDU2. Nosotros estamos haciendo harvesting sobre repositorios institucionales de Argentina, no sólo con los repositorios de las universidades sino también con otras instituciones como por ejemplo SCIELO Argentina, CLACSO, que son instituciones que tienen producción científica y adhieren al Open Access.
Emiliano Marmonti: En el mundo hay grandes cosechadores internacionales, tal como OAISter, actualmente administrado por OCLC, e iniciativas que hacen un ranking de los mejores repositorios institucionales. Esto ayuda a que los repositorios sean encontrados en la web por la mayor cantidad de personas posible.
InfoSIU: ¿Es necesario realizar algún tipo de trámite para formar parte?
Isabel Piñeiro: No, simplemente contar con un repositorio institucional y respetar los estándares establecidos al catalogar. Nosotros, por una cuestión de gentileza, les avisamos a las instituciones que las incluimos en la BDU2, pero si cumplen con el estándar aparecen directamente.
InfoSIU: ¿Qué tipo de tecnología utilizan?
Emiliano Marmonti: Se han utilizado tecnologías libres y se ha innovado en lo referente al motor de búsquedas, utilizando una tecnología ampliamente usada por los nuevos portales de búsqueda de recursos de información llamada Apache SolR.
La misma, además de poseer muy buenos tiempos de respuesta ante las consultas, nos ha permitido introducir el concepto de ranking para los resultados, ordenarlos por diferentes criterios y agregar una funcionalidad que creemos muy importante al día de hoy, que es la de clasificar los resultados por diferentes criterios. Al aparecer los resultados de una consulta y a su vez la clasificación de los mismos por año, por tipo de material, por autor y por palabras clave, el usuario puede recorrer mucho mas dinámicamente los resultados y así tender a que la interfaz de recuperación se transforme en una herramienta de descubrimiento de conocimiento, en esta línea es que seguiremos perfeccionando el uso de las tecnologías para mejorar la experiencia del usuario usando BDU y BDU2.
InfoSIU: Desde que se lanzó la BDU2, ¿saben cuántas personas realizaron búsquedas?
Emiliano Marmonti: Por un lado, estamos contabilizando la cantidad de sesiones iniciadas y búsquedas realizadas sobre BDU2, la cual contabiliza alrededor de 7.000 y por el otro, la cantidad de objetos digitales a los cuales BDU2 ha servido como puente de acceso. En este último caso se ha llevado a cabo la conexión con 460 objetos digitales (texto completo, material multimedial y otros) desde su puesta en marcha, a fines del mes de Noviembre de 2009.
InfoSIU: ¿Cuál es el estándar de catalogación en la BDU2?
Isabel Piñeiro: El estándar que se maneja a nivel mundial es el Dublin Core, es un sistema de catalogación electrónico constituido por 15 campos descriptivos básicos llamados metadatos que deben respetar los objetos digitales. El problema es que estos 15 metadatos muchas veces quedan chicos a la hora de describir determinados objetos digitales como audio, video, texto o imágenes. Entonces se comenzaron a agregar atributos ampliando el Dublin Core, se hace un desglose de esos metadatos básicos para poder incluir otra información, pensando siempre en las necesidades de los usuarios finales. Es decir, el objetivo es aumentar la información básica para que el usuario enriquezca su búsqueda.

InfoSIU:¿Cuál es la diferencia entre buscar en la BDU2 y en un buscador como Google?
Isabel Piñeiro: La riqueza de buscar en la BDU2 es que asegura información de calidad. Aunque sólo traiga la información contenida en los repositorios institucionales, la búsqueda es más específica que si se hiciera por Google. Es una selección, porque a través de la BDU2 se accede al material científico que se produce en nuestras universidades.
Otra diferencia que existe al acceder a la información a través de repositorios institucionales es que permite conectarse con el docente o investigador que realizó un trabajo determinado, porque dentro de los metadatos que se solicitan, por lo general, se incorporan los datos de contacto del autor. Esto lleva a que se generen redes sociales de determinadas áreas del conocimiento que favorecen a todo el mundo. Por un lado, permite que no se repitan investigaciones sobre temas en los que ya se avanzó y, por otra parte, se enriquecen mucho las personas que están iniciándose en la investigación en una determinada área a través del intercambio con otros investigadores.
Lo destacable de esta iniciativa es que, siguiendo con la filosofía del Open Access, se promueve que sea visible el conocimiento, que haya una devolución hacia la comunidad de lo que produce la universidad.
Antes, este intercambio se producía en los congresos y a través de revistas especializadas, pero sólo se enteraban los que se manejaban en éstos ámbitos y el acceso a las revistas estaba restringido a quienes podían publicar en ellas o suscribirse a las mismas. Esto hacía que el acceso al conocimiento fuera mucho mas acotado ya que sólo tenía acceso la elite científica.
Por ello, con este tipo de iniciativas se colabora profundamente con la democratización del acceso a la información y al conocimiento, porque ahora con sólo tener una computadora conectada a Internet se accede a muchos más recursos que en el pasado.
InfoSIU: ¿Cuáles son los próximos pasos? ¿Qué esperan de la BDU2?
Isabel Piñeiro: Lo que esperamos es que cada vez haya más instituciones que generen sus repositorios institucionales, y que los que ya están funcionando aumenten sus objetos digitales. Sabemos que no es un proceso rápido ni sencillo, es un trabajo interdisciplinario que involucra a bibliotecarios, catalogadores, informáticos y que lleva mucho tiempo de trabajo en conjunto.
Emiliano Marmonti: Gracias a un acuerdo alcanzado con la Biblioteca Nacional de Maestros (BNM), BDU2 se ha convertido en un agregador de contenido. Esto significa que en los casos de instituciones que ya poseen colecciones digitales, pero se encuentran en la transición e implementación de un repositorio institucional, la BDU2 les facilita la publicación de sus colecciones digitales bajo el estándar OAI-PMH. Ahora la Biblioteca Digital de la BNM, es proveedor de contenidos y ya es listada internacionalmente como uno de estos proveedores. De esta forma, se apunta a maximizar la difusión de su colección hacia otros cosechadores (tales como Universia, OAISter, se da de alta en los portales tales como DOAR y ROAR) además de resultar agregados a la BDU2.
Cabe destacar que la BNM ha publicado valiosísimas colecciones de libros digitalizados de Leopoldo Lugones, libros de lectura desde 1880 y legislación educativa nacional desde 1930 hasta la fecha. Esto significa que ponen al alcance de la población en general un patrimonio histórico cultural único, y por otra parte se preserva ese material que no necesita ser manipulado para su consulta.
Isabel Piñeiro: También seguiremos avanzando en un trabajo ligado a la BDU tradicional para facilitar la búsqueda del usuario y la visibilidad clara y rápida de los datos referenciales del material impreso y los objetos digitales en textos completos.
Lo que estamos haciendo en este momento es posibilitar que al usuario, que puede ser un alumno, un investigador, un docente, un bibliotecario, al realizar una consulta en la BDU, le aparezca el resultado referencial de su búsqueda y también un cartel de aviso que dice que sobre este tema que está buscando, o sobre el autor, o el título hay material en bibliotecas digitales al que pueden acceder con un solo click.
Emiliano Marmonti: En relación a lo tecnológico, seguiremos explorando las facilidades que nos proveen los productos usados, continuaremos estudiando las variables apropiadas para el rankeo de los resultados y perfeccionaremos el algoritmo de cosecha de metadatos de los distintos repositorios, con la finalidad de alcanzar un portal de acceso a los recursos de información realmente útil y eficaz desde el punto de vista del usuario final.
La idea es que la BDU y la BDU2 se fundan en un solo producto. A futuro aparecerán los dos tipos de datos en la misma pantalla, haciendo que el proceso sea totalmente transparente para el usuario.

Para acceder a la BDU2: http://bdu.siu.edu.ar/bdu2.html
Para conocer los repositorios institucionales sobre los cuales la BDU2 realiza harvesting http://bdu.siu.edu.ar/cgi-bin/bdu2/reporpt.pl