La cantidad de información que hay en el mundo es impresionante; por ello, la forma en que se
administra
es muy importante. Recordemos que ya no hablamos sólo de libros o documentos que se resguardan en
bibliotecas o archivos, sino de material digital, cuya gestión debe contemplar los servicios y
funciones
necesarios para mantener, contener y permitir el acceso al paquete completo del medio que se quiere
consultar, es decir, medio y metadatos, así como la información administrativa.
Con el tiempo surgieron también las bases de datos, las cuales permitieron organizar la información
y, a
su vez, aportar un registro estadístico sobre almacenamiento, acceso, resúmenes de contenidos,
formatos y
tamaños.
Debido a lo anterior, es preciso abordar la forma en que se gestiona la información. ¡Comencemos!
Objetivo
Identificar las
características de la administración de contenidos digitales y de las bases de datos, a partir de la
descripción de sus servicios y modelos respectivamente, para la gestión de contenidos digitales.
Administración de la información
De acuerdo con la OAIS (Open Archival Information System), la administración de datos debe
contemplar
distintos servicios y funciones.
En lo que se refiere a la información técnica y de administración, los módulos de administración de
las soluciones ya existentes deben contar con herramientas para conocer el contenido de sus
repositorios; por ejemplo:
DSpace usa herramientas de indexación para extraer índices con información proveniente de los
paquetes API y hacer una cosecha incremental cada cierto tiempo. En Fedora, la información se almacena
conforme a la norma Dublin Core, formando un archivo tipo FOXML, además de soportar búsquedas a texto
completo.
Otras funciones son las siguientes:
Ahora bien, es necesario contar con un plan de preservación, el cual, de acuerdo con la OAIS,
debe
proveer recomendaciones para asegurar que la información almacenada se mantenga accesible a la
comunidad de usuarios designada en el largo plazo, incluso cuando el entorno computacional
original se
haya vuelto obsoleto.
Si el repositorio en cuestión está suscrito a normatividades internacionales, promoverá las
futuras
acciones de preservación. La mayoría de los datos contenidos en el diccionario PREMIS (Biblioteca
Nacional de España, 2015) ya pueden mapearse en diversos esquemas.
Es imprescindible saber cuándo es necesario realizar una acción de preservación; por ejemplo:
Cuando los formatos en los que se resguardan los objetos digitales están por caer en desuso,
los sistemas deben ser capaces de ser notificados y permitir la implementación de acciones de
preservación.
Al realizar una migración de formato, el sistema debe ser capaz de mantener los datos, hasta
que ocurra el siguiente evento.
Otro aspecto importante en la administración de contenidos es la tecnología de monitoreo, la cual se
refiere a que los sistemas de almacenamiento deben seguir las nuevas tendencias tecnológicas
(estándares, plataformas, etc.), para prevenir posibles causas de obsolescencia del sistema; por ello,
los sistemas de almacenamiento deben contar con módulos que informen sobre alertas tecnológicas y
estándares de datos para lograr una estrategia de preservación o migración.
En este sentido, la Biblioteca Nacional de Australia y la Asociación Australiana para Depósitos
Perdurables están desarrollando el Sistema Automatizado de Notificación de Obsolescencia, que busca
vigilar los formatos de archivos en depósitos digitales, a partir de alertas que notifiquen a los
administradores para que tomen acciones necesarias cuando un evento de este tipo se presente.
En los sistemas automatizados que se encargan de la administración de contenidos, las bases de datos
constituyen su núcleo, ya que ahí reside lo más valioso de todo el sistema: la información. Ésta debe
estar organizada y normalizada para ser manipulada a través de un conjunto de programas que darán
acceso en tiempo real a usuarios concurrentes con diferentes necesidades de información.
La complejidad y la robustez de un sistema dependen, en gran medida, de cómo se diseñe su base de
datos, pues es de ella de donde obtienen cualidades elementales, como son la integridad de los datos,
la seguridad, el tiempo de respuesta y la concurrencia.
Base de datos
Una base de datos es un contenedor que permite almacenar la información de forma ordenada con
diferentes propósitos y usos.
Por ejemplo, en una base de datos se puede almacenar información de diferentes departamentos, como
ventas, recursos humanos, inventarios, entre otros. El almacenamiento de la información por sí sola no
tiene un valor, pero si combinamos o relacionamos la información con diferentes departamentos nos
puede dar el valor.
Para realizar un diseño adecuado de una base de datos se debe analizar su diseño conceptual,
lógico-físico, así como la información que contendrá, lo que dará como resultado el uso de ciertos
tipos de datos.
Por medio de especificaciones del usuario, el diseñador de la base tendrá una descripción de la
información a resguardar en el sistema, es decir, debe descubrir el significado de los datos que
manejará, encontrando con esto características en común y las relaciones que guardan entre sí.
Una vez comprendida la naturaleza y el uso que se le dará a los datos, el esquema conceptual
resultante será utilizado para que el diseñador de la base de datos transmita al usuario lo que
ha entendido sobre la información que se utilizará.
Diseño lógico
Consiste en el análisis de los requerimientos del sistema para construir un esquema de la
información a resguardar, utilizando un modelo o esquema específico, como los que se muestran a
continuación.
Acordeón de conceptos
Modelo jerárquico
Su característica es que los datos se organizan en forma de arborescencia jerárquica. El
árbol formado tiene un nodo llamado raíz (sin nodos padres) y uno o varios nodos
padre, que pueden tener varios hijos llamados hojas (nodo final). Su principal
limitación es la incapacidad de limitar la redundancia de datos, al no permitir que un nodo
hoja tenga varios padres. En la siguiente figura podemos ver el modelado de la base de datos
jerárquica de una terminal de autobuses.
Modelo de red
Está formado por colecciones de registros relacionados mediante ligas arbitrarias. Es muy
similar al modelo jerárquico, pero la modificación fundamental es el concepto de
nodo,
pues
aquí se permite que un mismo nodo tenga varios padres, haciendo con esto un mayor número de
arborescencias; por lo que es difícil de administrar una base de datos basada en este modelo.
En la siguiente figura podemos ver el modelado de la base de datos en red de una terminal de
autobuses.
Modelo relacional
La estructura en la que se ordena la información dentro de una base de datos es mediante
tablas y campos. El objeto conceptual llamado tabla permite agrupar la información
por
sus
características básicas, llamadas campos. En la siguiente figura podemos ver el
modelado
de la
base de datos relacional de una terminal de autobuses.
Esquema de tabla
Por ejemplo, para organizar a las personas de una empresa dentro de una base de datos
podríamos estructurar una tabla por empleado, la cual contendría la información de cada
trabajador (nombre, número de seguro social, entre otros), como un identificador único. Cada
elemento recibe el nombre de campo y el conjunto de éstos por cada trabajador recibe
el
nombre
de registro. En el ejemplo de la terminal de autobuses, una tabla puede ser la que se
ve
a
continuación:
Tipo de información
Los tipos de datos que se pueden almacenar son diversos y atienden a las necesidades de
cada base de datos, respecto a la información que se quiere ordenar. Los más comunes son de
tipo numérico y tipo texto.
Conforme han evolucionado las bases de datos se han expandido los tipos de datos que pueden
almacenar. Por mencionar algunos, están los CLOB (character large object),
utilizados para almacenar documentos, y BLOB (binary large object), para almacenar
una imagen o video.
Otro tipo de dato relevante es el XML, un dato jerárquico porque parte de un nodo inicial o
raíz y, a su vez, puede tener “n” niveles y subniveles.
Por otro lado, de acuerdo al tipo de procesamiento que se le dará a la información, se determina el
tipo de base de datos a utilizar:
Base de datos dinámica OLTP (On Line Transaction Processing)
Base de datos estática OLAP (On Line Analytical Processing)
La información se modifica en tiempo real: se insertan, eliminan, modifican y consultan datos
en línea durante la operación del sistema.
Un ejemplo es el sistema de un supermercado, en donde se va registrando cada uno de los
artículos que el cliente está comprando y, a su vez, el sistema va actualizando el inventario.
La información en tiempo real no es afectada, no se insertan, eliminan y tampoco se modifican
datos; sólo se realizan consultas sobre los datos ya existentes para el análisis y toma de
decisiones.
Este tipo de bases de datos es implementado en business intelligence, o inteligencia
de negocios, para mejorar el desempeño de las consultas con grandes volúmenes de información.
La necesidad de implementar un tipo u otro dependerá del giro y necesidades de cada institución. Es
muy importante identificar el tipo de base de datos que se requiere, antes de implementar un manejador
de base de datos, pero ¿qué es esto?
Un sistema manejador de base de datos (SMBD) consiste en una base de datos y un conjunto de programas
para tener acceso y manipulación de los datos. Su objetivo es crear un ambiente en donde sea posible
almacenar y recuperar información de forma eficiente y conveniente. Sus funciones son las siguientes:
Permitir la interacción de la base de datos con el sistema operativo.
Implantación de la seguridad en el acceso a la información resguardada.
Puesta en práctica de la integridad de los datos.
Respaldo y recuperación.
Control de la concurrencia y verificar los privilegios de los usuarios.
En un SMBD es necesario el uso del lenguaje SQL para trabajar sobre la base de datos relacional.
Existe un vasto número de manejadores de bases de datos en el mercado, tanto aplicaciones
propietarias como software libre, cada uno con sus ventajas y limitantes. Algunos sistemas
gestores de
bases de datos son los que se enuncian a continuación.
MS SQL Server
El SMBD de Microsoft cuenta con un entorno de desarrollo flexible que permite a los
desarrolladores elegir el lenguaje de sus aplicaciones para la base de datos, así como
utilizar sus propios tipos y funciones. Se pueden crear servicios web en la capa de base de
datos, convirtiendo a SQL Server en un servidor HTTP. Cuenta con una herramienta de
administración que integra herramientas automatizadas de operaciones recurrentes en
administración de base de datos, para ahorrar tiempo de gestión y mantenimiento capaz de
cambiar atributos con un clic.
Oracle
Corre sobre los principales sistemas operativos, como Windows, Linux y todas las versiones de
Unix. Su administración es sencilla, porque entrega con su motor una herramienta gráfica y
centralizada para realizar toda la administración de todos los componentes Oracle, lo que
facilita la administración de usuarios, roles y privilegios.
Una ventaja es que se puede adquirir primero una versión con características básicas y,
posteriormente, dadas las necesidades de la base de datos, puedan crecer los sistemas junto
con el manejador, lo que repercute favorablemente en su mantenimiento, crecimiento y
actualización.
MySQL
Este manejador de bases quizá sea el más usado en el mundo del software libre por su
gran rapidez y facilidad de uso; esto se debe a que existe una infinidad de librerías y otras
herramientas que permiten su uso a través de una gran cantidad de lenguajes de programación,
además de su fácil instalación y configuración. Ya que en las aplicaciones web existe una baja
concurrencia en la modificación de datos y gran afluencia en su lectura, este SMBD es
excelente para páginas dinámicas ligadas a bases de datos.
Se puede ejecutar bajo múltiples sistemas operativos, como OS/2, SunOS, Solaris, Windows,
Linux, entre otros.
PostgreSQL
Es confiable, rápido, escalable, de libre distribución, sin límite de usuarios. Se puede
montar en varias plataformas (entre ellas Windows y Linux). Con este sistema se pueden lograr
bases de tamaño ilimitado. Soporta operadores, funciones, métodos de acceso y tipos de datos
definidos por el usuario e integridad referencial, que es utilizada para garantizar la validez
de los datos de la DB. Soporta lenguajes procedurales internos, incluyendo un lenguaje nativo
denominado PL/pgSQL, que es comparable al lenguaje procedural de Oracle, PL/SQL.
Por último, hay que considerar que cuando se crea una base de datos y se inicia su operación, el
volumen de la información es mínimo y el desempeño de la aplicación y base de datos es óptimo; sin
embargo, conforme pasa el tiempo, el volumen de información incrementa y en consecuencia surgen los
siguientes problemas:
Problemas de espacio en el disco.
Incrementos de costo en almacenamiento y procesamiento.
Problemas de desempeño en las consultas.
Fallas en el aplicativo, afectando la disponibilidad de los datos.
Problemas con la base de datos y la pérdida de información.
Actividad. Gestión de contenidos digitales
Una vez que el sistema de información ha recibido y almacenado objetos digitales, así como su
documentación relacionada, es indispensable pensar en su administración y posteriormente en la
creación de la base de datos. Para lograrlo es necesario conocer qué engloba cada proceso.
Actividad. Gestión de contenidos digitales
Autoevaluación. Base de datos
Una base de datos reúne varios elementos para su diseño y correcto funcionamiento; tal es el caso del
lenguaje que utiliza, su sistema manejador de datos o el tipo de base de datos que es. ¿Logras
identificarlos? A continuación, lo averiguarás.
Autoevaluación. Base de datos
Fuentes de información
Básicas
Bibliografía
Batini, C., Ceri, S. y Navathe, S. B. (1994). Diseño conceptual de bases de datos: un enfoque de
entidades interrelacionadas. Addison Wesley Iberoamericana.
Bradley, K. (2007). Hacia un sistema de almacenamiento y preservación en código abierto.
Conaculta/Fonoteca Nacional.
Date, C. J. (1993). Introducción a los sistemas de bases de datos (vol. 1, 5.ª ed.). Addison
Wesley Iberoamericana.
Digital Library Federation (DLF). (2002). Benchmark for faithful digital reproductions of
monographs and serials. Autor.
Documentos electrónicos
Anguiano, J. D. (2014). Características y tipos de bases de datos. https://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
Bacula. (2018, octubre 29). What is Bacula? https://www.bacula.org/what-is-bacula/
Biblioteca Nacional de España. (2015). Diccionario de datos PREMIS de Metadatos de Preservación
Versión 2.0 [Versión electrónica]. http://www.bne.es/media/Publicaciones/PublicacionesTecnicas/PREMIS_es.pdf
Blázquez, M. (2014, 20 de marzo). La migración de datos. Exportación e importación. http://ccdoc-automatizacion.blogspot.mx/2014/03/la-migracion-de-datos-exportacion-e.html
DSpace. (s. f.). Cómo actualizar o importar metadata Dublin Core por bloques (Excel, CSV).
https://confluence.tavara.pe/DSPACEDOC5x/tutoriales-adicionales/como-actualizar-o-importar-metadata-dublin-core-por-bloques-excel-csv
Pearce, R. (2005). A glossary of archival and records terminology [Versión electrónica]. The
Society of American Archivists. http://files.archivists.org/pubs/free/SAA-Glossary-2005.pdf
Rodríguez, P. O. (2016). La preservación digital sonora [Versión electrónica]. Investigación
Bibliotecológica: Archivonomía, Bibliotecología e Información, (68). IIBI-UNAM. http://rev-ib.unam.mx/ib/index.php/ib/article/view/54601/48544
Sánchez, B. (s. f.). Curso: enfoque de sistemas (Programa de Posgrado en Ingeniería, UNAM.
Departamento de Ingeniería de Sistemas). http://slideplayer.es/slide/26344/
Universidad de Cornell. (2000-2003). Llevando la teoría a la práctica. Tutorial de digitalización
de imágenes. Biblioteca de la Universidad de Cornell-Departamento de Investigación.
http://preservationtutorial.library.cornell.edu/tutorial-spanish/tutorial_Spanish.pdf
Voutssas, J. (2009). Factores tecnológicos, legales y documentales de la preservación documental
digital [Versión electrónica]. Investigación Bibliotecológica, Archivonomía, Bibliotecología e
Información, 23(49). IIBI-UNAM. http://dx.doi.org/10.22201/iibi.0187358xp.2009.49.21391
Soler, J. (2008). La preservación de los documentos electrónicos. UOC.
Cómo citar
Abad, D. C. (2024). Administración de Contenidos Digitales y de Bases de Datos. Unidades de Apoyo
para el Aprendizaje. CUAIEED/Escuela Nacional de Estudios Superiores, Morelia-UNAM. (Vínculo)