Enlaces a sitios institucionales

Administración de Contenidos Digitales y de Bases de Datos

Unidad de Apoyo para el Aprendizaje

Iniciar

Introducción

La cantidad de información que hay en el mundo es impresionante; por ello, la forma en que se administra es muy importante. Recordemos que ya no hablamos sólo de libros o documentos que se resguardan en bibliotecas o archivos, sino de material digital, cuya gestión debe contemplar los servicios y funciones necesarios para mantener, contener y permitir el acceso al paquete completo del medio que se quiere consultar, es decir, medio y metadatos, así como la información administrativa.

Con el tiempo surgieron también las bases de datos, las cuales permitieron organizar la información y, a su vez, aportar un registro estadístico sobre almacenamiento, acceso, resúmenes de contenidos, formatos y tamaños.

Sistema de información con acceso a base de datos

Debido a lo anterior, es preciso abordar la forma en que se gestiona la información. ¡Comencemos!

Objetivo

Identificar las características de la administración de contenidos digitales y de las bases de datos, a partir de la descripción de sus servicios y modelos respectivamente, para la gestión de contenidos digitales.

Administración de la información

De acuerdo con la OAIS (Open Archival Information System), la administración de datos debe contemplar distintos servicios y funciones.

En lo que se refiere a la información técnica y de administración, los módulos de administración de las soluciones ya existentes deben contar con herramientas para conocer el contenido de sus repositorios; por ejemplo:

DSpace usa herramientas de indexación para extraer índices con información proveniente de los paquetes API y hacer una cosecha incremental cada cierto tiempo. En Fedora, la información se almacena conforme a la norma Dublin Core, formando un archivo tipo FOXML, además de soportar búsquedas a texto completo.

Otras funciones son las siguientes:

Ahora bien, es necesario contar con un plan de preservación, el cual, de acuerdo con la OAIS, debe proveer recomendaciones para asegurar que la información almacenada se mantenga accesible a la comunidad de usuarios designada en el largo plazo, incluso cuando el entorno computacional original se haya vuelto obsoleto.

Si el repositorio en cuestión está suscrito a normatividades internacionales, promoverá las futuras acciones de preservación. La mayoría de los datos contenidos en el diccionario PREMIS (Biblioteca Nacional de España, 2015) ya pueden mapearse en diversos esquemas.

Ícono de seguridad de Internet
Ilustración de migración de datos

Es imprescindible saber cuándo es necesario realizar una acción de preservación; por ejemplo:

  • Cuando los formatos en los que se resguardan los objetos digitales están por caer en desuso, los sistemas deben ser capaces de ser notificados y permitir la implementación de acciones de preservación.
  • Al realizar una migración de formato, el sistema debe ser capaz de mantener los datos, hasta que ocurra el siguiente evento.

Otro aspecto importante en la administración de contenidos es la tecnología de monitoreo, la cual se refiere a que los sistemas de almacenamiento deben seguir las nuevas tendencias tecnológicas (estándares, plataformas, etc.), para prevenir posibles causas de obsolescencia del sistema; por ello, los sistemas de almacenamiento deben contar con módulos que informen sobre alertas tecnológicas y estándares de datos para lograr una estrategia de preservación o migración.

En este sentido, la Biblioteca Nacional de Australia y la Asociación Australiana para Depósitos Perdurables están desarrollando el Sistema Automatizado de Notificación de Obsolescencia, que busca vigilar los formatos de archivos en depósitos digitales, a partir de alertas que notifiquen a los administradores para que tomen acciones necesarias cuando un evento de este tipo se presente.

En los sistemas automatizados que se encargan de la administración de contenidos, las bases de datos constituyen su núcleo, ya que ahí reside lo más valioso de todo el sistema: la información. Ésta debe estar organizada y normalizada para ser manipulada a través de un conjunto de programas que darán acceso en tiempo real a usuarios concurrentes con diferentes necesidades de información.

La complejidad y la robustez de un sistema dependen, en gran medida, de cómo se diseñe su base de datos, pues es de ella de donde obtienen cualidades elementales, como son la integridad de los datos, la seguridad, el tiempo de respuesta y la concurrencia.

Base de datos

Una base de datos es un contenedor que permite almacenar la información de forma ordenada con diferentes propósitos y usos.

Por ejemplo, en una base de datos se puede almacenar información de diferentes departamentos, como ventas, recursos humanos, inventarios, entre otros. El almacenamiento de la información por sí sola no tiene un valor, pero si combinamos o relacionamos la información con diferentes departamentos nos puede dar el valor.

Para realizar un diseño adecuado de una base de datos se debe analizar su diseño conceptual, lógico-físico, así como la información que contendrá, lo que dará como resultado el uso de ciertos tipos de datos.

Por medio de especificaciones del usuario, el diseñador de la base tendrá una descripción de la información a resguardar en el sistema, es decir, debe descubrir el significado de los datos que manejará, encontrando con esto características en común y las relaciones que guardan entre sí.

Una vez comprendida la naturaleza y el uso que se le dará a los datos, el esquema conceptual resultante será utilizado para que el diseñador de la base de datos transmita al usuario lo que ha entendido sobre la información que se utilizará.

Diseño lógico

Consiste en el análisis de los requerimientos del sistema para construir un esquema de la información a resguardar, utilizando un modelo o esquema específico, como los que se muestran a continuación.

Acordeón de conceptos

Modelo jerárquico

Su característica es que los datos se organizan en forma de arborescencia jerárquica. El árbol formado tiene un nodo llamado raíz (sin nodos padres) y uno o varios nodos padre, que pueden tener varios hijos llamados hojas (nodo final). Su principal limitación es la incapacidad de limitar la redundancia de datos, al no permitir que un nodo hoja tenga varios padres. En la siguiente figura podemos ver el modelado de la base de datos jerárquica de una terminal de autobuses.

Esquema modelo jerárquico
Modelo de red

Está formado por colecciones de registros relacionados mediante ligas arbitrarias. Es muy similar al modelo jerárquico, pero la modificación fundamental es el concepto de nodo, pues aquí se permite que un mismo nodo tenga varios padres, haciendo con esto un mayor número de arborescencias; por lo que es difícil de administrar una base de datos basada en este modelo. En la siguiente figura podemos ver el modelado de la base de datos en red de una terminal de autobuses.

Esquema modelo de red
Modelo relacional

La estructura en la que se ordena la información dentro de una base de datos es mediante tablas y campos. El objeto conceptual llamado tabla permite agrupar la información por sus características básicas, llamadas campos. En la siguiente figura podemos ver el modelado de la base de datos relacional de una terminal de autobuses.

Esquema modelo relacional
Esquema de tabla

Por ejemplo, para organizar a las personas de una empresa dentro de una base de datos podríamos estructurar una tabla por empleado, la cual contendría la información de cada trabajador (nombre, número de seguro social, entre otros), como un identificador único. Cada elemento recibe el nombre de campo y el conjunto de éstos por cada trabajador recibe el nombre de registro. En el ejemplo de la terminal de autobuses, una tabla puede ser la que se ve a continuación:

Esquema de tabla

Tipo de información

Los tipos de datos que se pueden almacenar son diversos y atienden a las necesidades de cada base de datos, respecto a la información que se quiere ordenar. Los más comunes son de tipo numérico y tipo texto.

Conforme han evolucionado las bases de datos se han expandido los tipos de datos que pueden almacenar. Por mencionar algunos, están los CLOB (character large object), utilizados para almacenar documentos, y BLOB (binary large object), para almacenar una imagen o video.

Otro tipo de dato relevante es el XML, un dato jerárquico porque parte de un nodo inicial o raíz y, a su vez, puede tener “n” niveles y subniveles.

Por otro lado, de acuerdo al tipo de procesamiento que se le dará a la información, se determina el tipo de base de datos a utilizar:

Base de datos dinámica OLTP
(On Line Transaction Processing)
Base de datos estática OLAP
(On Line Analytical Processing)

La información se modifica en tiempo real: se insertan, eliminan, modifican y consultan datos en línea durante la operación del sistema.

Un ejemplo es el sistema de un supermercado, en donde se va registrando cada uno de los artículos que el cliente está comprando y, a su vez, el sistema va actualizando el inventario.

La información en tiempo real no es afectada, no se insertan, eliminan y tampoco se modifican datos; sólo se realizan consultas sobre los datos ya existentes para el análisis y toma de decisiones.

Este tipo de bases de datos es implementado en business intelligence, o inteligencia de negocios, para mejorar el desempeño de las consultas con grandes volúmenes de información.

La necesidad de implementar un tipo u otro dependerá del giro y necesidades de cada institución. Es muy importante identificar el tipo de base de datos que se requiere, antes de implementar un manejador de base de datos, pero ¿qué es esto?

Un sistema manejador de base de datos (SMBD) consiste en una base de datos y un conjunto de programas para tener acceso y manipulación de los datos. Su objetivo es crear un ambiente en donde sea posible almacenar y recuperar información de forma eficiente y conveniente. Sus funciones son las siguientes:

  • Permitir la interacción de la base de datos con el sistema operativo.
  • Implantación de la seguridad en el acceso a la información resguardada.
  • Puesta en práctica de la integridad de los datos.
  • Respaldo y recuperación.
  • Control de la concurrencia y verificar los privilegios de los usuarios.

En un SMBD es necesario el uso del lenguaje SQL para trabajar sobre la base de datos relacional.

Existe un vasto número de manejadores de bases de datos en el mercado, tanto aplicaciones propietarias como software libre, cada uno con sus ventajas y limitantes. Algunos sistemas gestores de bases de datos son los que se enuncian a continuación.

MS SQL Server

El SMBD de Microsoft cuenta con un entorno de desarrollo flexible que permite a los desarrolladores elegir el lenguaje de sus aplicaciones para la base de datos, así como utilizar sus propios tipos y funciones. Se pueden crear servicios web en la capa de base de datos, convirtiendo a SQL Server en un servidor HTTP. Cuenta con una herramienta de administración que integra herramientas automatizadas de operaciones recurrentes en administración de base de datos, para ahorrar tiempo de gestión y mantenimiento capaz de cambiar atributos con un clic.

Logo de MS SQL Server

Oracle

Corre sobre los principales sistemas operativos, como Windows, Linux y todas las versiones de Unix. Su administración es sencilla, porque entrega con su motor una herramienta gráfica y centralizada para realizar toda la administración de todos los componentes Oracle, lo que facilita la administración de usuarios, roles y privilegios.

Una ventaja es que se puede adquirir primero una versión con características básicas y, posteriormente, dadas las necesidades de la base de datos, puedan crecer los sistemas junto con el manejador, lo que repercute favorablemente en su mantenimiento, crecimiento y actualización.

Logo de Oracle

MySQL

Este manejador de bases quizá sea el más usado en el mundo del software libre por su gran rapidez y facilidad de uso; esto se debe a que existe una infinidad de librerías y otras herramientas que permiten su uso a través de una gran cantidad de lenguajes de programación, además de su fácil instalación y configuración. Ya que en las aplicaciones web existe una baja concurrencia en la modificación de datos y gran afluencia en su lectura, este SMBD es excelente para páginas dinámicas ligadas a bases de datos.

Se puede ejecutar bajo múltiples sistemas operativos, como OS/2, SunOS, Solaris, Windows, Linux, entre otros.

Logo de MySQL

PostgreSQL

Es confiable, rápido, escalable, de libre distribución, sin límite de usuarios. Se puede montar en varias plataformas (entre ellas Windows y Linux). Con este sistema se pueden lograr bases de tamaño ilimitado. Soporta operadores, funciones, métodos de acceso y tipos de datos definidos por el usuario e integridad referencial, que es utilizada para garantizar la validez de los datos de la DB. Soporta lenguajes procedurales internos, incluyendo un lenguaje nativo denominado PL/pgSQL, que es comparable al lenguaje procedural de Oracle, PL/SQL.

Logo PostgreSQL

Por último, hay que considerar que cuando se crea una base de datos y se inicia su operación, el volumen de la información es mínimo y el desempeño de la aplicación y base de datos es óptimo; sin embargo, conforme pasa el tiempo, el volumen de información incrementa y en consecuencia surgen los siguientes problemas:

  • Problemas de espacio en el disco.
  • Incrementos de costo en almacenamiento y procesamiento.
  • Problemas de desempeño en las consultas.
  • Fallas en el aplicativo, afectando la disponibilidad de los datos.
  • Problemas con la base de datos y la pérdida de información.

Actividad. Gestión de contenidos digitales

Una vez que el sistema de información ha recibido y almacenado objetos digitales, así como su documentación relacionada, es indispensable pensar en su administración y posteriormente en la creación de la base de datos. Para lograrlo es necesario conocer qué engloba cada proceso.

Autoevaluación. Base de datos

Una base de datos reúne varios elementos para su diseño y correcto funcionamiento; tal es el caso del lenguaje que utiliza, su sistema manejador de datos o el tipo de base de datos que es. ¿Logras identificarlos? A continuación, lo averiguarás.

Fuentes de información

Básicas

Bibliografía

  • Batini, C., Ceri, S. y Navathe, S. B. (1994). Diseño conceptual de bases de datos: un enfoque de entidades interrelacionadas. Addison Wesley Iberoamericana.
  • Bradley, K. (2007). Hacia un sistema de almacenamiento y preservación en código abierto. Conaculta/Fonoteca Nacional.
  • Date, C. J. (1993). Introducción a los sistemas de bases de datos (vol. 1, 5.ª ed.). Addison Wesley Iberoamericana.
  • Digital Library Federation (DLF). (2002). Benchmark for faithful digital reproductions of monographs and serials. Autor.
  • Documentos electrónicos

  • Anguiano, J. D. (2014). Características y tipos de bases de datos. https://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
  • Bacula. (2018, octubre 29). What is Bacula? https://www.bacula.org/what-is-bacula/
  • Biblioteca Nacional de España. (2015). Diccionario de datos PREMIS de Metadatos de Preservación Versión 2.0 [Versión electrónica]. http://www.bne.es/media/Publicaciones/PublicacionesTecnicas/PREMIS_es.pdf
  • Blázquez, M. (2014, 20 de marzo). La migración de datos. Exportación e importación. http://ccdoc-automatizacion.blogspot.mx/2014/03/la-migracion-de-datos-exportacion-e.html
  • DSpace. (s. f.). Cómo actualizar o importar metadata Dublin Core por bloques (Excel, CSV). https://confluence.tavara.pe/DSPACEDOC5x/tutoriales-adicionales/como-actualizar-o-importar-metadata-dublin-core-por-bloques-excel-csv
  • GitHub. (2024). PySAF. https://github.com/cstarcher/pysaf
  • Pearce, R. (2005). A glossary of archival and records terminology [Versión electrónica]. The Society of American Archivists. http://files.archivists.org/pubs/free/SAA-Glossary-2005.pdf
  • Rodríguez, P. O. (2016). La preservación digital sonora [Versión electrónica]. Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información, (68). IIBI-UNAM. http://rev-ib.unam.mx/ib/index.php/ib/article/view/54601/48544
  • Sánchez, B. (s. f.). Curso: enfoque de sistemas (Programa de Posgrado en Ingeniería, UNAM. Departamento de Ingeniería de Sistemas). http://slideplayer.es/slide/26344/
  • Universidad de Cornell. (2000-2003). Llevando la teoría a la práctica. Tutorial de digitalización de imágenes. Biblioteca de la Universidad de Cornell-Departamento de Investigación. http://preservationtutorial.library.cornell.edu/tutorial-spanish/tutorial_Spanish.pdf
  • Voutssas, J. (2009). Factores tecnológicos, legales y documentales de la preservación documental digital [Versión electrónica]. Investigación Bibliotecológica, Archivonomía, Bibliotecología e Información, 23(49). IIBI-UNAM. http://dx.doi.org/10.22201/iibi.0187358xp.2009.49.21391
  • Sitios electrónicos

  • Amanda Network Backup. (2017). http://www.amanda.org/
  • Complementarias

  • Soler, J. (2008). La preservación de los documentos electrónicos. UOC.

Cómo citar

Abad, D. C. (2024). Administración de Contenidos Digitales y de Bases de Datos. Unidades de Apoyo para el Aprendizaje. CUAIEED/Escuela Nacional de Estudios Superiores, Morelia-UNAM. (Vínculo)