En todos los sistemas de información, las tareas principales son la entrada y procesamiento de los datos, salida de la información y almacenamiento. En este tema, se describirán dichas etapas y se incluirá una breve descripción de cada una. Al final, tendrás un panorama general sobre la manipulación de los datos en un sistema de información y el esquema conceptual básico de un sistema de información genérico. Se da énfasis al almacenamiento de los datos o información como un elemento que enlaza subsistemas de información de sistemas mayores, así como almacenes de datos de los sistemas en un proceso continuo de utilización.
(s. a.) (2014). Base de datos de particulares [ilustración]. Tomada de https://es.wikipedia.org/wiki/Archivo:Tablas_y_estructura_relacional.png
La información que se guarda en una organización, sin importar su tipo, tendrá una orientación hacia la base de datos. Sin embargo, el hecho de conservar la información en un sistema computacional aumenta algunos de los problemas inherentes a estas acciones; por ejemplo, la gran cantidad de datos que se manejan ocasionan problemas de estructuración, almacenamiento, recuperación, control y seguridad. Cuando las organizaciones necesitan inmediatez en la recuperación de información, los problemas aumentan de manera considerable. En la medida que los sistemas de información se van haciendo más complejos, la recuperación de la información se vuelve más complicada también. Un sistema de información que solamente registra las transacciones realizadas no tiene mayor complejidad, pero un sistema de apoyo a la toma de decisiones requiere más recursos y aun más control. Cada vez más computadoras se conectan a la misma base de datos y, por cuestiones de seguridad, es cada vez más necesario separar las bases de datos de los centros operativos, haciendo uso de las redes de telecomunicaciones.
Ciclo de datos en un sistema de información
Los sistemas de información funcionan de la misma manera básica, con o sin el uso de la computadora (aunque con su uso se facilita mucho el trabajo). Las cuatro operaciones básicas de un sistema de información son: introducción de datos, modificación o manipulación de datos, extracción de información y almacenamiento de datos e información.
En el almacenamiento se emplean medios externos que varían en capacidad (cantidad de datos que se pueden almacenar), velocidad de acceso (cantidad de datos que se pueden guardar o recuperar en un tiempo determinado) y modo de acceso (organización de los datos en el medio, aleatoria o secuencial). El costo es importante, aunque en algunos casos no es significativa la diferencia entre ellos.
La ventaja del almacenamiento en discos ópticos puede ser superada por las nuevas tendencias de almacenamiento en la nube, lo cual permite ahorro de espacio físico y, sobre todo, evita la posibilidad de perderlo todo en un desastre, situación cada vez más frecuente y que tiene diversos ejemplos, como los atentados del 11 de septiembre de 2001 y los eventos meteorológicos en Japón, por mencionar algunos. La única supervivencia de la información es que se encuentre en lugar distinto a las instalaciones de la empresa.
Antes de instalar un medio de almacenamiento de los datos para la posterior extracción de información, es necesario evaluar algunas consideraciones importantes:
• Orientado a objetos
• Propósito del almacenamiento de los datos
• Cantidad de datos a guardar
• Velocidad en que se van a guardar y recuperar los datos
• Portabilidad de las bases de datos
• Costo del sistema
• Vigencia del dispositivo (no su duración, sino su obsolescencia)
Hace algunos años se llevaban los respaldos en discos magnéticos, los cuales fueron sustituidos por las cintas (todavía en uso); luego aparecieron los discos compactos, memorias flash , DVD, Blu Ray, minidisco, etcétera. En la medida que se obtiene una mejor miniaturización, los dispositivos cambian. Ahora se mencionan los desarrollos de IBM con la nueva tecnología de almacenamiento Milipede, basada en nanotecnología de perforación de puntos de silicio en una delgada película de plástico que permite almacenar en un dispositivo del tamaño de un sello postal más de un millón de bits (600 000 imágenes de una cámara digital).
La gran mayoría de las transacciones y operaciones cotidianas de las empresas se mantienen en sus bases de datos desde algunas horas hasta varios días. Sin embargo, se ha encontrado una valiosa herramienta en el manejo de las bases de datos para obtener información sobre el comportamiento de los clientes y proveedores, así como algunos otros aspectos relacionados con el funcionamiento de la organización. Las tendencias del mercado, los altibajos de las finanzas y la economía regional y mundial, así como la detección de fraudes, son algunos aspectos que mayor impacto tienen en la empresa. Por ello, se recurre al almacenamiento de datos, su organización y explotación a través de los almacenes de datos o data warehousing.
Data warehousing Son bases de datos de gran tamaño, usualmente relacionales, que facilitan los procesos de toma de decisiones por su misma funcionalidad. Contienen millones de datos de periodos muy amplios y diversas regiones, zonas y sucursales que permiten la administración de la información y los análisis de diferentes condiciones, combinaciones y supuestos. La operación de estos bancos de datos sugiere la acumulación a partir de los sistemas transaccionales; por ello, son utilizados por buena parte de los analistas. Así como los bancos o almacenes de datos pueden funcionar como mercados de datos bajo la implementación de software de análisis, estos mercados de datos pueden funcionar, en conjunto, como un banco de datos mayor. |
Algunos aspectos a considerar al crear, administrar y explotar bases de datos están en función de la escalabilidad, es decir, ante la posibilidad de que el almacén de datos crezca mucho conforme se van incluyendo más datos, el procesamiento puede necesitar mayores equipamientos, y el hardware y software deben ser acordes con el tamaño, necesidades y posibilidades económicas de la organización.
Las fases de extracción, transformación y carga son el comienzo del desarrollo de una gran base de datos a partir de datos obtenidos de la organización y su entorno. |
La minería de datos se refiere al proceso de elegir, explorar y modelar grandes cantidades de datos para descubrir las relaciones antes desconocidas para el apoyo a la toma de decisiones. El software de la minería de datos busca en grandes cantidades de datos patrones de información que sean significativos para el administrador.
Objetivos principales de la minería de datos |
Secuencia o análisis de rutas, donde las detecciones de patrones de un evento conducen a otro evento y así sucesivamente. |
Clasificación, es decir, predefinir la identificación de ciertos hechos en relación con otros. |
|
Agrupamiento, es decir, identificar ciertos hechos no detectados con anterioridad. |
|
Predicción, es decir, al descubrir patrones de ciertos hechos pueden definirse eventos posteriores. |
Estas técnicas son muy empleadas en mercadotecnia, patrones de conducta del consumidor, detección de fraudes, comercialización de un producto, etcétera.
Actividad. Sistema de información
Un sistema de información que solamente registra las transacciones realizadas no tiene mayor complejidad, pero un sistema de apoyo a la toma de decisiones requiere más recursos y control.
Por lo anterior, es necesario identificar las etapas que atraviesan los datos para convertirse en información útil para un sistema.
Autoevaluación. Operaciones básicas de los sistemas de información
Las cuatro operaciones básicas dentro del procesamiento de datos en un sistema de información son: introducción de datos, manipulación de datos, extracción de información y almacenamiento de datos e información.