El administrador de
datos es una persona que toma las decisiones estratégicas y de políticas con
respecto a la información contenida en la base de datos. El administrador es
quien proporciona el apoyo técnico necesario para poner en práctica esas
decisiones.
ARQUITECTURA DE UN SISTEMA DE BASES DE
DATOS
La
arquitectura de una base de datos se divide en tres niveles los cuales son:
Nivel
Externo: Es el nivel que tiene mayor relación con los usuarios individuales de
la base de datos. Estos son el usuario final programador.
Nivel
Conceptual: Es una representación de toda la información contenida en la base
de datos. Es un panorama de los datos tal y como los percibe el usuario final.
Nivel
Interno: Es una representación de bajo nivel de la base de datos.
INDEPENDENCIA DE
DATOS
La
independencia de los datos puede ser de dos formas, la cuales son:
Física:
Capacidad de modificar el esquema físico sin que haya necesidad de volver a
escribir los programas de aplicación. En algunas ocasiones se hace necesario
modificar el nivel físico para mejorar el funcionamiento.
Lógica:
Capacidad de modificar el esquema conceptual sin provocar que se vuelvan a
escribir los programas de aplicación. Estas modificaciones en el nivel
conceptual se hacen necesario cuando hay una alteración de la escritura lógica
de la base de datos. Es la más difícil de conseguir porque es difícil de
modificar la base de datos sin que sufra cambios de nivel extremo.
Sin
un depósito central de base de datos los programas deben tener acceso a datos
que se hallan en archivos separados.
Sin
una base de datos centralizada la política de seguridad debe tratar con un
conjunto disperso de archivos separados.
Las
variaciones en la presentación física de los datos pueden causar muchos
problemas e inconsistencias cuando no se tiene una base de datos.
Cuando
no existe la vigilancia que proporciona la base de datos, pueden aparecer
inconsistencias de datos cuando un proceso que es largo termina en error.
Los
programas pueden interferir uno con el otro cuando no se tiene una base de
datos
Al
existir una base de datos centralizada los niveles de seguridad de la
información aumentan considerablemente permitiendo así que la información solo
esté disponible para los usuarios que realmente la necesiten.
Es aquella donde
los datos se presentan en nivel múltiples que represente con raíz y sus
ramificaciones.
Bases de Datos Red
Es aquella que
permite la conexión de los nodos en forma multidireccional, por lo que cada
nodo puede tener varios dueños a la vez.
Base de Datos
Relacional
En informática, tipo de base de datos o sistema de administración de
bases de datos, que almacena información en tablas (filas y columnas de datos)
y realiza búsquedas utilizando los datos de columnas especificadas de una tabla
para encontrar datos adicionales en otra tabla.
Datos: Es la unidad
mínima de información que representa un valor que es un carácter de un objeto o
algo.
Información: Es un conjunto
de Datos
Sistema de
Información: Es
un conjunto de elementos que permiten manipular información de determinada
empresa, entre estos podemos encontrar el equipo computacional y el Software
del sistema.
Sistema de Base
de Datos: Es
un sistema computacional que permite manipular información de una empresa en
particular y además esta información debe estar disponible cuando se necesite.
ARQUITECTURA
DE LAS BASES DE DATOS
La arquitectura de sistemas de bases de datos de tres esquemas
fue aprobado por la ANSI-SPARC (American National Standard Institute -
Standards Planning and Requirements Committee) en 1975 como ayuda para
conseguir la separación entre los programas de aplicación y los datos, el
manejo de múltiples vistas por parte de los usuarios y el uso de un catálogo
para almacenar el esquema de la base de datos.
Datos del usuario. En la actualidad, casi todas las bases de datos
representan los datos del usuario como afinidades que son tablas de datos. No
todas las afinidades son igualmente deseables; algunas están mejor
estructuradas que otras. Para crear afinidades bien estructuradas se realiza un
proceso llamado normalización.
Metadatos. Debido
a que los productos DBMS están diseñados para almacenar y manipular tablas, la
mayor parte de ellos almacenan los metadatos en forma de tablas, algunas veces
llamadas tablas del sistema.
Índices.
Están encaminados a mejorar el funcionamiento y la accesibilidad de la base de
datos. Se usan para ordenar y para obtener un acceso rápido a los datos. Los
índices son muy valiosos pero implican un costo. Cada vez que se actualiza una
fila en una afinidad o tabla, también deben actualizarse los índices. Esto no
es malo; sólo significa que los índices no son gratuitos y que deben reservarse
para casos en los que sean de verdad necesarios.
Sistema
administrador de base de datos:
Herramientas de diseño. El subsistema de herramientas de diseño tiene una
serie de elementos que facilitan el diseño y la creación de la base de datos y
sus aplicaciones. Por lo general, incluye recursos para crear tablas, formas,
consultas y reportes. Los productos DBMS también proporcionan lenguajes de
programación e interfaces para estos.
Aplicaciones
de bases de datos:
Formas. Se
emplean para introducir información a la base de datos. En algunas ocasiones
los identificadores (ID) de los objetos no son desplegados en la aplicación. La
razón es que en el modelo del usuario no existen y por lo tanto carecen de
significado para él. Se utilizan para que el DBMS identifique cada fila de cada
tabla y se denominan claves sustitutas.
Todos los
conceptos referentes a las bases de datos están hoy muy claros y definidos
formalmente, al contrario que los de las bases de conocimiento. La tecnología
de gestión de bases de datos se halla en una etapa muy madura. Las bases de datos
han evolucionado durante los pasados 30 años desde sistemas de archivos
rudimentarios hasta sistemas gestores de complejas estructuras de datos que
ofrecen un gran número de posibilidades. Los principales objetivos de un
SGBD son los siguientes:
Independencia
lógica y física de los datos: se refiere a la capacidad de
modificar una definición de esquema en un nivel de la arquitectura sin que
esta modificación afecte al nivel inmediatamente superior. Para ello un
registro externo en un esquema externo no tiene por qué ser igual a su
registro correspondiente en el esquema conceptual.6
Redundancia
mínima:
se trata de usar la base de datos como repositorio común de datos para
distintas aplicaciones.
Acceso
concurrente
por parte de múltiples usuarios: control de concurrencia mediante técnicas
de bloqueo o cerrado de datos accedidos.
Distribución
espacial de los datos: la independencia lógica y física facilita la
posibilidad de sistemas de bases de datos distribuidas. Los datos pueden
encontrarse en otra habitación, otro edificio e incluso otro país. El
usuario no tiene por qué preocuparse de la localización espacial de los
datos a los que accede.
Integridad
de los datos:
se refiere a las medidas de seguridad que impiden que se introduzcan datos
erróneos. Esto puede suceder tanto por motivos físicos (defectos de
hardware, actualización incompleta debido a causas externas), como de
operación (introducción de datos incoherentes).
Consultas
complejas optimizadas: la optimización de consultas permite la
rápida ejecución de las mismas.
Seguridad
de acceso y auditoría: se refiere al derecho de acceso a
los datos contenidos en la base de datos por parte de personas y
organismos. El sistema de auditoría mantiene el control de acceso a la
base de datos, con el objeto de saber qué o quién realizó una determinada
modificación y en qué momento.
Respaldo
y recuperación:
se refiere a la capacidad de un sistema de base de datos de recuperar su
estado en un momento previo a la pérdida de datos.
Acceso
a través de lenguajes de programación estándar: se
refiere a la posibilidad ya mencionada de acceder a los datos de una base
de datos mediante lenguajes de programación ajenos al sistema de base de
datos propiamente dicho.
Además de la clasificación por
la función de las bases de datos, éstas también se pueden clasificar de acuerdo
a su modelo de administración de datos.
Un modelo de datos es
básicamente una "descripción" de algo conocido como contenedor de
datos (algo en donde se guarda la información), así como de los métodos
para almacenar y recuperar información de esos contenedores. Los modelos de
datos no son cosas físicas: son abstracciones que permiten la implementación de
un sistema eficiente de base de datos; por lo general se refieren a algoritmos,
y conceptos matemáticos.
Algunos modelos con frecuencia
utilizados en las bases de datos:
Bases de datos jerárquicas
Éstas son bases de datos que,
como su nombre indica, almacenan su información en una estructura jerárquica.
En este modelo los datos se organizan en una forma similar a un árbol (visto al
revés), en donde un nodo padre de información puede tener varios hijos.
El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen
hijos se los conoce como hojas.
Las bases de datos jerárquicas
son especialmente útiles en el caso de aplicaciones que manejan un gran volumen
de información y datos muy compartidos permitiendo crear estructuras estables y
de gran rendimiento.
Una de las principales
limitaciones de este modelo es su incapacidad de representar eficientemente la
redundancia de datos.
Base de datos de red
Éste es un modelo ligeramente
distinto del jerárquico; su diferencia fundamental es la modificación del
concepto de nodo: se permite que un mismo nodo tenga varios padres
(posibilidad no permitida en el modelo jerárquico).
Base de datos relacional
Éste es el modelo más utilizado en la actualidad
para modelar problemas reales y administrar datos dinámicamente. Tras ser
postulados sus fundamentos en 1970 por Edgar Frank Codd, de los laboratorios IBM en San Jose (California), no tardó en
consolidarse como un nuevo paradigma en los modelos de base de datos.
En
este modelo, el lugar y la forma en que se almacenen los datos no tienen
relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto
tiene la considerable ventaja de que es más fácil de entender y de utilizar
para un usuario esporádico de la base de datos. La información puede
ser recuperada o almacenada mediante "consultas" que ofrecen una
amplia flexibilidad y poder para administrar la información.
Bases de datos multidimensionales
Son bases de datos ideadas
para desarrollar aplicaciones muy concretas, como creación de Cubos OLAP.
Básicamente no se diferencian demasiado de las bases de datos relacionales (una
tabla en una base de datos multidimensional podría serlo también en una base de
datos multidimensional), la diferencia está más bien a nivel conceptual; en las
bases de datos multidimensionales los campos o atributos de una tabla pueden ser
de dos tipos, o bien representan dimensiones de la tabla, o bien representan
métricas que se desean estudiar.
Bases de datos orientadas a objetos
Este modelo, bastante
reciente, y propio de los modelos informaticos orientados a objetivos, trata de almacenar en la base de datos los objetos
completos (estado y comportamiento).
Una base de datos orientada a
objetos es una base de datos que incorpora todos los conceptos importantes del
paradigma de objetos:
Encapsulacion - Propiedad que permite ocultar la información al resto de los objetos,
impidiendo así accesos incorrectos o conflictos.
Herencia - Propiedad a través de la cual los objetos heredan comportamiento dentro
de una jerarquía de clases.
Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a
distintos tipos de objetos.
En bases de datos orientadas a objetos, los
usuarios pueden definir operaciones sobre los datos como parte de la definición
de la base de datos. Una operación (llamada función) se especifica en dos
partes. La interfaz (o signatura) de una operación incluye el nombre de la
operación y los tipos de datos de sus argumentos (o parámetros). La
implementación (o método) de la operación se especifica separadamente y puede
modificarse sin afectar la interfaz.
Bases de datos documentales
Permiten la indexación a texto
completo, y en líneas generales realizar búsquedas más potentes. Tesaurus es un
sistema de índices optimizado para este tipo de bases de datos.
Gestión de bases de datos distribuida
La base de datos está
almacenada en varias computadoras conectadas en red. Surgen debido a la
existencia física de organismos descentralizados. Esto les da la capacidad de
unir las bases de datos de cada localidad y acceder así a distintas
universidades, sucursales de tiendas, etc.
Aunque las bases de datos pueden contener
muchos tipos de datos, algunos de ellos se encuentran protegidos por las leyes
de varios países. Por ejemplo en España, los datos personales se encuentran
protegidos por la Ley Orgánica de Protección de Datos de Carácter Personal, (LOPD).
Bases de datos estáticas
Éstas son bases de datos de sólo
lectura, utilizadas primordialmente para almacenar datos históricos que
posteriormente se pueden utilizar para estudiar el comportamiento de un
conjunto de datos a través del tiempo, realizar proyecciones y tomar decisiones.
Bases de datos dinámicas
Éstas son bases de datos donde la información
almacenada se modifica con el tiempo, permitiendo operaciones como
actualización y adición de datos, además de las operaciones fundamentales de
consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema
de información de una tienda de abarrotes, una farmacia, un videoclub, etc.
Según el contenido
Bases de
datos bibliográficas
Solo contienen un surrogante (representante) de
la fuente primaria, que permite localizarla. Un registro típico de una base de
datos bibliográfica contiene información sobre el autor, fecha de publicación,
editorial, título, edición, de una determinada publicación, etc. Puede contener
un resumen o extracto de la publicación original, pero nunca el texto completo,
porque sino estaríamos en presencia de una base de datos a texto completo.
Bases de datos de texto completo
Almacenan las fuentes primarias,
como por ejemplo, todo el contenido de todas las ediciones de una colección de
revistas científicas.
Directorios
Un ejemplo son las guías telefónicas en formato electrónico.
Bases de datos o "bibliotecas" de información Biológica
Son bases de datos que
almacenan diferentes tipos de información proveniente de las ciencias de la
vida o médicas. Se pueden considerar en varios subtipos:
Aquellas que almacenan
secuencias de nucleótidos o proteínas.
Las bases de datos de
rutas metabólicas
Bases de datos de
estructura, comprende los registros de datos experimentales sobre
estructuras 3D de bio moléculas
es un conjunto de datos pertenecientes a un
mismo contexto y almacenados sistemáticamente para su posterior uso. En este sentido, una biblioteca puede
considerarse una base de datos compuesta en su mayoría por documentos y textos
impresos en papel e indexados para su consulta.
En la actualidad, y debido al
desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de
datos están en formato digital. En el siguiente vídeo podemos ver algo de historia sobre las bases de datos.
la SGBD o sistema gestores de bases de datos, permite almacenar y posteriormente acceder a los datos
de forma rápida y estructurada. Las aplicaciones más usuales son para la
gestión de empresas e instituciones públicas. También son ampliamente
utilizadas en entornos científicos con el objeto de almacenar la información
experimental.