You are on page 1of 4

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

TEMARIO DE REPASO CAPITULO 18


Ampliabilidad: se refiere al manejo de transacciones ms largas mediante el incremento del grado de paralelismo
Ampliabilidad por lotes aumenta el tamao de la base de datos, y las tareas son trabajos ms largos cuyos tiempos de ejecucin
dependen del tamao de la base de datos.
Ampliabilidad de transacciones aumenta la velocidad con la que se envan las transacciones a la base de datos y el tamao de la
base de datos crece proporcionalmente a la tasa de transacciones.
Ampliabilidad lineal. La ampliabilidad se define como TP /TG. Ampliabilidad sublineal. Se dice que el sistema paralelo MG tiene
una ampliabilidad lineal sobre la tarea Q si TP = TG. Si TG > TP.
Ganancia de velocidad: se refiere a la ejecucin en menos tiempo de una tarea dada mediante el incremento del grado de
paralelismo.
Ganancia de velocidad lineal. Si la ganancia de velocidad es N cuando el sistema ms grande tiene N veces ms recursos (UCP,
discos, etc.) que el sistema ms pequeo.
Ganancia de velocidad sublineal. Si la ganancia de velocidad es menor que N.
Arquitectura de memoria no uniforme: cada procesador tiene acceso directo a una sola memoria compartida. Todas las
ubicaciones de la memoria son equidistantes (en cuanto a tiempos de acceso) a cada procesador.
Arquitecturas paralelas de bases de datos: existen varios modelos de arquitecturas para las mquinas paralelasMemoria
compartida. Todos los procesadores comparten una memoria comn.
Disco compartido. Todos los procesadores comparten un conjunto de discos comn (Figura b). Algunas veces los sistemas de disco
compartido se denominan agrupaciones.
Sin compartimiento. Los procesadores no comparten ni memoria ni disco .
Jerrquico. Este modelo es un hbrido de las arquitecturas anteriores .
En un sistema distribuido de bases de datos se almacenala base de datos en varias computadoras.
Datos compartidos. La principal ventaja de construir un sistema distribuido de bases de datos es poder disponer de un entorno
donde los usuarios puedan acceder desde una nica ubicacin a los
Costes de inicio. El inicio de un nico proceso lleva asociado un coste.
Procesos servidor. Son procesos que reciben consultas del usuario (transacciones), las ejecutan, y devuelven los resultados.
Proceso gestor de bloqueos: Este proceso implementa una funcin de gestin de bloqueos que incluye concesin de bloqueos,
liberacin de bloqueos y deteccin de interbloqueos.
Hebra: Es como un proceso, pero varias hebras se ejecutan como parte del mismo proceso, y todas las hebras dentro de un
proceso se ejecutan en el mismo espacio de memoria virtual. Dentro de un proceso se pueden ejecutar concurrentemente
mltiples hebras.
Proceso escritor de bases de datos: Hay uno o ms procesos que vuelcan al disco los bloques de memoria intermedia modificados
de forma continua
Proceso punto de revisin: Este proceso realiza peridicamente puntos de revisin
Proceso monitor de proceso: Este proceso observa otros procesos y, si cualquiera de ellos falla, realiza acciones de recuperacin
para el proceso, tales como cancelar cualquier transaccin que estuviera ejecutando el proceso fallido, y reinicia el proceso.
Interferencia. Como los procesos que se ejecutan en un sistema paralelo acceden con frecuencia a recursos compartidos, pueden
sufrir un cierto retardo como consecuencia de la interferencia de cada nuevo proceso en la competencia con los procesos
existentes por el acceso a los recursos ms comunes, como el bus del sistema, los discos compartidos o incluso los bloqueos. Este
fenmeno afecta tanto a la ganancia de velocidad como a la ampliabilidad.
Paralelismo de grano grueso. Dispone de unos pocos procesadores (normalmente dos o cuatro) que comparten la misma
memoria principal. Las bases de datos que se ejecutan en tales mquinas habitualmente no intentan dividir una consulta simple
entre los distintos procesadores, sino que ejecuta cada consulta en un nico procesador posibilitando la concurrencia de varias
consultas. As, estos sistemas soportan una mayor productividad,
Paralelismo de grano fino. Tienen un gran nmero de procesadores y los sistemas de bases de datos que se ejecutan sobre ellas
intentan hacer paralelas las tareas simples (consultas, por ejemplo) que solicitan los usuarios.
Bus.Todos los componentes del sistema pueden enviar o recibir datos de un nico bus de comunicaciones.
El bus puede ser una red Ethernet o una interconexin paralela. Las arquitecturas de bus trabajan bien para un pequeo nmero
de procesadores el bus slo puede gestionar la comunicacin de un nico componente en cada momento, las arquitecturas de bus
son menos apropiadas segn aumenta el paralelismo.
Malla. Los componentes se organizan como los nodos de una retcula de modo que cada componente est conectado con todos
los nodos adyacentes. En una malla bidimensional cada nodo est conectado con cuatro nodos adyacentes.
Hipercubo. Se asigna a cada componente un nmero binario de modo que dos componentes tienen una conexin directa si sus
correspondientes representaciones binarias difieren en un solo bit.
SESGO: Al dividir cada tarea en un cierto nmero de pasos paralelos se reduce el tamao del paso medio. Por ejemplo, si se divide
una tarea de tamao 100 en 10 partes y la divisin est sesgada.
SERVIDOR DE DATOS: Son servidores de rea local en las cuales alcanzan velocidades altas. se puede acceder a ellos desde
terminales o equipos.

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

Cach de bloqueos: Los bloqueos tambin pueden ser almacenados en la memoria cach del cliente si la utilizacin de los datos
est prcticamente dividida entre los clientes, de manera que un cliente rara vez necesita datos que estn siendo utilizados por
otros clientes.
CACH DE DATOS:Los datos que se envan al cliente en favor de una transaccin se pueden alojar en una cach del cliente incluso
una vez completada la transaccin, si dispone de suficiente espacio de almacenamiento libre.
SERVIDORES DE TRANSACCIONES: tienen mltiples procesos, ejecutndose posiblemente en mltiples procesadores,dado que
estos procesos tienen acceso a los datos comunes, como la memoria intermedia de la base de datos, los sistemas almacenan
dichos datos en memoria compartida.
SISTEMAS CLIENTE-SERVIDOR Los terminales conectados a un sistema central han sido suplantados por computadoras
personales. De igual forma, la interfaz de usuario, que sola estar gestionada directamente por el sistema central, est pasando a
ser gestionada, cada vez ms, por las computadoras personales.
SISTEMAS CENTRALIZADOS: poseen memorias cach locales donde se almacenan copias de ciertas partes de la memoria para
acelerar el acceso a los datos.
SISTEMAS DISTRIBUIDOS: se almacena la base de datos en varias computadoras. Varios medios de comunicacin, como las redes
de alta velocidad o las lneas telefnicas, son los que pueden poner en contacto las distintas computadoras de un sistema
distribuido. No comparten ni memoria ni discos.
SISTEMAS CENTRALIZADOS: Poseen memorias cach locales donde se almacenan copias de ciertas partes de la memoria para
acelerar el acceso a los datos.
Sistemas en paralelo. Los sistemas paralelos mejoran la velocidad de procesamiento y de E/S mediante la utilizacin de UCP y
discos en paralelo de procesamiento y de E/S mediante la utilizacin de UCP y discos en paralelo. El procesamiento paralelo se
realizan muchas operaciones simultneamente.
Tiempo de Respuesta. El buen rendimiento de los sistemas interactivos de transacciones.
Sistemas de servidores. Los sistemas servidores pueden dividirse en servidores de transacciones y servidores de datos:
Servidores de Transacciones:Porcionan una interfaz a travs de la cual los clientes pueden enviar peticiones para realizar una
accin que el servidor ejecutar y cuyos resultados se devolvern al cliente.
Servidores de datos:
Permiten a los clientes interaccionar con los servidores realizando peticiones de lectura o modificacin de datos en unidades tales
como archivos o pginas.
Tipos de redes. Las redes de rea local (LANs, Local Area Networks) surgen a principios de los 70 como una forma de
comunicacin y de compartimiento de datos entre varias computadoras.
Las redes de rea amplia (WAN, Wide Area Networks) Surge como un proyecto de investigacin acadmica para proporcionar una
comunicacin eficiente entre varios lugares permitiendo que una gran comunidad de usuarios pudiera compartir hardware y
software de una manera conveniente y econmica.
Una red de rea de almacenamiento (SAN, Storage-Area Network) es un tipo especial de red de rea local de alta velocidad
destinada a conectar numerosos bancos de dispositivos de almacenamiento (discos) a las computadoras que utilizan los datos.
Tolerancia ante fallos. la capacidad de un sistema de acceder a la informacin, aun en caso de producirse algn fallo o anomala
en el sistema.

TEMARIO DE REPASO CAPITULO 19


Algoritmo luchador. Si no hay ningn sitio activo con un nmero ms elevado, el sitio que se ha recuperado obliga a todos los
sitios con nmeros ms bajos a permitirle transformarse en el sitio coordinador, aunque ya haya un coordinador activo con un
nmero ms bajo.
Algoritmo de seleccin. El ordenamiento por seleccin (Selection Sort en ingls) es unalgoritmo de ordenamiento que
requiere O operaciones para ordenar una lista de n elementos.
Alias. Conjunto de nombres alternativos o alias para los elementos de datos
rboles distribuidos de directorio. La informacin sobre las organizaciones puede hallarse dividida entre varios AIDs, cada uno de
los cuales almacena informacin sobre algunas entradas.
Autonoma. La principal ventaja de compartir datos por medio de distribucin de datos es que cada ubicacin es capaz de
mantener un grado de control sobre los datos que se almacenan localmente.
Las bases de datos distribuidas heterogneas. permiten que cada sitio tenga sus propios esquemas y cdigo de sistema de bases
de datos.
En las bases de datos distribuidas homogneas todos los sitios tienen idntico software de sistemas gestores de bases de datos,
son conscientes de la existencia de los dems sitios y acuerdan cooperar en el procesamiento de las solicitudes de los usuarios
Estrategia de semireunion. Es otra estrategia que a veces mejora los resultados, Se basa en transferir solamente las
tuplas y atributos
Una estrategia posible para lograr todo esto es la siguiente:
1. Calcular temp1 R1 R2 (r1) en S1.
2. Enviar temp1 de S1 a S2.
3. Calcular temp2 r2 temp1 en S2.

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

4. Enviar temp2 de S2 a S1. 5. Calcular r1 temp2 en S1. La relacin resultante es la misma que r1 r2.
Fragmentacin de los datos. Si la relacin r se fragmenta, r se divide en varios fragmentos r1, r2, . . . , rn. Estos fragmentos
contienen sufi- ciente informacin como para permitir la reconstruccin de la relacin original r
La fragmentacin horizontal divide la relacin asignando cada tupla de r en uno o ms fragmentos.
La fragmentacin vertical divide la relacin descomponiendo el esquema R de la relacin r.
Gestor distribuido de bloqueos. la funcin de gestor de bloqueos se halla distribuida entre varios sitios.
Gestor nico de bloqueos. El sistema mantiene un nico gestor de bloqueos que reside en un sitio nico escogido (digamos Si ).
Gestor de transacciones. Asegura que la base de datos quede en un estado consistente (correcto) a pesar de los fallos del
sistema, y que las ejecuciones de transacciones concurrentes ocurran si conflictos.
Instantnea consistente con las transacciones. Permite mejor rendimiento que serializabilidad, sin embargo an evita la mayora
de las anomalas de la concurrencia que serializabilidad evita (pero no siempre todas).
Marcas Temporales. se concede a cada transaccin una marca temporal nica que el sistema utiliza para decidir el orden de
secuenciacin.
Mediadores .Son sistemas que integran varios orgenes de datos heterogneos, proporcionan una vista global integrada de los
datos y ofrecen facilidades de consulta en el sistema global.
Mensajera Persistente. Los mensajes persistentes (que est garantizado que se entregan exactamente una vez,
independientemente de los fallos) se envan a los sitios remotos para solicitar que se emprendan acciones en ellos.
Modalidades de los fallos del sistema. Los tipos bsicos de fallos son: Fallo de un sitio Prdida de mensajes Fallo de un enlace
de comunicaciones Divisin de la red, La prdida o deterioro de los mensajes siempre constituye una posibilidad en los sistemas
distribuidos.
Procesamiento distribuido de consultas. Para los sistemas centralizados el criterio principal para medir el coste de una estrategia
dada es el nmero de accesos a disco. En los sistemas distribuidos hay que tener en cuenta varios asuntos ms, entre los que se
incluyen El coste de la transmisin de los datos por la red La ganancia potencial en rendimiento si se hace que varios sitios
procesen en paralelo partes de la consulta
Propagacin perezosa. Permiten que contine el procesamiento de las transacciones (incluidas las actualizaciones) aunque un
sitio quede desconectado de la red, lo que mejora la disponibilidad, pero, por desgracia, lo hacen a costa de la consistencia.
El protocolo de acceso ligero a directorios LDAP (Lightweight Directory Access Protocol). los sistemas de directorios se
implementan como uno o varios servidores que atienden a varios clientes.
rboles distribuidos de directorio. La informacin sobre las organizaciones puede hallarse dividida entre varios AIDs, cada uno de
los cuales almacena informacin sobre algunas entradas.
Nombre distinguido (ND). En LDAP los directorios almacenan entradas, que son parecidas a los objetos. Cada entrada debe tener
un nombre distinguido (ND), que identifica de manera nica esa entrada.
Nombres distinguidos relativos. Los ND, a su vez, est formado por una secuencia de nombres distinguidos relativos (NDR).
Compromiso de dos fases (C2F). Durante el funcionamiento normal, luego describe el modo en que maneja los fallos y,
finalmente, la manera en que ejecuta la recuperacin y el control de la concurrencia.
Estado de preparacin (El protocolo de compromiso). Cuando T completa su ejecucin (es decir, cuando todos los sitios en los que
se ha ejecutado T informan a Ci de que T se ha completado) Ci inicia el protocolo C2F. Fase 1 Aade, fase 2 prepara.
Problema del bloqueo. Si el coordinador falla durante la ejecucin del protocolo de compromiso para la transaccin T, los sitios
participantes deben decidir el destino de T.
Transacciones dudosas. Son transacciones para las que no se encuentra ningn registro < T preparada>, ni en el registro histrico.
Protocolo de compromiso de tres fases (C3F). Es una extensin del protocolo de compromiso de dos fases que evita el problema
del bloqueo con determinadas suposiciones.
Protocolo de compromiso. Si hay que asegurar la atomicidad, todos los sitios en los que se ejecute una transaccin T deben
coincidir en el resultado final de la ejecucin. T debe comprometerse en todos los sitios o abortarse en todos los sitios.
Protocolos para las rplicas. Si la relacin r se replica, se guarda una copia de dicha relacin en dos o ms sitios.
Copia principal. Para cada elemento de datos Q la copia principal de Q debe residir exactamente en un sitio.
Protocolo de consenso de qurum. Es una generalizacin del protocolo de mayora. El protocolo de consenso de qurum asigna a
cada sitio un peso no negativo.
Base de datos virtual. Se utiliza para hacer referencia a los sistemas de varias bases de datos o a los sistemas mediadores.
Control de Concurrencia. El trmino concurrencia se refiere al hecho de que los DBMS (Sistemas de Administracin de Bases de
Datos) permiten que muchas transacciones accedan a una misma base de datos a la vez. Como bien es sabido, en un sistema de
stos se necesita algn tipo de mecanismo de control de concurrencia para asegurar que las transacciones concurrentes no
interfieran entre s.
Coordinador suplente. Es un sitio que, adems de otras tareas, mantiene de manera local suficiente informacin como para
permitirle asumir el papel de coordinador con un perjuicio mnimo al sistema distribuido.
Coordinador de transacciones. Coordina la ejecucin de las diferentes transacciones (tanto locales como globales) iniciadas en ese
sitio.
Disponibilidad. Si un sitio de un sistema distribuido falla, los sitios restantes pueden seguir trabajando.
Divisin de la red. Cuando una red queda dividida caben dos posibilidades:
1. El coordinador y todos los sitios participantes siguen en una de las particiones
2. El coordinador y los participantes quedan en varias particiones.

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

Protocolo de mayora. Funciona de la manera siguiente. Si el elemento de datos Q se replica en n sitios diferentes se debe enviar
un mensaje de solicitud de bloqueo a ms del 50 por 100 de los n sitios en los que se almacena Q.
Protocolo de sesgado. Concede un tratamiento ms favorable a las solicitudes de bloqueos compartidos que a las solicitudes de
bloqueos exclusivos.
Referencia.. Explicacin o relacin de un acontecimiento que se hace de palabra o por escrito.
Replica de datos. Si la relacin r se replica, se guarda una copia de dicha relacin en dos o ms sitios.
Rplica maestro-esclavo. La base de datos permite las actualizaciones en el sitio principal y las propaga de manera automtica a
las rplicas de los dems sitios.
Rplica multimaestro (tambin denominada rplica de actualizacin distribuida). Se permiten las actualizaciones en cualquier
rplica de los elementos de datos y se propagan de manera automtica a todas las rplicas.
Robustez. La capacidad de continuar funcionando incluso durante los fallos.
Enfoque basado en la mayora. Puede modificarse para que funcione a pesar de los fallos.
Protocolo leer uno, escribir todos. Ya que hay que escribir todas las rplicas.
Protocolo lectura de uno, escritura de todos los disponibles. En este enfoque las operaciones de lectura se llevan a cabo como en
el esquema leer uno, escribir todos; se puede leer cualquier rplica disponible y se obtienen un bloqueo de lectura sobre esa
rplica.
Reintegracin al sistema de los sitos o de los enlaces reparados. Exige la adopcin de precauciones. Cuando se recupera un sitio
que ha fallado, debe iniciar un procedimiento para actualizar sus tablas del sistema para que reflejen las modificaciones realizadas
mientras estaba fuera de servicio.
Seleccin de coordinador. Si el coordinador falla debido a un fallo del sitio en el que reside el sistema, slo puede continuar la
ejecucin reiniciando un nuevo coordinador en otro sitio. Servidor de nombres. Ayuda a asegurar que el mismo nombre no se
utilice para elementos de datos diferentes.
Sistema de varias bases de datos. Una base de datos federada es un sistema en el que varias bases de datos parecen funcionar
como una sola entidad.
Sistemas de directorio. Pueden considerarse una modalidad especializada de base de datos en la que la informacin se organiza
de manera jerrquica parecida al modo en que los archivos se organizan en los sistemas de archivos.
El sufijo de los AIDs .Es una secuencia de pares RDN=valores (RDN, Relative Distinguished Name, nombre relativo distinguido) que
identifica la informacin que almacena cada AID; los pares estn concatenados con el resto del nombre distinguido generado
recorriendo el rbol desde la entrada hasta la raz.
Transacciones distribuidas. El acceso a los diferentes elementos de datos en los sistemas distribuidos suele realizarse mediante
transacciones, que deben preservar las propiedades ACID.
Transacciones locales. Son las que tienen acceso a los datos y los actualizan slo en una base de datos local.
Transacciones globales. Son las que tienen acceso a datos y los actualizan en varias bases de datos locales.
Transparencia de los datos. No se debe exigir a los usuarios de los sistemas distribuidos de bases de datos que conozcan la
ubicacin fsica de los datos ni el modo en que se puede tener acceso a ellos en un sitio local concreto.
Transparencia de la fragmentacin. No se exige a los usuarios que conozcan el modo en que se ha fragmentado la relacin.
Transparencia de la rplica. Los usuarios ven cada objeto de datos como lgicamente nico.
Transparencia de la ubicacin. No se exige a los usuarios que conozcan la ubicacin fsica de los datos.
Tratamiento de los interbloqueos. La prevencin de interbloqueos puede dar lugar a esperas y retrocesos innecesarios.
Grafos locales de espera. Se crean de la manera habitual para las transacciones y los elementos de datos locales. Cuando una
transaccin Ti en el sitio S1 necesita un recurso del sitio S2, enva un mensaje de solicitud al sitio S2.
Grafo global de espera. La unin de todos los grafos locales.

Universidad Politcnica de Sinaloa

Base de datos distribuidas

Jess Alberto Rodrguez Jurez


6-3 Informtica

You might also like