Professional Documents
Culture Documents
El problema de la diligencia
1.Enumeración exhaustiva: Enumerar todas las rutas posibles, calcular su costo y elegir
la de menor valor. En total son 18
2. Elegir la ruta más barata en cada etapa. Esta solución no conduce al óptimo global.
Un pequeño sacrificio en una etapa puede permitir mayores ahorros más adelante.
3. Programación dinámica.
ensanchando el problema. Así encontramos la solución óptima del lugar al que debe dirigirse teniendo en cuenta la
información de la iteración anterior.
A X1 X2 X3 X4
Donde X 4 = J
Sea f n (S, X n ) el costo total de la mejor política global para las etapas restantes, dado que el agente se encuentra
en el estado S, listo para iniciar la etapa n y se dirige a X n como destino inmediato.
Dados S y n , sea X n * el valor de X n (no necesariamente único), que minimiza f n (S , X n ) , y sea f n * (S) el valor
mínimo correspondiente de f n (S, X n ) entonces:
Procedimiento de solución hacia atrás
Etapa n=4
Como el destino final (estado J) se alcanza al terminar la etapa 4, entonces f 5 * (J)
=0
El objetivo es hallar f 1 * (A) y su ruta correspondiente.
Cuando el cazafortunas tiene sólo una etapa por recorrer (n=4) , su ruta de ahí en
adelante, estará determinada por el estado actual (H o I) y su destino
final X 4 = J La ruta será: S J donde S= H o I
Veamos la solución del
problema gráficamente:
Características de la P.D
1. El problema se puede dividir por etapas, que requieren una política de
decisión en cada una de ellas.
decisiones interrelacionadas).
La relación recursiva será:
N: número de etapas.
n: etiqueta para la etapa
actual (1,2,...,N)
S n : Estado actual para la
etapa n.
X n : variable de decisión
para la etapa n
8.Cuando se tiene una relación recursiva como la de la función, el
procedimiento de solución “hacia atrás” inicia en la última etapa y se
mueve hacia la primera, etapa por etapa
X n* : Valor óptimo de X n dadoS n
ALGORITMO DE P.D HACIA
ATRÁS