[Todos] Seminario de Probabilidad y Estadística Matemática
Pablo Groisman
pgroisma en dm.uba.ar
Mar Nov 15 11:41:14 ART 2011
Seminario de Probabilidad y Estadística Matemática.
PROXIMO ENCUENTRO: Miércoles 16 de noviembre, 12:00hs.
EXPOSITOR: Eugenio Della Vecchia
TITULO: Descripción y métodos de aproximación de problemas de
optimización markovianos y semimarkovianos.
LUGAR: Instituto de Cálculo, 2do piso, Pabellón 2.
RESUMEN: La exposición tratará sobre evaluación y optimización de
sistemas dinámicos bajo incertidumbre, especialmente aquéllos en los
que la optimización involucre tomas de decisión en situaciones
aleatorias. Para este tipo de problemas de decisión, la Teoría de los
Procesos de Decisión de Markov (MDP) provee un cuadro formal adecuado,
con numerosos resultados teóricos y aplicaciones concretas. El
concepto de la programación dinámica, debido a Bellman (1957) se
torna un método de fundamental importancia en MDP. En la misma década,
a partir del trabajo seminal sobre juegos estocásticos debido a
Shapley (1953) comienza la relación entre MDP y juegos estocásticos,
donde dos o más jugadores controlan la evolución del sistema.
Un MDP es un sistema estocástico de parámetro temporal discreto en los
que es posible controlar las transiciones entre estados. Cada política
de control define un proceso estocástico y el valor de la función
objetivo asociado a este proceso. Se busca seleccionar una buena
política de control. La teoría de los MDP provee resultados sobre la
estructura y existencia de buenas políticas y de métodos para su
cálculo. De manera análoga se analizan los problemas de juegos que
siguen un modelo markoviano, entre dos jugadores y a suma nula. Cuando
el tiempo que transcurre entre dos cambios de estados del sistema, o
entre dos períodos de tomas de decisión consecutivos puede ser
modelado por medio de una variable aleatoria general, nos encontramos
en presencia de un modelo de decisión semimarkoviano, o de un juego
semimarkoviano según el número de jugadores. El tamaño del espacio de
estados, la observación imperfecta del estado actual y el
desconocimiento de las distribuciones de probabilidad puede ocasionar
severos problemas de implementación en las aplicaciones. Por eso han
surgido en los últimos años varios métodos de aproximación más
ligados al área de origen de las aplicaciones. Fundamentalmente así es
como se han ideado heurísticas. Entre ellas, el método de control de
horizonte móvil.
Se dará una introducción del tema, algunos ejemplos y resultados propios
sobre la precisión del método de horizonte móvil.
_______________________________________________________________________
Para ver el calendario del seminario
http://www.google.com/calendar/embed?src=987brtcpho5tt3ch2ud0oobkds%40group.calendar.google.com&ctz=America/Argentina/Buenos_Aires
Para mas información sobre el seminario
http://mate.dm.uba.ar/~drodrig/seminario/
Para recibir información sobre el seminario, suscribirse a la lista Kolmogorov
http://mate.dm.uba.ar/mailman/listinfo/kolmogorov
____________________________________________________________________
Más información sobre la lista de distribución Todos