Samenvatting
El problema de planificación de tareas (scheduling) es usualmente referido como "el problema de acomodar los recursos en el tiempo para realizar un conjunto de tareas".
Entre los problemas de Scheduling existentes, el Job Shop Scheduling Problem (JSSP) es uno de los que ha generado un mayor número de estudios, además de aparecer en la literatura científica como ejemplo de prueba de muchas técnicas de resolución de problemas. En resumen, en el JSSP se dispone de un conjunto de máquinas y un conjunto de trabajos con el objetivo de encontrar la mejor planificación, es decir, la secuenciación de los trabajos en las diferentes máquinas de forma tal que se minimice el tiempo total de producción, denominado makespan.
En este artículo se estudia la aplicación del aprendizaje reforzado en la solución del problema antes mencionado. El aprendizaje reforzado es aprender qué hacer para obtener la mayor recompensa numérica posible. Es una técnica en la que los aprendices (agentes) no están advertidos sobre cuál acción les dará la mayor recompensa, sino que deben descubrirla haciendo un balance adecuado entre exploración y explotación de las
acciones disponibles.
El algoritmo implementado fue probado haciendo uso de 16 de las instancias disponibles en Internet. Los resultados obtenidos son similares y para algunas de las instancias mejores que aquellos reportados en la bibliografía por enfoques similares.
Entre los problemas de Scheduling existentes, el Job Shop Scheduling Problem (JSSP) es uno de los que ha generado un mayor número de estudios, además de aparecer en la literatura científica como ejemplo de prueba de muchas técnicas de resolución de problemas. En resumen, en el JSSP se dispone de un conjunto de máquinas y un conjunto de trabajos con el objetivo de encontrar la mejor planificación, es decir, la secuenciación de los trabajos en las diferentes máquinas de forma tal que se minimice el tiempo total de producción, denominado makespan.
En este artículo se estudia la aplicación del aprendizaje reforzado en la solución del problema antes mencionado. El aprendizaje reforzado es aprender qué hacer para obtener la mayor recompensa numérica posible. Es una técnica en la que los aprendices (agentes) no están advertidos sobre cuál acción les dará la mayor recompensa, sino que deben descubrirla haciendo un balance adecuado entre exploración y explotación de las
acciones disponibles.
El algoritmo implementado fue probado haciendo uso de 16 de las instancias disponibles en Internet. Los resultados obtenidos son similares y para algunas de las instancias mejores que aquellos reportados en la bibliografía por enfoques similares.
Originele taal-2 | Spanish |
---|---|
Tijdschrift | Boletín de la Sociedad cubana de matemática y computación (En línea) |
Status | Published - nov 2009 |
Keywords
- Aprendizaje Reforzado
- Secuenciacion de Tareas