AViSADOS: Un Sistema Multiagente para la Vigilancia Visual Avanzada
La utilización de sistemas de vigilancia visuales ha crecido exponencialmente en la última década. Esta expansión requiere ayuda tecnológica a la hora de analizar e interpretar la ingente cantidad de información visual producida. En este contexto se encuadra la vigilancia visual avanzada, implicando dicho concepto no sólo el análisis de una secuencia de imágenes, sino también su interpretación, detectando la presencia de determinados sucesos o acciones previamente definidos. La meta de estos sistemas de vigilancia visual avanzada altamente distribuidos es (1) monitorizar el entorno, (2) diagnosticar las situaciones (relaciones espacio-temporales entre distintos objetos de interés en una secuencia de imágenes) y (3) generar las acciones pertinentes, en colaboración con los agentes humanos, ante situaciones de alerta. La propuesta de este proyecto se basa en el uso combinado de la vigilancia electrónica con la humana en tareas de seguridad encuadrada en la denominada vigilancia visual avanzada utilizando sistemas multiagente inteligentes en su fase de modelado distribuido y autónomo, e interfaces avanzadas para una más eficaz interacción hombre-máquina. Este proyecto, continuación de AVISA (TIN2004-07661), aborda la mejora del método de atención visual selectiva dinámica para el análisis de los objetos en movimiento. En cuanto al nivel de interpretación de la escena, el proyecto incluye: (a) la generación de un lenguaje de comunicación (lenguaje de descripción de escenas) suficientemente rico entre el nivel de procesado de la imagen y el de comprensión de la misma, (b) el desarrollo de sensores genéricos (visuales y no visuales) que integran los datos físicos con el conocimiento de entorno y tarea, (c) la ayuda a la toma de decisiones (interacción hombre-máquina) mediante técnicas de realidad aumentada, y (d) la creación de una herramienta de generación de entornos de vigilancia multisensoriales modelados como sistemas multiagente.
La vigilancia es una macrotarea de carácter multidisciplinar que afecta a un número cada vez mayor de escenarios, servicios y usuarios. La vigilancia plurisensorial, que añade cámaras móviles sobre robots y sensores no visuales, se usa para detectar amenazas a través de la observación continua de áreas importantes y vulnerables de un escenario considerado de valor económico, social o estratégico por ser susceptibles de robos, incendios, vandalismo o atentados [Molina et al., 2004; Remagnino et al., 2004]. Estos sistemas de vigilancia visual son también útiles para grabar individuos y objetos de determinado perfil que accedan o salgan de una determinada área de interés [Brand & Kettnaver, 2000; Buxton, 2002], ayudando a la identificación de situaciones de interés y permitiendo la rápida reacción en tiempo real. Además, las observaciones que se monitorizan y prediagnostican en tiempo real pueden ser también grabables para un análisis posterior. Los sistemas de vigilancia avanzada como el que describimos se aplican a un amplio rango de dominios (humanos, tráfico de vehículos, etc.), cada uno de ellos con sus propias problemáticas específicas debidas al contexto espacial, el tipo de objetos involucrados, las actividades de interés, etc. Obviamente estos puntos originan en realidad multiplicidad de dominios de problema difícilmente abordables en conjunto y muestra de ello es el elevado grado de orientación a la tarea que sufren los sistemas desarrollados con cierto éxito donde se inyecta todo el conocimiento disponible [Fernyhough et al, 2000]. En [Buxton & Mukerjee, 2000] se señala la trascendencia de la conceptualización de las imágenes, subrayando la importancia de utilizar conceptos en su justa medida respecto al dominio (qué se observa) y el alcance (qué nivel de detalle se aplica). Efectivamente, el conjunto de conceptos utilizado debería ser suficiente para definir la tarea tal como se indica en [Nagel, 2004] donde se habla de “describir los sucesos esenciales en la escena centrándose en los cambios, en particular en los movimientos”. La eficiencia del sistema entonces podría mejorarse conforme se optimiza el conjunto de conceptos, minimizándolo, eliminando ambigüedades, redundancias, etc.
El número de profesores promocionados a las categorías de TEU, TU y CU desde la creación del grupo en la UNED (1989) hasta la actualidad (1 CU, 5 TUs y 5 TEUs) es un indicador de la capacidad de formación del grupo. Adicionalmente se han dirigido las tesis doctorales de 10 de estos profesores junto con las de otros 8 de componentes del grupo. De estos 8 hay 5 que no participan en este proyecto y otros 3 (M. Fernández Graciani, A. Fernández Caballero y M.T. López Bonal) que participan en el subproyecto UCLM. Finalmente está en curso 1 tesis adicional, la de J. Martínez Cantos, Becario FPI del Ministerio de Educación y Ciencia, cuyo director es J. Mira Mira. Es previsible, dada la perspectiva histórica, y el carácter de los objetivos planteados en este proyecto que durante el desarrollo del mismo se realicen total o parcialmente 2 ó 3 nuevas tesis doctorales y alguna promoción del profesorado TEU y/o TU que participa en el proyecto.
Tal como hemos descrito en el apartado anterior, tres miembros doctores de este subproyecto han realizado su tesis, bajo la dirección de J. Mira en el Dpto. de Inteligencia Artificial de la UNED. Adicionalmente M.A. Fernández Graciani y A. Fernández-Caballero han codirigido la tesis de M.J. López Valles sobre Estereopsis y movimiento. Modelo de disparidad de carga: Un enfoque con inspiración biológica. A. Fernández Caballero ha dirigido igualmente la tesis doctoral de Víctor López Jaquero sobre Interfaces de usuario adaptativas basadas en modelos y agentes software. En estos momentos A. Fernández-Caballero está dirigiendo las tesis doctorales de J.M. Gascueña Noheda sobre Sistemas multiagente para la adaptación al usuario en sistemas de aprendizaje, de J.J. Valencia Jiménez sobre Sistemas multisensoriales en vigilancia mediante agentes software, de Arturo Peñarrubia Blasco sobre Ontologías mediante interacción lateral en computación acumulativa basadas en agentes inteligentes y de Enrique Lazcorreta sobre Minería de datos y sistemas multiagente. También se están llevando a cabo las tesis: J.P. Molina Massó: Desarrollo de interfaces de usuario tridimensionales. Propuesta de un entorno metodológico de desarrollo: TRES-D; A.S. García Jiménez: Nuevas técnicas de interacción ligadas a entornos virtuales colaborativos; D. Martínez Plasencia: Una herramienta de diseño y creación asistida de aplicaciones de Realidad Virtual Colaborativa. Considerado el contexto de tamaño y juventud de este grupo de investigación es previsible un alto grado relativo de capacidad formativa. En concreto puede esperarse que durante la realización del proyecto se terminen las tesis en curso y se inicien otras dos. J.M. Gascueña Noheda es Becario FPI de la Junta de Comunidades de Castilla-La Mancha bajo la dirección de A. Fernández Caballero. A.S. García Jiménez es también Becario FPI. Resaltar por último la alta posibilidad de promoción de tres de los TEU a la categoría de TU.