Proyecto

PID2021-125051OB-I00 (HVD): Recolección de datos visuales: permitiendo la visión por computador en escenarios con datos desfavorables (2022-2025)

El objetivo principal de este proyecto es reducir la enorme dependencia que tienen la IA y los
algoritmos Deep CNN de la disponibilidad de datos de entrenamiento anotados. Los datos son la
condición que habilitan los modelos de CV en la actualidad. A pesar de haber recibido una atención
sustancialmente menor que los algoritmos, métodos o modelos, se están haciendo cada vez más
esfuerzos para proporcionar repositorios accesibles a gran escala, por ejemplo, fomentando el acceso
justo a los datos y el intercambio de datos. Con respecto a la disponibilidad de datos anotados,
dado que las soluciones de vanguardia actuales se basan principalmente en enfoques de aprendizaje
supervisado, su éxito requiere la disponibilidad de grandes conjuntos de datos anotados por humanos
(como ImageNet) que dependen de una gran cantidad de supervisión en tiempo y esfuerzo. Además, para
algunos dominios sensibles, como los accidentes de tráfico, las anotaciones y el contenido rara vez
están disponibles. Algunas aplicaciones requieren una adición continua de datos o anotaciones
mientras se mantienen los pesos del modelo previamente entrenados, por ejemplo, debido a la
inclusión de tareas o clases adicionales para predecir. Además, estos sistemas así entrenados
generalmente se adaptan a una tarea específica y no pueden adaptarse a otras tareas sin
reentrenamiento. Para hacer frente a estos problemas, se ha dedicado un gran esfuerzo de
investigación a lograr sistemas que puedan: modelar los patrones intrínsecos en los datos sin
aprovechar (completamente) el etiquetado humano; adaptar continuamente el proceso de aprendizaje a
la disponibilidad de nuevos datos adicionales; y extrapolar el aprendizaje de información útil
utilizando conjuntos de datos sintéticos complementarios para los que se puede obtener una anotación
automática. En esta dirección, proponemos 1) explorar el uso de datos reales en ausencia de
anotaciones a través de enfoques no supervisados y autosupervisados; y 2) explorar la creación y uso
de datos sintéticos para complementar el proceso de aprendizaje
Participantes: Universidad Autónoma de Madrid
Investigador responsable: Garcia-Martin, Alvaro

Enlace Web: PID2021-125051OB-I00 (HVD)

Publicaciones Externas:

Revistas

Javier Montalvo, Alvaro Garcia-Martin, Jesús Bescós : "Exploiting Semantic Segmentation to Boost Reinforcement Learning in Video Game Environments", Multimedia Tools and Applications

Roberto Alcover, Juan C. SanMiguel, Marcos Escudero, Alvaro Garcia-Martin : "On exploring weakly supervised domain adaptation strategies for semantic segmentation using synthetic data", Multimedia Tools and Applications (En prensa)

Juan I. Bravo, Alvaro Garcia-Martin, Jesús Bescós, Marcos Escudero : "Spacecraft Pose Estimation: Robust 2D and 3D-Structural Losses and Unsupervised Domain Adaptation by Inter-Model Consensus", IEEE Transactions on Aerospace and Electronic Systems (En prensa)

Roberto Alcover, Juan C. SanMiguel, Marcos Escudero, Pablo Carballeira : "Per-Class Curriculum for Unsupervised Domain Adaptation in Semantic Segmentation", The Visual Computer (En prensa)

Congresos

Pablo Marcos, Roberto Alcover, Juan C. SanMiguel, Jose M. Martinez : "Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models", IEEE/CVF International Conference on Computer Vision and Pattern Recognition

Juan C. SanMiguel, Jorge Muñoz, Fabio Poiesi : "Detection-aware multi-object tracking evaluation", 2022 18th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS)

Cecilia Diana-Albelda, Juan I. Bravo, Javier Montalvo, Alvaro Garcia-Martin, Jesús Bescós : "Self-Supervised Monocular Depth Estimation on Unseen Synthetic Cameras", 26th Iberoamerican Congress on Pattern Recognition (En prensa)

Roberto Alcover, Juan C. SanMiguel, Marcos Escudero : "Biased Class disagreement: detection of out of distribution instances by using differently biased semantic segmentation models", IEEE International Conference on Computer Vision Workshops 2023, Workshop on Uncertainty Quantification for Computer Vision

et al., Roberto Alcover, Juan C. SanMiguel, Marcos Escudero, et al. : "The Robust Semantic Segmentation UNCV2023 Challenge Results", IEEE International Conference on Computer Vision Workshops 2023, Workshop on Uncertainty Quantification for Computer Vision

Pablo Marcos : "Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models", IEEE/CVF International Conference on Computer Vision and Pattern Recognition (En prensa)

Cecilia Diana-Albelda, Roberto Alcover, Alvaro Garcia-Martin, Jesús Bescós : "How SAM Perceives Different mp-MRI Brain Tumor Domains?", IEEE/CVF International Conference on Computer Vision and Pattern Recognition (En prensa)

Publicaciones Internas:

Trabajos de fin de master

Self-Supervised Monocular Depth Estimation and Visual Odometry on Unseen Synthetic Cameras, Diana-Albelda, Cecilia, Julio 2023, (Tutor: Bravo Pérez-Villar, Juan Ignacio) , (Ponente: Garcia-Martin, Alvaro)