Login

Proyecto

PID2021-125051OB-I00 (HVD): Recolección de datos visuales: permitiendo la visión por computador en escenarios con datos desfavorables (2022-2025)

El objetivo principal de este proyecto es reducir la enorme dependencia que tienen la IA y los
algoritmos Deep CNN de la disponibilidad de datos de entrenamiento anotados. Los datos son la
condición que habilitan los modelos de CV en la actualidad. A pesar de haber recibido una atención
sustancialmente menor que los algoritmos, métodos o modelos, se están haciendo cada vez más
esfuerzos para proporcionar repositorios accesibles a gran escala, por ejemplo, fomentando el acceso
justo a los datos y el intercambio de datos. Con respecto a la disponibilidad de datos anotados,
dado que las soluciones de vanguardia actuales se basan principalmente en enfoques de aprendizaje
supervisado, su éxito requiere la disponibilidad de grandes conjuntos de datos anotados por humanos
(como ImageNet) que dependen de una gran cantidad de supervisión en tiempo y esfuerzo. Además, para
algunos dominios sensibles, como los accidentes de tráfico, las anotaciones y el contenido rara vez
están disponibles. Algunas aplicaciones requieren una adición continua de datos o anotaciones
mientras se mantienen los pesos del modelo previamente entrenados, por ejemplo, debido a la
inclusión de tareas o clases adicionales para predecir. Además, estos sistemas así entrenados
generalmente se adaptan a una tarea específica y no pueden adaptarse a otras tareas sin
reentrenamiento. Para hacer frente a estos problemas, se ha dedicado un gran esfuerzo de
investigación a lograr sistemas que puedan: modelar los patrones intrínsecos en los datos sin
aprovechar (completamente) el etiquetado humano; adaptar continuamente el proceso de aprendizaje a
la disponibilidad de nuevos datos adicionales; y extrapolar el aprendizaje de información útil
utilizando conjuntos de datos sintéticos complementarios para los que se puede obtener una anotación
automática. En esta dirección, proponemos 1) explorar el uso de datos reales en ausencia de
anotaciones a través de enfoques no supervisados y autosupervisados; y 2) explorar la creación y uso
de datos sintéticos para complementar el proceso de aprendizaje
Participantes: Universidad Autónoma de Madrid
Investigador responsable: Garcia-Martin, Alvaro

Enlace Web: PID2021-125051OB-I00 (HVD)

Publicaciones Externas:

Revistas

Congresos

Publicaciones Internas:

Trabajos de fin de master