La rápida evolución de las tecnologías de captura y procesamiento de imágenes en las últimas décadas ha transformado la manera en que percibimos y utilizamos la información visual. Este cambio se ha visto impulsado en gran medida por los avances en visión computacional y aprendizaje automático. Las redes neuronales convolucionales han alcanzado logros destacados, superando incluso el desempeño humano en algunas tareas. Sin embargo, todavía persisten desafíos importantes en cuanto al realismo de los resultados y la adaptación a cambios en el dominio de los datos.
Esta tesis aborda dos problemáticas principales. Primero, se enfoca en la registración deformable de imágenes, especialmente relevante en el ámbito biomédico, donde es crucial mantener la plausibilidad anatómica al alinear imágenes. A pesar de los avances en la precisión y velocidad mediante redes convolucionales, el realismo sigue siendo un obstáculo. Se propone un enfoque que aplica restricciones anatómicas durante el proceso de optimización para penalizar deformaciones no realistas.
En segundo lugar, se estudia la generalización frente a cambios de dominio en clasificación de imágenes, proponiendo una nueva estrategia basada en cirugía de gradientes para mejorar la robustez de los modelos ante distribuciones desconocidas. Finalmente, se analiza la relación entre cambio de dominio y sesgo en modelos utilizados para análisis de imágenes. Se presentan métodos no supervisados que, a través del análisis de inconsistencias entre las salidas de modelos entrenados en diferentes grupos, permiten detectar potenciales sesgos en nuevas poblaciones.
The fast evolution of image capture and processing technologies in recent decades has transformed the way we perceive and use visual information. This change has been driven mainly by advances in computer vision and machine learning. Convolutional neural networks have achieved remarkable results, even surpassing human performance in some tasks. However, significant challenges remain regarding the realism of the results and the ability to adapt to changes in data domains.
This thesis addresses two main issues. First, it focuses on deformable image registration, especially relevant in the biomedical field, where ensuring anatomical plausibility during image alignment is crucial. Despite improvements in accuracy and speed using convolutional neural networks, realism remains a challenge. We propose an approach that incorporates anatomical constraints into the optimization process to penalize unrealistic deformations.
Secondly, the thesis studies generalization under domain shifts in image classification, proposing a novel strategy based on gradient surgery to enhance model robustness to unseen data distributions. Finally, it explores the relationship between domain shift and bias in models used for image analysis. We introduce unsupervised methods that, by analyzing inconsistencies in the outputs of models trained on different demographic groups, make it possible to detect potential biases in new populations.