Las imágenes médicas son fundamentales para la medicina moderna. Recientemente, las redes neuronales convolucionales han logrado grandes mejoras en el desempeño de las técnicas de visión computacional, permitiendo la automatización de tareas complejas. En esta tesis se avanzará en el desarrollo de técnicas basadas en redes profundas, focalizando en tres aplicaciones:
i) Segmentación de estructuras: Algunas de las CNNs más populares todavía confían en estrategias de post procesamiento para incorporar restricciones de conectividad a las máscaras resultantes. En esta tesis, se presenta Post-DAE, un método de post-procesamiento basado en auto codificadores que incorpora plausibilidad anatómica a las segmentaciones generadas por distintos algoritmos. ii) Estimación de incertidumbre: Las CNNs han demostrado estar mal calibradas y poseer un exceso de confianza en sus predicciones, convirtiéndose en modelos poco confiables. Se propusieron dos enfoques para abordar esta limitación: Entrenamiento de Ensambles Ortogonales, una estrategia que promueve la diversidad entre los modelos de un ensamble mediante restricciones de ortogonalidad, y Entropía Máxima para Predicciones Erróneas, una estrategia de entrenamiento que penaliza selectivamente la sobre-confianza de las predicciones erróneas, incrementando la incertidumbre del modelo en escenarios complejos.
iii) Seguimiento de ojos mediante video-oculografía para el diagnóstico de enfermedades neurológicas: En estos equipos, la cabeza del usuario debe permanecer estática para evitar errores de estimación, Los movimientos involuntarios no siempre pueden evitarse, y es necesario medirlos. En esta tesis, se diseñó una CNN de regresión en cascada para estimar las coordenadas de la esquina del ojo y usarlas como referencia de los movimientos de la cabeza.
Medical imaging is a fundamental component of modern medicine. Recently, convolutional neural networks (CNN), have achieved great improvements in the performance of computer vision techniques, allowing the automation of complex tasks. This thesis will advance the development of techniques and methodologies based on deep networks, focusing on three applications: i) Medical imaging segmentation: Some of the most popular CNN architectures still rely on post-processing strategies to incorporate connectivity constraints into the segmentation masks. We introduce Post-DAE, a post-processing method based on denoising autoencoders, to improve the anatomical plausibility of arbitrary biomedical image segmentation algorithms. ii) Uncertainty estimation: It has recently been observed that CNNs tend to produce overconfident estimates, leading to unreliable models. We proposed two approaches to improve this limitation: Orthogonal Ensemble Networks, an ensemble learning strategy that explicitly enforces model diversity imposing orthogonal constraints, and Maximum Entropy on Erroneous Predictions (MEEP), a training strategy that selectively penalizes overconfident predictions, increasing the network uncertainty in complex scenarios. Both methods result in improved segmentation performance and better-calibrated model outputs. iii) Video-oculography gaze tracking for neurological disease detection. In these methods, the user head must remain motionless to avoid estimation errors. In some patients, some involuntary movements cannot be avoided and it is necessary to measure them. As a first stage, the eye corner coordinates were obtained as a reference point. The problem was handled as a regression problem using a coarse-to-fine cascaded convolutional neural network in order to accurately regress the coordinates of the eye corner.