Biblioteca Virtual

Desarrollo de métodos robustos y fisiológicamente inspirados para el filtrado inverso de la voz

Mostrar el registro sencillo del ítem

dc.contributor.advisor Alzamendi, Gabriel Alejandro
dc.contributor.author Zalazar, Iván Ariel
dc.contributor.other Weinstein, Alejandro
dc.contributor.other Torres, Humberto
dc.contributor.other Godino Llorente, Juan Ingecio
dc.date.accessioned 2026-05-04T15:05:50Z
dc.date.available 2026-05-04T15:05:50Z
dc.date.issued 2026-03-11
dc.identifier.uri https://hdl.handle.net/11185/8819
dc.description Fil: Zalazar, Iván Ariel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina. es_ES
dc.description.abstract El flujo glótico, principal fuente acústica de la fonación humana, porta información sobre las cuerdas vocales. Desafortunadamente, no es posible sensar dicho flujo dentro de la laringe. El filtrado inverso permite estimar de forma no invasiva el flujo glótico al eliminar los efectos del tracto vocal y la radiación en los labios de la señal de voz. Esta tesis presenta nuevos métodos para mejorar la cancelación de estos efectos. Para ello, se abordan las principales limitaciones de la predicción lineal (PL), un método estándar para modelar la contribución del tracto vocal en la señal de voz. Se proponen dos estrategias de PL ponderadas basadas en atenuación Gaussiana para reducir los errores en el ajuste del modelo del tracto vocal causados ​​por las muestras ubicadas en los instantes de cierre glótico. Estas estrategias extienden la formulación de la PL Gaussiana al incorporar un análisis adaptado al tono y una ponderación de fase casi-cerrada, lo que mejora su desempeño. Además, se presenta un método de PL basado en correntropía. Este enfoque resulta un método LP ponderado y guiado por datos que enfatiza automáticamente las muestras ubicadas en la fase cerrada. Esto elimina la necesidad de conocer los instantes glóticos y mejora el modelado del tracto vocal. Finalmente, se propone un modelo adaptativo no armónico regularizado como alternativa para cancelar el efecto de radiación labial y reducir las distorsiones de baja frecuencia producidas por un filtrado inverso inadecuado. Este enfoque proporciona estimaciones del flujo glótico fisiológicamente representativas caracterizadas por una fase cerrada plana. es_ES
dc.description.abstract Glottal airflow, the primary acoustic source of human phonation, carries essential information regarding vocal fold dynamics. Unfortunately, direct measurement of glottal airflow within the larynx is not feasible. Voice inverse filtering enables the non-invasive estimation of glottal airflow by removing the effects of the vocal tract and lip radiation from the voice signal. The present thesis introduces new methods to improve the cancellation of these effects during the inverse filtering process. To this end, the main drawbacks of linear prediction (LP)—a standard method for modeling the vocal tract contribution from the voice signal—are addressed. Two weighted LP strategies based on Gaussian attenuation are proposed to mitigate errors in vocal tract model tuning caused by voice signal samples near glottal closure instants. These strategies extend the original Gaussian LP formulation by incorporating a pitch-adaptive analysis and a quasi-closed phase weighting, significantly enhancing their performance for inverse filtering. Additionally, a robust LP method based on the maximum correntropy criterion is developed. This approach results in a data-driven weighted LP method that automatically emphasizes closed-phase voice signal samples, thereby eliminating the need for prior knowledge of glottal instant locations and improving vocal tract contribution modeling. Finally, a regularized adaptive non-harmonic model is proposed as an alternative for canceling the lip radiation effect and reducing low-frequency distortions produced by inadequate inverse filtering. This approach yields a physiologically representative glottal airflow waveform estimation, characterized by a flat closed phase. en_EN
dc.description.sponsorship Consejo Nacional de Investigaciones Científicas y Técnicas es_ES
dc.format application/pdf
dc.language.iso spa es_ES
dc.rights info:eu-repo/semantics/openAccess
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject Filtrado inverso de la voz es_ES
dc.subject Análisis de la señal de voz es_ES
dc.subject Flujo glótico es_ES
dc.subject Predicción lineal ponderada es_ES
dc.subject Correntropía es_ES
dc.subject Modelado adaptativo no armónico es_ES
dc.subject Voice inverse filtering en_EN
dc.subject Voice signal analysis en_EN
dc.subject Glottal airflow en_EN
dc.subject Weighted linear prediction en_EN
dc.subject Correntropy en_EN
dc.subject Adaptive non-harmonic modeling en_EN
dc.title Desarrollo de métodos robustos y fisiológicamente inspirados para el filtrado inverso de la voz es_ES
dc.title.alternative Development of robust and physiologically inspired methods for voice inverse filtering en_EN
dc.type SNRD es_ES
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:ar-repo/semantics/tesis doctoral
dc.type info:eu-repo/semantics/acceptedVersion
dc.contributor.coadvisor Schlotthauer, Gastón
unl.degree.type doctorado
unl.degree.name Doctorado en Ingeniería
unl.degree.mention Inteligencia Computacional, Señales y Sistemas
unl.degree.grantor Facultad de Ingeniería y Ciencias Hídricas
unl.formato application/pdf


Ficheros en el ítem

Este ítem aparece en

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess

Buscar en la biblioteca