Desarrollo de métodos robustos y fisiológicamente inspirados para el filtrado inverso de la voz

Zalazar, Iván Ariel

Desarrollo de métodos robustos y fisiológicamente inspirados para el filtrado inverso de la voz

Biblioteca Virtual
→
Colección de posgrado
→
Facultad de Ingeniería y Ciencias Hídricas
→
Doctorado en Ingeniería
→
Ver ítem

dc.contributor.advisor	Alzamendi, Gabriel Alejandro
dc.contributor.author	Zalazar, Iván Ariel
dc.contributor.other	Weinstein, Alejandro
dc.contributor.other	Torres, Humberto
dc.contributor.other	Godino Llorente, Juan Ignacio
dc.date.accessioned	2026-05-04T15:05:50Z
dc.date.available	2026-05-04T15:05:50Z
dc.date.issued	2026-03-11
dc.identifier.uri	https://hdl.handle.net/11185/8819
dc.description	Fil: Zalazar, Iván Ariel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.	es_ES
dc.description.abstract	El flujo glótico, principal fuente acústica de la fonación humana, porta información sobre las cuerdas vocales. Desafortunadamente, no es posible sensar dicho flujo dentro de la laringe. El filtrado inverso permite estimar de forma no invasiva el flujo glótico al eliminar los efectos del tracto vocal y la radiación en los labios de la señal de voz. Esta tesis presenta nuevos métodos para mejorar la cancelación de estos efectos. Para ello, se abordan las principales limitaciones de la predicción lineal (PL), un método estándar para modelar la contribución del tracto vocal en la señal de voz. Se proponen dos estrategias de PL ponderadas basadas en atenuación Gaussiana para reducir los errores en el ajuste del modelo del tracto vocal causados por las muestras ubicadas en los instantes de cierre glótico. Estas estrategias extienden la formulación de la PL Gaussiana al incorporar un análisis adaptado al tono y una ponderación de fase casi-cerrada, lo que mejora su desempeño. Además, se presenta un método de PL basado en correntropía. Este enfoque resulta un método LP ponderado y guiado por datos que enfatiza automáticamente las muestras ubicadas en la fase cerrada. Esto elimina la necesidad de conocer los instantes glóticos y mejora el modelado del tracto vocal. Finalmente, se propone un modelo adaptativo no armónico regularizado como alternativa para cancelar el efecto de radiación labial y reducir las distorsiones de baja frecuencia producidas por un filtrado inverso inadecuado. Este enfoque proporciona estimaciones del flujo glótico fisiológicamente representativas caracterizadas por una fase cerrada plana.	es_ES
dc.description.abstract	Glottal airflow, the primary acoustic source of human phonation, carries essential information regarding vocal fold dynamics. Unfortunately, direct measurement of glottal airflow within the larynx is not feasible. Voice inverse filtering enables the non-invasive estimation of glottal airflow by removing the effects of the vocal tract and lip radiation from the voice signal. The present thesis introduces new methods to improve the cancellation of these effects during the inverse filtering process. To this end, the main drawbacks of linear prediction (LP)—a standard method for modeling the vocal tract contribution from the voice signal—are addressed. Two weighted LP strategies based on Gaussian attenuation are proposed to mitigate errors in vocal tract model tuning caused by voice signal samples near glottal closure instants. These strategies extend the original Gaussian LP formulation by incorporating a pitch-adaptive analysis and a quasi-closed phase weighting, significantly enhancing their performance for inverse filtering. Additionally, a robust LP method based on the maximum correntropy criterion is developed. This approach results in a data-driven weighted LP method that automatically emphasizes closed-phase voice signal samples, thereby eliminating the need for prior knowledge of glottal instant locations and improving vocal tract contribution modeling. Finally, a regularized adaptive non-harmonic model is proposed as an alternative for canceling the lip radiation effect and reducing low-frequency distortions produced by inadequate inverse filtering. This approach yields a physiologically representative glottal airflow waveform estimation, characterized by a flat closed phase.	en_EN
dc.description.sponsorship	Consejo Nacional de Investigaciones Científicas y Técnicas	es_ES
dc.format	application/pdf
dc.language.iso	spa	es_ES
dc.rights	info:eu-repo/semantics/openAccess
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject	Filtrado inverso de la voz	es_ES
dc.subject	Análisis de la señal de voz	es_ES
dc.subject	Flujo glótico	es_ES
dc.subject	Predicción lineal ponderada	es_ES
dc.subject	Correntropía	es_ES
dc.subject	Modelado adaptativo no armónico	es_ES
dc.subject	Voice inverse filtering	en_EN
dc.subject	Voice signal analysis	en_EN
dc.subject	Glottal airflow	en_EN
dc.subject	Weighted linear prediction	en_EN
dc.subject	Correntropy	en_EN
dc.subject	Adaptive non-harmonic modeling	en_EN
dc.title	Desarrollo de métodos robustos y fisiológicamente inspirados para el filtrado inverso de la voz	es_ES
dc.title.alternative	Development of robust and physiologically inspired methods for voice inverse filtering	en_EN
dc.type	SNRD	es_ES
dc.type	info:eu-repo/semantics/doctoralThesis
dc.type	info:ar-repo/semantics/tesis doctoral
dc.type	info:eu-repo/semantics/acceptedVersion
dc.contributor.coadvisor	Schlotthauer, Gastón
unl.degree.type	doctorado
unl.degree.name	Doctorado en Ingeniería
unl.degree.mention	Inteligencia Computacional, Señales y Sistemas
unl.degree.grantor	Facultad de Ingeniería y Ciencias Hídricas
unl.formato	application/pdf