Biblioteca Virtual

Técnicas de aprendizaje maquinal para separación ciega de fuentes sonoras con aplicación al reconocimiento automático del habla

Mostrar el registro sencillo del ítem

dc.contributor.advisor Milone, Diego Humberto
dc.contributor.author Di Persia, Leandro Ezequiel
dc.contributor.other Cosseau, Juan
dc.contributor.other Muravchik, Carlos
dc.contributor.other Gómez, Juan Carlos
dc.contributor.other Giovanini, Leonardo Luis
dc.date.accessioned 2010-07-08
dc.date.available 2010-07-08
dc.date.issued 2009-03-26
dc.identifier.uri http://hdl.handle.net/11185/182
dc.description Fil: Di Persia, Leandro Ezequiel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
dc.description.abstract In the last decades a new problem related to machine learning and signal processing has emerged in many disciplines: the blind source separation problem. The blind source separation technique aims to segregate the sources that contribute to some variation of a physical quantity, given a set of measurements of the global variation produced by all sources at a time. One particular application of the blind source separation methods is the Automatic Speech Recognition, which can be defined as the task of determining the text that corresponds to a given spoken utterance. This kind of systems have reached a maturity point but they still suffer from a strong drawback: they cannot adequatelly manage the existence of noise or competing sources in the input. This doctoral dissertation presents several advances in the technique of audio source separation in reverberat conditions, using independent component analysis in the time-frequency domain. Three methods were developed in order to produce a better quality of separation and, at the same time, to reduce the processing times. The proposed algorithms were evaluated under realistic conditions such as different environments and different kind and power of competing sources. For this purpose we used two evaluation alternatives, objective quality measures of the resulting signal and the performance in the application of interest, that is, automatic speech recognition. The results for the different approaches show the possibility of getting through the dilemma between resulting quality and requiered processing time, converging to a very fast and high quality separation method. en
dc.description.abstract En las últimas décadas el problema de separación ciega de fuentes ha emergido en varias disciplinas relacionadas con el procesamiento digital de señales y el aprendizaje maquinal. En la resolución de este problema el objetivo es obtener por separado las fuentes que generaron en conjunto determinada variación de alguna cantidad física, dado un conjunto de mediciones del efecto conjunto de todas las fuentes. Entre las aplicaciones de interés para tal técnica está el reconocimiento automático del habla, en el cual se busca obtener una transcripción escrita a partir del habla emitida por una persona. Estos sistemas han alcanzado un grado de madurez pero todavía sufren de una gran desventaja: no pueden manejar adecuadamente la existencia de ruido en la entrada. En esta tesis se proponen tres técnicas basadas en el análisis de componentes independientes en el dominio frecuencial, para producir una efectiva separación de las fuentes sonoras presentes en un cuarto con reverberación. Para la evaluación del desempeño de las mismas se realizó un estudio exhaustivo de medidas objetivas de calidad, y se desarrolló un protocolo experimental que permite una evaluación comparativa del desempeño. Además se realizó la evaluación de los mismos mediante la tasa de reconocimiento de un sistema de reconocimiento automático del habla, y se evaluó también el tiempo de cálculo. Los resultados se contrastaron con los de métodos del estado del arte para esta tarea. Se verificó que todos los métodos propuestos produjeron importantes mejoras tanto en la calidad objetiva como en la tasa de reconocimiento. es
dc.description.sponsorship Consejo Nacional de Investigaciones Científicas y Técnicas
dc.description.sponsorship Agencia Nacional de Promoción Científica y Tecnológica es
dc.format application/pdf
dc.format.mimetype application/pdf
dc.language eng
dc.language.iso eng es
dc.rights info:eu-repo/semantics/openAccess
dc.rights Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject Blind source separation en
dc.subject Independent component analysis en
dc.subject Reverberation en
dc.subject Ambient noise en
dc.subject Robust speech recognition en
dc.subject Objective quality evaluation en
dc.subject Separación ciega de fuentes sonoras es
dc.subject Análisis de componentes independientes es
dc.subject Reverberación es
dc.subject Ruido del ambiente es
dc.subject Reconocimiento robusto del habla es
dc.subject Evaluación objetiva de calidad es
dc.title Técnicas de aprendizaje maquinal para separación ciega de fuentes sonoras con aplicación al reconocimiento automático del habla es
dc.title.alternative Machine learning techniques for audio blind source separation applied to automatic speech recognition en
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:ar-repo/semantics/tesis doctoral
dc.type SNRD
dc.type info:eu-repo/semantics/acceptedVersion
dc.type Thesis es
dc.contributor.coadvisor Yanagida, Masuzo
unl.formato application/pdf
unl.versionformato 1a
unl.tipoformato PDF/A-1a


Ficheros en el ítem

Este ítem aparece en

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess

Buscar en la biblioteca