Nuevo enfoque de aprendizaje semi-supervisado para la identificación de secuencias en bioinformática

Yones, Cristian Ariel

Nuevo enfoque de aprendizaje semi-supervisado para la identificación de secuencias en bioinformática

Biblioteca Virtual
→
Colección de posgrado
→
Facultad de Ingeniería y Ciencias Hídricas
→
Doctorado en Ingeniería
→
Ver ítem

dc.contributor.advisor	Milone, Diego Humberto
dc.contributor.author	Yones, Cristian Ariel
dc.contributor.other	Manavella, Pablo
dc.contributor.other	Grinblat, Guillermo
dc.contributor.other	Chesñevar, Carlos
dc.contributor.other	Carballido, Jéssica
dc.date.accessioned	2018-12-27
dc.date.available	2018-12-27
dc.date.issued	2018-11-22
dc.identifier.uri	http://hdl.handle.net/11185/1159
dc.description	Fil: Yones, Cristian Ariel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
dc.description.abstract	Machine learning has had a great development in recent years and has allowed solving a large number of problems in the most diverse disciplines. However, there are still great challenges to be solved, such as learning in data with a high degree of class imbalance or with very little tagged data. A particular case of application where challenges such as these are presented is in the computational prediction of microRNA (miRNA) sequences. MicroRNAs (miRNA) are a group of small sequences of non-coding ribonucleic acid (RNA) that play a very important role in gene regulation. In recent years, methods have been developed that try to detect new miRNAs using only structure and sequence information, that is, without measuring levels of expression. These types of methods have important practical limitations when they must be applied to real prediction tasks. In this thesis contributions were made in the three stages of the miRNA prediction process. A tool was developed to extract substrings of a complete genome that meet minimum requirements to be potential pre-miRNAs. A tool was developed to calculate most of the characteristics used in the state of the art. The third and main contribution consists of a semi-supervised learning algorithm that allows to make predictions from few positive class examples and the rest of the unlabeled chains. Each designed tool was compared against the state of the art, obtaining better performance rates and shorter execution times.	en_EN
dc.description.abstract	El aprendizaje maquinal ha tenido un gran desarrollo en los últimos años y ha permitido resolver una gran cantidad de problemas en las más diversas disciplinas. Sin embargo, aún quedan grandes desafíos por resolver, como lo es el aprendizaje en datos con alto grado de desbalance de clases o con muy pocos datos etiquetados. Un caso particular de aplicación donde se presentan desafíos como estos es en la predicción computacional de secuencias de microARN (miARN). Los microARN (miARN) son un grupo de pequeñas secuencias de ácido ribonucleico (ARN) no codificante que desempeñan un papel muy importante en la regulación génica. En los últimos años, se han desarrollado métodos que intentan detectar nuevos miARNs utilizando sólo información de estructura y secuencia, es decir, sin medir niveles de expresión. Este tipo de métodos tienen importantes limitaciones prácticas cuando deben aplicarse a tareas de predicción real. En esta tesis se realizaron aportes en las tres etapas del proceso de predicción de miARN. Se desarrolló una herramienta para extraer subcadenas de un genoma completo que cumplan con requerimientos mínimos para ser potenciales pre-miARNs. Se desarrolló una herramienta que permite calcular la mayoría de las características utilizadas en el estado del arte. La tercer y principal contribución consiste en un algoritmo de aprendizaje semi-supervisado que permite realizar predicciones a partir de pocos ejemplos de clase positiva y el resto de las cadenas sin etiqueta. Cada herramienta diseñada fue comparada contra el estado del arte, obteniendo mejores tasas de desempeño y menores tiempos de ejecución.	es_ES
dc.description.sponsorship	Universidad Nacional del Litoral
dc.description.sponsorship	Agencia Nacional de Promoción Científica y Tecnológica	es_ES
dc.format	application/pdf
dc.language	spa
dc.language.iso	spa	es_ES
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject	Machine learning	en_EN
dc.subject	Semi-supervised learning	en_EN
dc.subject	microRNA prediction	en_EN
dc.subject	Whole genome	en_EN
dc.subject	Aprendizaje maquinal	es_ES
dc.subject	Aprendizaje semi-supervisado	es_ES
dc.subject	Predicción de microRNA	es_ES
dc.subject	Genoma completo	es_ES
dc.title	Nuevo enfoque de aprendizaje semi-supervisado para la identificación de secuencias en bioinformática	es_ES
dc.title.alternative	New semi-supervised approach to sequence identification in bioinformatics	en_EN
dc.type	info:eu-repo/semantics/doctoralThesis
dc.type	info:ar-repo/semantics/tesis doctoral
dc.type	info:eu-repo/semantics/acceptedVersion
dc.type	SNRD	es_ES
dc.contributor.coadvisor	Stegmayer, Georgina
unl.degree.type	doctorado
unl.degree.name	Doctorado en Ingeniería
unl.degree.mention	Inteligencia Computacional, Señales y Sistemas
unl.degree.grantor	Facultad de Ingeniería y Ciencias Hídricas
unl.formato	application/pdf
unl.versionformato	1a
unl.tipoformato	PDF/A - 1a