El objetivo de este plan de trabajo es proveer soluciones originales desde la estadística matemática a problemas de regresión y predicción con predictores y/o respuestas pertenecientes a espacios de alta dimensión y/o espacialmente correlacionados. En particular, en problemas de regresión con predictores y/o respuestas pertenecientes a espacios de alta dimensión, cuando la distribución de los datos pueda describirse por medio de modelos gráficos probabilísticos, la propuesta busca explotar la capacidad de modelado junto con las ventajas computacionales que ellos presentan para desarrollar nuevos métodos de regresión eficiente y de reducción suficiente de dimensiones para problemas con datos complejos. La motivación es dar soluciones estadísticamente rigurosas a problemas concretos de las ciencias médicas, ciencias sociales, ciencias de la tierra, entre otras. Estas aplicaciones se caracterizan por presentar variables de distinta naturaleza con una fuerte estructura de dependencia entre ellas, sobredispersión, y/o muchos ceros en las observaciones, que no son abordables con la metodología actual. Además, se busca desarrollar métodos de predicción espacial paramétrica y semiparamétrica para predictores multivariados que puedan llegar a pertenecer a espacios de alta dimensión. Una de las propiedades buscadas a partir de los métodos propuestos es la flexibilidad en términos de las variables a utilizar, las cuales podrán ser continuas, de conteo o categóricas, y de los puntos geográficos necesarios para poder predecir la variable de interés en el sitio no muestreado. Gracias a esa flexibilidad, el nuevo método podrá aplicarse para predecir variables en áreas como ser la ecología, epidemiología, ciencias de la tierra, climatología, ciencias sociales, economía, entre otras. Por ejemplo, en el contexto de medición del bienestar socioeconómico de la población, este método puede ser utilizado como una herramienta actualizable de monitoreo y evaluación de pobreza mediante la construcción de mapas de privaciones socio-económicas locales. En el contexto geoestadístico, el método podrá aplicarse para crear mapas de concentración de ciertos metales en la tierra, como por ejemplo de zinc, a partir de la medición de otros metales, características del suelo y otras variables ambientales.
The objective of this plan is to provide original solutions from the mathematical statistics to regression problems with predictors and/or responses belonging to high-dimensional and/or spatially correlated spaces.In particular, in regression problems with predictors and/or responses belonging to high-dimensional spaces, when the distribution of the data can be described by probabilistic graphic models, the proposal seeks to exploit the modeling capacity together with the computational advantages they present, to develop new efficient regression and sufficient dimension reduction methods for complex data problems. The motivation is to provide statistical rigorous solutions to specific problems of medical sciences, social sciences, earth sciences, among others. These applications are characterized by presenting variables of different nature with a strong structure of dependence among them, overdispersion, and/or many zeros in the observations, which are not approachable with the current methodology. In addition, this plan seeks to develop parametric and semi-parametric spatial prediction methods for multivariate predictors that may belong to high-dimensional spaces. One of the properties sought from the proposed methods is flexibility in terms of the variables to be used, which may be continuous, counting or categorical, and of the geographical points necessary to perform the prediction in non-sampled site. Thanks to this flexibility, the new method can be applied to predict variables in areas such as ecology, epidemiology, earth sciences, climatology, social sciences, economics, among others. For example, in the context of measuring the socioeconomic welfare of the population, this method can be used as an updatable tool for monitoring and assessing poverty by building maps of local socio-economic deprivations. In the geostatistical context, the method can be applied to create maps of concentration of certain metals in the earth, such as zinc, from the measurement of other metals, soil characteristics and other environmental variables. Throughout the execution of the project, efforts will be made to provide comprehensive answers to the problems raised, ranging from the analysis of the theoretical properties of the proposed estimators, tools for their computation and applying the proposed methodologies to the specific problems mentioned above.