El enfoque bayesiano no-paramétrico (BNP) al problema de inferencia estadística cuenta con los métodos y algoritmos para trabajar con medidas de probabilidad sobre espacios de dimensión infinita. Con el devenir de la era moderna de ciencia de datos, la utilidad y alcances de dicho enfoque se han hecho evidentes con su uso en areas como aprendizaje automatizado, bioinformática, ciencias de la salud y finanzas, entre muchas otras. El componente crucial de dicho enfoque es la construcción de distribuciones iniciales no-paramétricas, mismas que se apoyan fuertemente en la teoría de procesos estocásticos.
Una de las direcciones modernas más estudiadas dentro de la comunidad BNP, es la construcción de medidas de probabilidad aleatorias dependientes, e.g. de covariables, tiempo, etc. Esta tendencia ha servido como un mecanismo para explotar la teoría de estadística BNP en la construcción de modelos más realistas, más flexibles y más capaces de adecuarse a la complejidad de una gran diversidad de fenómenos aleatorios. Si bien, en la actualidad los modelos BNP se usan en la construcción y estimación de modelos tan generales como los procesos de difusión con valores en espacios funcionales o distribuciones sobre bosques aleatorios, dichos usos heredan las debilidades y problemáticas inherentes a las distribuciones no-paramétricas más usadas, e.g. el proceso de Dirichlet o las distribuciones iniciales tipo Gibbs.
Esto requiere de la construcción de nuevas medidas de probabilidad aleatorias y sus distribuciones iniciales no-paramétricas, capaces de superar problemas de identificabilidad y de baja-concentración de masa en ciertos conjuntos de interés. Estos problemas atañen repetidamente en diversas aplicaciones de la estadística BNP y causan efectos como el conocido <<label switching>> en implementaciones vía MCMC. En particular, cuando se trabaja con datos espaciales como lo son observaciones de fenómenos aleatorios con una estructura espacio-temporal, estos inconvenientes se magnifican y causan que la estimación y la capacidad predíctiva de los modelos no sean adecuados.
En efecto, un área donde ha habido relativamente poco uso de los métodos BNP es el área de estadística espacial, misma que es de las más prolíficas en la literatura y también de las más usadas en contextos reales. Un componente medular de la mayoría de los modelos estadísticos espaciales, es la construcción de modelos flexibles y realistas de funciones de intensidades,, e.g. que caracterizan procesos puntuales. Aunque la literatura en este tema es rica, los métodos de construcción disponibles no siempre conllevan a una inferencia robusta e interpretable.
Este proyecto tiene como uno de sus objetivos hacer uso de la teoría de procesos estocásticos, en particular los procesos de Markov y estructuras de simetría estocástica, para construir modelos para medidas de probabilidad aleatorias donde las desventajas arriba mencionadas sean mitigadas. El diseño de estos nuevos modelos esta orientado a su aplicación en el área de estadística espacial. En efecto, con investigaciones previas hemos vislumbrado que el uso de distribuciones infinito dimensionales como modelos de medidas de intensidad escaladas en procesos puntuales, prometen mejoras significativas en procesos de estimación y predicción.
Así pues, el objetivo general de este proyecto plantea un avance unificado de las técnicas estadísticas bayesianas no-paramétricas y espaciales. Las investigaciones propuestas prometen el descubrimiento de una prolífica área de investigación que ocuparán a estudiantes e investigadores de la UNAM y México.
En general este proyecto busca consolidar un grupo de investigación capaz de desarrollar técnicas de estadística bayesiana no-paramétrica (BNP) para usarlas en estadística espacial. A corto plazo las contribuciones científicas, e.g. artículos de investigación realizados por el grupo, tendrán como objetivo crear conciencia en la comunidad científica, nacional e internacional, de la necesidad y ventajas de usar modelos espaciales definidos vía MPAs con pesos controlados.
A largo plazo se tendrá un impacto en la comunidad estadística, nacional e internacional, que utiliza modelos espacio-temporales, de tal forma que la generalidad y eficiencia de los métodos BNP sean aprovechados en procesos de estimación y predicción. De manera individual los grupos de estadística BNP y de estadística espacial tienen una fuerte injerencia en la formación de científicos y aplicaciones de estadística nacional. El trabajo interdisciplinario de estos equipos de trabajo, en vista de los objetivos y metas planteados por este proyecto, anticipan un grupo de trabajo fructífero y pertinente en México.
En este sentido se planean las siguientes líneas de contribución:
1. Desarrollo de modelos para medidas de probabilidad aleatorias capaces de controlar los pesos aleatorios en sus representaciones via modelos de especies.
2. Construcción, implementación y aplicación, de modelos para datos espaciales basados en intensidades de procesos puntales con las representaciones desarrolladas en el punto anterior.
3.- De forma paralela, se plantea consolidar el grupo de estudiantes e investigadores que investiga en la intersección de estadística bayesiana no-paramétrica y estadística espacial, dentro de la UNAM y en México.