Aprendizaje de distancias basadas en densidad y aplicaciones al análisis topologico de datos

Dia 2023-04-14 10:30:00-03:00
Hora 2023-04-14 10:30:00-03:00
Lugarla charla sera virtual

Aprendizaje de distancias basadas en densidad y aplicaciones al análisis topologico de datos

Ximena Fernandez (Durham University, Reino Unido)

En esta charla presentaré un método para inferir características de la topología de una variedad en Rn a partir de una muestra aleatoria finita de sus puntos. La idea principal es considerar una métrica en la muestra, conocida como distancia de Fermat, para estimar de manera robusta la homología del espacio subyacente. Veremos que el espacio métrico dado por la muestra con la distancia de Fermat converge casi seguro (en el sentido de Gromov-Hausdorff) a la variedad dotada de cierta métrica Riemanniana ligada a la densidad de la muestra. De este modo, se logra un estimador que recupera la geometría de la variedad módulo una deformacion asociada a la densidad que genera la muestra. 

Como consecuencia de la teoría de homología persistente, deducimos la convergencia de estimadores de la homología de la variedad subyacente mediante los llamados diagramas de persistencia.  Mostraré que estos diagramas tienen buenas propiedades: son robustos a la presencia de outliers en los datos y menos sensibles al embedding de la variedad en el espacio ambiente. Como aplicación de estas ideas, exhibiré algunos ejemplos concretos de análisis de datos reales asociados a series temporales.

Este es un trabajo conjunto con E. Borghini, G. Mindlin y P. Groisman: "Intrinsic persistent homology via density-based metric learning" Journal of Machine Learning Research (in press)