Seminario de Probabilidad y Estadística

Viernes 10:30hs - Salón de seminarios del piso 14, CMAT

Contacto: Andrés Sosa (asosa@cmat.edu.uy)

Próximas Charlas

Dia 2019-08-23 10:30:00-03:00
Hora 2019-08-23 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

An improved catalogue of putative synaptic genes defined exclusively by temporal transcription profiles through an ensemble machine learning approach

Flavio Pazos (IIBCE)

Background. Assembly and function of neuronal synapses require the coordinated expression of a yet undetermined set of genes. Previously, we had trained an ensemble machine learning model to assign a probability of having synaptic function to every protein-coding gene in Drosophila melanogaster. This approach resulted in the publication of a catalogue of 893 genes which we postulated to be very enriched in genes with a still undocumented synaptic function. Since then, the scientific community has experimentally identified 79 new synaptic genes. Here we use these new empirical data to evaluate our original prediction. We also implement a series of changes to the training scheme of our model and using the new data we demonstrate that this improves its predictive power. Finally, we added the new synaptic genes to the training set and trained a new model, obtaining a new, enhanced catalogue of putative synaptic genes.

Results. The retrospective analysis demonstrate that our original catalogue was significantly enriched in new synaptic genes. When the changes to the training scheme were implemented using the original training set we obtained even higher enrichment. Finally, applying the new training scheme with a training set including the 79 new synaptic genes, resulted in an enhanced catalogue of putative synaptic genes. 

Conclusions. We show that training an ensemble of machine learning classifiers solely with the whole-body temporal transcription profiles of known synaptic genes resulted in a catalogue with a significant enrichment in undiscovered synaptic genes. Using new empirical data provided by the scientific community, we validated our original approach, improved our model an obtained an arguably more precise prediction. This approach reduces the number of genes to be tested through hypothesis-driven experimentation and will facilitate our understanding of neuronal function.

Dia 2019-08-30 10:30:00-03:00
Hora 2019-08-30 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Optimización para la Simulación

Ebert Brea (.)

Abstract: La simulación de sistemas de eventos discretos ha ocupado, en los últimos años, un
importante lugar en el análisis de sistemas y en la evaluación de tomas de decisiones. Por otra parte, la optimización también ha representado ser una útil herramienta para la búsqueda de soluciones que mejoren el desempeño de los sistemas estudiados. Sin embargo, éstos dos puntos de vistas inicialmente han sido desarrollados separadamente, en donde ambos campos han establecido sus linderos. No obstante, el surgimiento de nuevas aplicaciones a sistemas cada vez más complejos han requerido la vinculación de lo que antes se estudiaban por separado. La motivación este trabajo es presentar los puntos de vistas de las respuestas a las preguntas: ¿Es la simulación la que ha ayudado a la optimización de los sistemas? o por el contrario, ¿Es la optimización la que ha asistido a la experimentación en simulación? En principio podría decirse que las respuestas de estas interrogantes son afirmativas y es en este artículo donde serán  presentadas la justificación de ambas aristas a través de ejemplos prácticos y casos de estudios por una
parte, y de desarrollos de métodos y técnicas, en donde se podrá apreciar que ninguno de los
campos domina, y más aún, ambos coexisten y hoy en día su vinculación ”por” y ”para” son
de gran importancia en la resolución de problemas reales


Charlas Anteriores

Dia 2019-07-05 10:30:00-03:00
Hora 2019-07-05 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Límite fluido y distribución asintótica en un modelo para redes radio cognitivas.

Laura Aspirot (Departamento de Métodos Cuantitativos -- Facultad de Economía y de Administración)

Consideramos una cadena de Markov en tiempo continuo para modelar un sistema con dos tipos de usuarios (primarios y secundarios), donde el sistema tiene capacidad fija y los usuarios primarios tienen preferencia respecto a los secundarios. Para este modelo estudiamos el límite fluido y la distribución asintótica de la cantidad de usuarios de cada tipo, y proponemos criterios de acceso para los usuarios secundarios. En particular, dependiendo de los parámetros del sistema, encontramos distribuciones asintóticas Gaussianas y no Gaussianas. Utilizamos este modelo para establecer criterios de acceso en redes radio cognitivas.

Dia 2019-06-28 10:30:00-03:00
Hora 2019-06-28 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Recurrencia y transitoriedad en el frog model

Nicolás Frevenza (Departamento de Métodos Cuantitativos -- Facultad de Economía y de Administración)

En un grafo cualquiera se considera la siguiente dinámica. En cada vértice se coloca una cantidad de partículas inactivas excepto en un vértice distinguido (raíz) donde se coloca una partícula activa. Las partículas inactivas permanecen quietas mientras que cada partícula activa realiza un paseo aleatorio simple que al encontrarse con partículas inactivas, las activa y éstas comienzan otro paseo aleatorio independiente del resto. A este proceso se lo conoce como frog model y con diferentes variantes ha sido motivo de estudio en los últimos 20 años.

El frog model se dice recurrente si la probabilidad de que la raíz sea visitada una cantidad infinita de veces por partículas activas (frogs), es 1. En caso contrario se dice que es transitorio. La recurrencia y transitoriedad dependen de la configuración inicial, de la geometría del grafo, entre otras cosas.

Dia 2019-06-21 10:30:00-03:00
Hora 2019-06-21 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Grandes desvíos y teoremas de Wschebor

José Chichi León (Instituto de Matemática y Estadística "Prof. Ing. Rafael Laguardia" -- Facultad de Ingeniería)

En esta charla recordaremos teoremas de M. Wschebor sobre incrementos pequeños de procesos con propiedades de escalas y de incrementos estacionarios. A partir de estos viejos resultados establecemos algunos principios de grandes desvíos. El trabajo que se expondrá es un trabajo conjunto con Alain Rouault.

Abstract: We revisit Wschebor’s theorems on small increments for processes with scaling and stationary properties and deduce large deviation principles.

Dia 2019-06-14 10:30:00-03:00
Hora 2019-06-14 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Un test de hipótesis sobre ancestría

Gabriel Illanes (Centro de Matemática - Facultad de Ciencias)

Desde la completación del proyecto "Human Genome Project" en 2003, se ha utilizado la información genética de los individuos para resonder distintas preguntas. Una base de datos muy usada es la del "1000 genomes project"; uno de los usos es es el estudio de las migraciones de distintas poblaciones ancestrales.
En nuestro caso, contamos con la base de datos del proyecto "Urugenomes", disponiendo de la información genética de 20 individuos uruguayos; 10 de ellos declaran tener algún ancestro nativo americano, 10 de ellos declaran tener algún ancestro africano. Dado el tamaño de la base de datos, nos enfocamos en intentar responder preguntas a nivel individual, y no a nivel poblacional.
Para cada uno de estos individuos, asumimos que es una mezcla de tres poblaciones ancestrales (europeos, africanos, y nativos americanos), y utilizamos algoritmos que permiten la identificación de los intervalos de su genoma que corresponden a cada una de esas poblaciones ancestrales. Con esta información, queremos desarrollar un test de hipótesis que permita saber si es posible que un individuo dado tenga un ancestro nativo americano puro "T" generaciones atrás.

Dia 2019-06-07 10:30:00-03:00
Hora 2019-06-07 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

The Statistical Crisis in Science -> no es mi culpa, pero me interesa y qué hago yo en todo esto?

Pablo Inchausti (Centro Universitario Regional del Este - UdelaR)

La crisis de la repetibilidad (la incapacidad de repetir los resultados de experimentos publicados empleando los mismos métodos y tamaños muestrales) ha generado una intensa discusión sobre la fiabilidad de la inferencia estadística. Esta discusión ha abarcado una diversidad de áreas, incluyendo neurociencias, medicina, economía y psicología. Incluso la circunspecta American Statistical Association ha realizado aclaraciones públicas y editado suplementos de su revista (sin mayor éxito hasta ahora). En este contexto, hay tanto oportunidades para realizar cambios fundamentales como la necesidad de implementarlos en los cursos del siglo XXI. En esta charla se discutirán los aspectos mas salientes de esta crisis y algunos tópicos específicos en los que trabajo ahora.

Dia 2019-05-31 10:30:00-03:00
Hora 2019-05-31 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Modelos Generativos usando Auto-Encoders Variacionales

Mario González (Departamento de Matemática y Estadística del Litoral -- UdelaR)

Varios problemas inversos involucrados en la restauración de imágenes requieren de un buen prior estadístico para obtener soluciones de buena calidad. Es común asumir que el conjunto de imágenes naturales forma una subvariedad de dimensión mucho más baja que el espacio ambiente (de gran dimensión). En esta charla, veremos cómo construir un modelo generativo de dicha subvariedad usando un tipo de redes neuronales (los Auto-Encoders Variacionales) y cómo se puede utilizar para regularizar las soluciones de algunos problemas inversos en restauración de imágenes.

Dia 2019-05-24 10:30:00-03:00
Hora 2019-05-24 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Selección de modelos de ritmo para la simulación de lı́neas melódicas

Verónica Rumbo (Centro de Matemática)

Presentamos algunos modelos para describir la altura y el ritmo de melodías musicales, utilizando algunos de ellos para simular melodías con alturas y ritmo aleatorios. Presentamos además una estrategia de comparación de modelos basada en el principio del mínimo largo de descripción (MDL), que aplicamos para comparar los distintos modelos para ritmo estudiados.

Dia 2019-05-17 10:30:00-03:00
Hora 2019-05-17 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Innovative paradigms and architectures for future distribution electricity networks supporting the energy transition

José Horta (Laboratory of Information, Networking and Communication Sciences, Télécom ParisTech, Paris)

Future electricity distribution grids will host an important and growing share of variable renewable energy sources and local storage resources. Moreover, they will face new load structures due for example to the growth of the electric vehicle market. These trends raise the need for new distribution grid architecture and operation paradigms to keep the grid stable and to ensure quality of supply.

We present the results of a thesis aimed to facilitate the development of innovative services for electricity customers to become prosumers playing a key role on the support of the energy transition. We propose an architecture for the exchange of energy and flexibility services with neighbors, service providers and network operators. In particular, we propose three complementary demand side management mechanisms, enabling prosumers to reduce their electricity bill by sharing renewable energy among their neighbors on an hour-ahead local market. A dynamic phase allocation mechanism tied to the market results is proposed to keep the load balanced among the three phases of the distribution grid. Finally, we cope with forecast errors by enabling prosumers to participate on a real-time reserve for the Distribution System Operator. The combination of the proposed local energy market, dynamic phase switching and game-based real-time control mechanisms provide solutions for major distribution grid challenges without requiring important infrastructure investments, allowing to effectively increase the capacity of distribution grids for hosting renewable energy and supporting the energy transition.

Dia 2019-05-10 10:30:00-03:00
Hora 2019-05-10 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Optimal stopping for diffusion with discontinuous coefficients

Ernesto Mordecki (Centro de Matemática -- Facultad de Ciencias)

We show through examples that simple discontinuity of the coefficients of a diffusion produce non connected optimal stopping regions for simple payoffs.

Our examples comprise the broken drift diffusion (i.e. a diffusion with piecewise constant drift coefficient changing at zero) and a linear payoff and the oscillating brownian motion (i.e. a diffusion with piecewise constant diffusion coefficient changing at zero) with a quadratic payoff.

Both examples show the same behaviour. This is joint work with Paavo Salminen.

References

1) Optimal stopping of Brownian motion with broken drift. Ernesto Mordecki Paavo Salminen
High Frequency. Pages: 113-120. First Published: 11 April 2019

2) Optimal stopping of oscillating Brownian motion. Ernesto Mordecki, Paavo Salminen.
arXiv:1903.01457 [math.PR]

Dia 2019-05-03 10:30:00-03:00
Hora 2019-05-03 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Clustering

Ricardo Fraiman (Centro de Matemática - Facultad de Ciencias)

Haremos un review de los métodos mas importantes y sus propiedades y problemas asociados.

Dia 2019-04-26 10:30:00-03:00
Hora 2019-04-26 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Funciones armónicas y envolventes convexas en árboles

Nicolás Frevenza (Universidad de Buenos Aires - CONICET y FCEA - UdelaR)

En esta charla se presentará una serie de resultados relativos a funciones armónicas sobre árboles regulares (un grafo infinito en el que cualesquiera dos vértices están conectados por exactamente un camino y cada vértice pose un número fijo de sucesores). Más concretamente, se hablará del problema de Dirichlet en el árbol, es decir, dada una función definida en el borde del árbol, encontrar una función armónica en todo el árbol que coincida con ella en el borde. Luego analizaremos cómo definir el mapa Dirichlet-to-Neumann en este contexto.

En una segunda parte se presentarán nociones de funciones convexas en árboles y se estudiará el problema de hallar la envolvente convexa de una función en el árbol y cómo este problema se relaciona con ecuaciones de valor medio.

Si usted se pregunta dónde está la probabilidad en esta charla, deberá esperar hasta el viernes.

Estos resultados son parte de trabajos con Leandro Del Pezzo y Julio Rossi de la Universidad de Buenos Aires y CONICET.

Dia 2019-04-12 10:30:00-03:00
Hora 2019-04-12 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Estadística para datos en espacios no euclídeos: Algunas contribuciones

Leonardo Moreno (Departamento de Métodos Cuantitativos -- Facultad de Ciencias Económicas y de Adminsitración)

Como forma de titular esta tesis, podemos decir que intenta aportar sobre diversos aspectos de la estadística, en particular cuando los datos toman valores sobre espacios euclideanos de dimensión elevada o ciertos espacios no euclideanos, donde la estadística clásica no esta diseñada para brindar respuestas eficientes. En tal sentido un primer objetivo es poder extender, mediante el uso de proyecciones unidireccionales al azar, algunas pruebas de hipótesis (una de simetría central y otra de independencia) a espacios dimensión elevada o infinita (espacios funcionales). Como segundo objetivo se brindan respuestas a determinados problemas donde los datos se encuentran sobre una variedad Riemanniana. Se generaliza una concepto de profundidad estadística a datos que pertenecen a una variedad Riemanniana. Además se extiende el análisis de sensibilidad sobre un código con entradas estocásticas, pero ahora cuando el output esta en una variedad Riemanniana. Son probadas aquellas propiedades deseables de las estadísticos planteados, la consistencia y la distribución asintótica de sus respectivos estimadores.

Resumen_Tesis Moreno.pdf
Dia 2019-04-05 10:30:00-03:00
Hora 2019-04-05 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Critical points of random fields.

Jean Marc Azais (Toulouse - Francia)

The variation of the mean number of critical points as a function of the index is first studied using random matrices tools. In a second part, we study attraction or repulsion between these points again as a function of index. A measure is the correlation function
Our results extend the results of Belyaev, Cammarota and Wigman (2017) to dimension greater than 2, and to general isotropic Gaussian random fields, By specifying the indexes, we shows that the attraction between critical points that occurs when the dimension is greater than 2 is due to attraction between critical points with adjacent indexes.

Dia 2019-03-29 10:30:00-03:00
Hora 2019-03-29 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Dimensión de medidas estacionarias para productos de matrices i.i.d. en dimensión 3

Pablo Lessa (IMERL, Universidad de la República)

Discutiremos el resultado de Hochman y Solomyak sobre dimensión de Hausdorff de medidas estacionarias para productos de matrices 2x2. Exploraremos lo que se sabe en dimensión 3 y su relación con resultados clásicos de Guivarc'h, Raugi, Goldsheid, Margulis, y Ledrappier.

Dia 2019-03-22 10:30:00-03:00
Hora 2019-03-22 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Weak convergence of empirical Wasserstein type distances between to real distributions

Jean-Claude Fort (Institut de Mathematiques de Toulouse -- Francia)

We estimate the Wasserstein type distance between two continuous distributions $F$ and $G$ on $\mathbb R$ such that the set $\{F = G\}$ is a finnite union of intervals, possibly empty or $\mathbb R$. The positive cost function $\rho$ is not necessarily symmetric and the sample may come from any joint distribution $H$ on $\mathbb R^2$ having marginals $F$ and $G$ with light enough tails with respect to $\rho$ . The rates of weak convergence and the limiting distributions are derived in a wide class of situations including the classical distances $W_1$ and $W_2$. The key new assumption in the case $F = G$ involves the behavior of $\rho$ near $0$, which we assume to be regularly varying with index ranging from $1$ to $2$. Rates are then also regularly varying with powers ranging from $1/2$ to $1$ also affecting the limiting distribution, in addition to $H$

Dia 2019-03-15 10:30:00-03:00
Hora 2019-03-15 10:30:00-03:00
LugarSalón de seminarios del piso 14, CMAT

Uniform concentration and symmetrization for weakly interacting statistics

Andreas Maurer (Munich -- Alemania)

The method which uses Rademacher or Gaussian averages to bound the expected suprema of empirical processes is extended to the case where the sample average is replaced by a nonlinear statistic. The bound is controlled by Lipschitz seminorms involving single and mixed partial differences of the function in question. Tight bounds are obtained for U-statistics, smoothened L-statistics and error functionals of l_2 regularized algorithms.