Seminario de Postgrado en Estadística

Los Seminarios de Postgrado en Estadística se llevan a cabo los días martes a las 14.15hrs. en la sala 3 de la Facultad de Matemáticas UC. Son una instancia para compartir intereses de investigación entre estudiantes y profesores.

2017-12-07
14.15hrs.
Santiago Lozano. Estudiante, Magister en Estadística UC
Cadenas de Markov restringidas: una aplicación a la generación de melodías
Sala 3, Facultad de Matemática UC
Abstract:
Este trabajo presenta una manera de generar secuencias melódicas basadas en cadenas de Markov restringidas. Con tal objetivo se explica la teoría musical necesaria, así como la teoría básica de cadenas de Markov relevante para este trabajo. Además, se estudia la propuesta de Pachet, Roy & Barberi de cadenas de Markov restringidas, publicada bajo el título Finite-Length Markov Processes with Constraints. 

El producto final del trabajo es la programación del algoritmo que permite generar secuencias melódicas, contenida en el paquete MarkovMusic. El trabajo incluye como ejemplo una de las melodías generadas con una cadena de Markov restringida de orden 2.

2017-11-30
14.30hrs.
Alberto Castro. Estudiante, Magister en Estadística UC
Métodos de machine learning, redes neuronales, para la modelación de series de tiempo
Sala 3, Facultad de Matemática UC
Abstract:
En esta presentación se realiza una introducción general a las redes neuronales y su aplicación a la estimación de series de tiempo, de manera específica a series financieras.
La primera sección de la presentación corresponde a la descripción de los conceptos de "inteligencia artificial" y "machine learning", y como se mezclan distintas visiones de estos frameworks de análisis de datos, por ejemplo usando redes neuronales.
En la segunda sección se explica el modelo base de una red neuronal y su formulación como un modelo estadístico estándar.
Se presentan entonces los modelos de series de tiempo GARCH, y su uso en la modelación y estimación de series financieras, además de la modelación de este tipo de series en base a redes neuronales. Se desarrolla un ejemplo de comparación del desempeño de ambos frameworks, redes neuronales y GARCH, para predicciones.
La presentación finaliza con la revisión de ventajas, desventajas y limitaciones de las comparaciones entre las dos metodologías presentadas.
2017-11-02
14.15hrs.
Rodrigo Rubio. Estudiante, Doctorado Estadística UC
Diagonal Distributions
Sala 3, Facultad Matemática UC
Abstract:
Abstract: We introduce the diagonal distributions as an extension of marginal distributions. The main diagonal is studied in detail, which consists of a mean-constrained univariate distribution function on [0, 1], which summarizes key features on the dependence structure, and whose variance connects with Spearman’s rho. Mean-constrained histograms are developed as simple estimators for the main diagonal. Data examples are used to illustrate key methods, concepts, and ideas.

Keywords: Copula; Dependence Modeling; Marginal distribution; Mean-constrained inference; Spearman's rho.
2017-10-05
14.00hrs.
Fernando Quintana. Departamento de Estadística, Pontificia Universidad Católica de Chile
Determinantal point process mixtures via spectral density approach
Sala 3, Facultad de Matemática UC
Abstract:
We consider mixture models where location parameters are a priori encouraged to be well separated. We explore a class of determinantal point process (DPP) mixture models, which provide the desired notion of separation or repulsion. Instead of using the rather restrictive case where analytical results are partially available, we adopt a spectral representation from which approximations to the DPP density functions can be readily computed. For the sake of concreteness the presentation focuses on a power exponential spectral density, but the proposed approach is in fact quite general. We later extend our model to incorporate covariate information in the likelihood and also in the assignment to mixture components, yielding a trade-off between repulsiveness of locations in the mixtures and attraction among subjects with similar covariates. We develop full Bayesian inference, and explore model properties and posterior behavior using several simulation scenarios and data illustrations.
2017-09-07
15.30hrs.
Mauricio Castro. Departamento de Estadística, Pontificia Universidad Católica de Chile
Censored mixed-effects models for irregularly observed repeated measures with applications to HIV viral loads
Sala 3, Facultad de Matemática UC
Abstract:

In some acquired immunodeficiency syndrome (AIDS) clinical trials, the human immunodeficiency virus-1 ribonucleic acid measurements are collected irreg- ularly over time and are often subject to some upper and lower detection limits, depending on the quantification assays. Linear and nonlinear mixed-effects models, with modifications to accommodate censored observations, are routinely used to analyze this type of data (Vaida and Liu, J Comput Graph Stat 18:797–817, 2009; Matos et al., Comput Stat Data Anal 57(1):450–464, 2013a). This paper presents a framework for fitting LMEC/NLMEC with response variables recorded at irregular intervals. To address the serial correlation among the within-subject errors, a damped exponential correlation structure is considered in the random error and an EM-type algorithm is developed for computing the maximum likelihood estimates, obtaining as a byproduct the standard errors of the fixed effects and the likelihood value. The proposed methods are illustrated with simulations and the analysis of two real AIDS case studies.

Joint work with Larissa A. Matos (UNICAMP) and Victor H. Lachos (UCONN).

2017-08-17
14.00hrs.
Miguel Uicab . Estudiante, Doctorado Estadística UC
Aplicación de estadística circular en el estudio de la incidencia de dengue en Yucatán, México.
Sala 3, Facultad de Matemática UC
Abstract:

La estadística circular tiene como objeto el estudio de datos a los cuales, a cada uno de ellos, se le asocia una dirección (ángulo), y ésta, a su vez, se identifica con un punto en la circunferencia unitaria, de ahí que reciben el nombre de datos circulares. Estos datos incluyen direcciones medidas usando la brújula y el transportador, así como observaciones provenientes del reloj y de fenómenos periódicos a través del tiempo. Los métodos estadísticos clásicos son inadecuados para analizar este tipo de datos, ya que no toman en cuenta su naturaleza periódica, por lo que se han diseñado estadísticos descriptivos, distribuciones de probabilidad, pruebas de hipótesis y demás herramientas estadísticas específicas para datos circulares.

El dengue en el estado mexicano de Yucatán ha permanecido hasta la presente fecha en forma endémica. La incidencia de dengue en aquel estado es un fenómeno periódico, pues su ocurrencia depende, en gran medida, de la temporada de lluvias presente cada año en el estado.

El presente trabajo pretende mostrar la aplicación de la herramienta que ofrece la estadística circular, en el estudio del dengue en Yucatán, al dar una descripción de la incidencia de la enfermedad y hacer inferencia estadística acerca de ella. Para tal fin, se han considerado períodos anuales de estudio que se establecen entre los años 2009 y 2017. Un período de estudio consiste en analizar los casos de dengue, registrados semanalmente, que suceden entre el mes de mayo de un año y el mes de abril del año siguiente. Para cada período de estudio, se han realizado un análisis descriptivo y el ajuste de un modelo circular de probabilidad. En cuanto al análisis descriptivo, se hecho uso de la representación gráfica de datos circulares, dada por los diagramas circular y de rosa, y se han calculado estadísticos descriptivos circulares. Para la modelación, se han considerado modelos clásicos y recientes reportados en la literatura de estadística circular, entre las que se encuentran la distribución von Mises (o Normal Circular), la familia de    distribuciones simétricas Jones-Pewsey y la familia de distribuciones flexibles Inversas Batschelet.

Como resultado, se han observado estructuras de comportamiento entre los períodos de estudio analizados, que podrían usarse para llevar a cabo acciones de lucha antivectorial más eficientes.

(Algunas) Referencias

Jones, M. y Pewsey, A. (2005). A family of symmetric distributions on the circle. Journal of the American Statistical Association, 100(472),1422-1428.

Jones, M. y Pewsey, A. (2012). Inverse Batschelet Distributions for Circular Data. Biometrics, 68(1), 183-193.

Mardia, K. V. y Jupp, P. E. (1999). Directional statistics. John Wiley & Sons. Pewsey, A. (2002). Testing circular symmetry. The Canadian Journal of Statistics, 30(4), 591-600.

Pewsey, A., Neuhauser, M., y Ruxton, G. D. (2013). Circular statistics in R. Oxford University Press.

2017-05-24
14.30hrs.
Gabriel Muñoz. Estudiante, Doctorado Estadística UC
Modelos estadísticos en educación: Modelos Rasch y Espacios de conocimiento, parámetros de interés y parámetros identificados
Sala 3, Facultad de Matemática UC
Abstract:
Los modelos Rash han sido ampliamente estudiados y constantemente actualizados a través de la incorporación de nuevos parámetros, tanto en sus versiones de efectos fijos como aleatorios. Por otro lado, la incorporación de modelos estadísticos en Espacios de conocimiento, probablemente no ha gozado de protagonismo que, desde mi punto de vista, merecen. En esta charla se hará una breve explicación de los parámetros de interés y los parámetros identificados de modelos tipo Rasch y modelos estadísticos en Espacios de conocimiento.
2017-05-10
14.30hrs.
Francisca Calderón. Estudiante, Doctorado Estadística UC
Análisis psicométrico de instrumentos de medición de variables latentes. Caso: ?Test habilidades cognitivas? enfoque clásico y teoría de respuesta al ítem con implementación en software R
Sala 3, Facultad de Matemática UC
Abstract:

Se presenta el estudio y análisis psicométrico de un instrumento  orientado a la medición de las competencias lectoras en nivel NB2 de Enseñanza Básica. En este contexto, se define el objetivo de evaluar las características psicométricas que posee el instrumento. La metodología utilizada para dar cuenta del estudio se basa en dos enfoques complementarios en el área de la psicometría: Teoría clásica de los Test (TCT) y Teoría de Respuesta al Ítem (IRT). Su implementación se realizó mediante el programa estadístico R,  de disposición gratuita. Resultado de esta investigación surgen tanto la validación efectiva del instrumento “Prueba Habilidades Cognitivas” como una experiencia de aplicación práctica que consagra al software R como alternativa eficaz en el tratamiento y análisis de instrumentos de medición de variables latentes, en contraste con el software especializado PARSCALE. Además, se concluye la existencia de alta asociación entre los coeficientes de los ítems y la habilidad de los sujetos, estimados mediante ambos programas computacionales.

2017-04-26
14.30hrs.
Eduardo Alarcón. Estudiante, Doctorado en Estadística UC
Test de hipótesis que verifica la 2da ley generalizada de Chargaff
Sala 3, Facultad de Matemáticas UC
2016-12-13
14.15hrs.
Karol Santoro. Estudiante Doctorado en Estadística, UC
Modelos con errores de medicion usando distribuciones normales de dos partes
Sala 3, Facultad de Matemática UC
2016-12-06
14.15hrs.
Felipe Elorrieta. Estudiante Doctorado Estadística, UC
A Machine Learned Classifier for RR Lyrae in the VVV Survey
Sala 3, Facultad de Matemática UC
2016-11-29
14.15hrs.
Luis Gutiérrez. Departamento de Estadística, Universidad Católica de Chile
Enfoques Bayesianos para el analisis estadistico de la forma de los objetos
Sala 3, Facultad de Matemática UC
2016-11-22
14.15hrs.
Giovanni Motta. Departamento de Estadística, Universidad Católica de Chile
Semi-parametric dynamic factor models for non-stationary time series
Sala 3, Facultad de Matemática UC
Abstract:

A novel dynamic factor model is introduced for multivariate non-stationary time series. In a previous work, we have developed asymptotic theory for a fully non-parametric approach based on the principal components of the estimated time-varying covariance and spectral matrices. This approach allows both common and idiosyncratic components to be non-stationarity in time. However, a fully non-parametric specification of covariances and spectra requires the estimation of high-dimensional time-changing matrices. In particular when the factors are loaded dynamically, the non-parametric approach delivers time-varying filters that are two-sided and high-dimensional. Moreover, the estimation of the time-varying spectral matrix strongly depends on the chosen bandwidths for smoothing over frequency and time. As an alternative, we propose a new approach in which the non-stationarity in the model is due to the low-dimensional latent factors. We distinguish between the (double asymptotic) framework where the dimension of the panel is large, and the case where the cross-section dimension is finite. For both scenarios we provide identification conditions, estimation theory, simulation results and applications to real data.

2016-11-15
14.15hrs.
Tamara Fernández. Department of Statistics, University of Oxford
Gaussian processes for survival analyis
Sala 3, Facultad de Matemática UC
Abstract:
We introduce a non-parametric Bayesian model for Survival data which places a function of a Gaussian process as prior over the hazard function. This model is based on the "Sigmoidal Gaussian Cox Process" proposed by Adams, Murray and Mackay. Exact inference in this model is made feasible by using a data augmentation scheme based on Poisson thinning studied by Rao and Teh. The inference mechanism can be easily modified to incorporate censoring and covariates. Additionally, we study properties of the prior, in particular we provide general conditions to ensure that our prior defines proper Survival functions almost surely and we show that such conditions limit the flexibility of the model. Furthermore, under the appropriate assumptions we prove posterior consistency on the real line. Finally, we provide some simulations to exhibit the performance of our model in practice.

Esta presentacion esta basada los siguientes trabajos,

https://arxiv.org/pdf/1611.00817v1.pdf  
NIPS 2016

https://arxiv.org/pdf/1611.02335v1.pdf  
Unpublished draft paper
2016-11-08
14.15hrs.
Luz Adriana Pereira. Estudiante Doctorado en Estadística, UC
Costos de Garantía para un sistema k de N bajo aproximación de caja negra y física
Sala 3, Facultad de Matemática UC
Abstract:
Se comparan y estudian vía simulación los efectos del nivel de información sobre los procesos de costos de garantía y sus distribuciones, para un sistema coherente de componentes iid en una estructura k de N, cuando los procesos de falla/reparo son observados bajo la aproximación de caja negra vs. la aproximación física. La política de garantía considerada corresponden a la política tipo reparación/sustitución gratuita (FRW) con renovación. El modelo de falla estudiado sigue el modelo de falla general BBS. Las comparaciones de los procesos de costos y sus distribuciones bajo las dos aproximaciones citadas son realizadas a través de pruebas estadísticas para igualdad distribucional, hallándose diferencias estadísticas importantes.
2016-10-25
14.15hrs.
Jorge González. Departamento de Estadística, Universidad Católica de Chile
Back to the future: the DeLorean meets statistics
Sala 3, Facultad de Matemática UC
2016-10-20
14.30hrs.
Bastian Galasso-Díaz. Estudiante Doctorado en Estadística, UC
BAYESIAN FLEXIBLE MODELING FOR FAMILIES OF RANDOM DENSITIES
Sala 5, Facultad de Matemáticas UC
2016-09-27
14.15hrs.
Natalia Venegas. Doctorado Estadística, Pontificia Universidad Católica
Comparación de Métodos de Medición Con Un Gold-Standard
Sala 3, Facultad de Matemática UC
2016-09-13
14.15hrs.
Jose Quinlan . Pontificia Universidad Católica de Chile
Parsimonious Hierarchical Modeling Using Repulsive Distributions
Sala 3, Facultad de Matemáticas UC
2016-09-06
14.15hrs.
Cesar Ojeda. Pontificia Universidad Católica de Chile
Prueba de eficiencia débil en el mercado accionario colombiano
Sala 3, Facultad de Matemáticas UC
Abstract:
Este trabajo prueba la hipótesis de eficiencia débil al comprobar la hipótesis de martingala en diferencias en los retornos del Índice General de la Bolsa de Valores de Colombia, IGBC. Se considera una estructura de dependencia condicional de primer orden mediante el modelo autoregresivo fraccionalmente  integrado de medias móviles, ARFIMA, y de segundo orden con el modelo hiperbólico asimétrico potencial autorregresivo condicionalmente heterocedástico, HYAPARCH, el cual captura todos los hechos estilizados encontrados en la investigación empírica. Los resultados rechazan la hipótesis de eficiencia débil al mostrar que el proceso generador de los retornos parece obedecer a un modelo autorregresivo fraccionalmente integrado, ARFI, en media condicional y a un hiperbólico asimétrico autorregresivo condicionalmente heterocedástico, HYAGARCH, en varianza condicional.