Seminario de Estadística


2010-11-19
Alessandra Guglielmi. Departamento de Matemática, Politécnico de Milano
A Bayesian approach to hospital profiling and survival probability estimation for acute myocardial infarction patients in Milano.
Sala 2 (Víctor Ochsenuius)- Facultad de Matemáticas - PUC
Abstract:
Studies of variations in health care utilization and outcome involve the analysis of multilevel clustered data, considering in particular the estimation of a cluster-specific adjusted response, covariates effect and components of variance. Besides reporting on the extent of observed variations, those studies quantify the role of contributing factors including patients´ and providers´ characteristics. In addition, they may assess the relationship between health-care process and outcomes. We consider Bayesian generalized linear mixed models to analyze MOMI$^2$ (MOnth MOnitoring Myocardial Infarction in MIlan) data on patients admitted with ST-elevation myocardial infarction di
2010-10-29
Jeremie Bigot. Institut de Mathematique de Toulouse, Universite de Toulouse Iii, France
Estimation of high-dimensional covariance matrices
Sala 2 (Víctor Ochsenius)- Facultad de Matemáticas - UC - 12:00 a 13:00 Hrs.
Abstract:
Abstract: In this talk, we consider the problem of estimating the covariance matrix of a stochastic process corrupted by an additive noise. We propose to estimate the covariance matrix in a high-dimensional setting when the number of observations is smaller than the number of parameters to estimate, under the assumption that the process has a sparse representation in a large
dictionary of basis functions. Using a matrix regression model, we propose a new methodology for high-dimensional covariance matrix estimation based on empirical contrast regularization by a group Lasso penalty. Using such a penalty, the method selects a sparse set of basis functions in the dictionary used to approximate the process, leading t
2010-10-08
Luis Gutiérrez. Pontificia Universidad Católica de Chile
Multivariate Bayesian Models for Authentication of Food and Beverages
Sala 2 (Víctor Ochsenius)- Facultad de Matemáticas - UC - 12:00 a 13:00 hrs
2010-09-24
María José García. P. Universidad Católica de Chile y K.u.leuven, Bélgica
Uni- and Multi-variate Modelling of Monotone Disease Processes in Presence of Misclassification
Sala 2 (Víctor Ochsenius)- Facultad de Matemáticas - UC - 12:00 a 13:00 hrs
Abstract:
Motivated by a longitudinal oral health study, the Signal-Tandmobiel®, we propose end evaluate the performance of univariate and multivariate binary Markov models in which the unobserved response variables are subject to an unconstrained misclassification process and follow a monotone or progressive behavior.

In the univariate case, we provide theoretical and empirical arguments to show that a simple version of the model can be used to estimate the prevalence, incidence and misclassification parameters without the need of external information. We propose an extension of the simple version of the binary Markov model to describe the relationship between covariates and prevalence a
2010-09-10
Ernesto San Martín. Pontificia Universidad Católica de Chile
Identificación de Modelos Rasch: desde resultados de imposibilidad a posibles soluciones
Sala 2 (Víctor Ochsenius)- Facultad de Matemáticas - 12:00 a 13:00 hrs
Abstract:
Resumen:
Consideremos un modelo Rasch en el cual la distribución del efecto aleatorio y los parámetros que caracterizan los ítemes, son los parámetros de interés. Se muestra, en primer lugar, que estos parámetros no pueden identificarse en un contexto real. Se muestra también qué características de la distribución que genera el efecto aleatorio pueden identificarse, discutiendo además la significación estadística de estos sub-parámetros, así como la de los parámetros que caracterizan a los ítemes. Dado este resultado de imposibilidad, y argumentando acerca de la necesidad práctica de identificar la distribución del efecto aleatorio, se presentan dos salidas: la primera tiene relación con la necesidad de especificar estos modelos de forma completamente paramétrica y, por tanto, se estudia la identificación en ese contexto; se proporcionan algunos problemas que se consideran abiertos, y extensiones a modelos estructurales Rasch explicativos. La segunda salida está relacionada con la formulación y solución de un problema inverso mal-puesto (ill-posed); en este seminario, se presenta la formulación de dicho problema, además de los aspectos que están abiertos a ser desarrollados
2010-06-30
Jorge González. Centro de Medición Mide UC
Statistical Modeling and Estimation: Meeting The Requirements of Different Domains
Auditorio Ninoslav Bralic - UC
2010-06-25
Garritt Page. Duke University
Bayesian Local Contamination Models for Multivariate Outliers
Sala de Seminario de Astronomia - P. Universidad Católica de Chile
Abstract:
Abstract: It is not uncommon for there to exist observations that are quite unlike the majority in studies where data are generated from multiple locations or sources. Motivated by the application of establishing a reference value in an inter-laboratory setting when outlying labs are present, we propose a local contamination model that is able to ac-commodate unusual multivariate realizations in a _exible way. The proposed method models the process level of a hierarchical model using a mixture with a parametric component and a possibly non-parametric contamination. Much of the _exibility in the methodology is achieved by allowing varying random subsets of the elements in the lab-speci_c mean vectors to be allocated to the contamination component. The methodology is compared to
2010-06-18
Fernando Quintana. Pontificia Universidad Católica de Chile
Análisis Bayesiano No Paramétrico de Datos Longitudinales con Estructura Autoregresiva Latente, y Aplicaciones
Sala 2 (Víctor Ochsenius) - Facultad de Matemáticas
Abstract:
Resumen:
Este trabajo considera un modelo jerárquico para datos longitudinales irregulares, usando una mezcla de procesos de Dirichlet. La estructura autoregresiva latente sirve para agrupar perfiles, de modo de obtener diversos grupos con estructuras de correlación diferentes. El modelo resulta útil para estimar curvas promedio y también para estimar matrices de covarianza en general. La aplicación se ilustra con datos de hormonas para sujetos que efectúan la transición hacia la menopausia.
2010-05-14
Alejandro Jara. Pontificia Universidad Católica de Chile
Una clase de mezclas de procesos tail-free dependientes
Sala 2 (Víctor Ochsenius) - Facultad de Matemáticas - UC - 12:00 a 13:00 Hrs.
Abstract:
Resumen: En esta charla se introducirá una clase nueva de procesos tail-free dependientes como modelo de probabilidad para medidas de probabilidad relacionadas por uno o más predictores. La construcción utiliza procesos estocásticos logístico- normal para definir las probabilidades condicionales asociadas a un proceso tail-free. Se propondrá una especificación a priori por defecto para una versión lineal del proceso que satisface cuatro propiedades deseables: i) el proceso tiene densidad con respecto a la medida de Lebesgue para cada valor de
los predictores, ii) el proceso es continuo como función de los predictores, iii) la implementación computacional es simple y se basa en algoritmos para el ajuste de modelos lineales generalizados, y
2010-05-07
Alejandro Murua. Departamento de Estadística, Pontificia Universidad Católica de Chile, y Département de Mathématiques Et de Statistique, Université de Montréal, Québec, Canada
Agrupamiento de datos mediante los modelos de Potts y de grupos aleatorios
Sala 2 (Víctor Ochsenius) - 12:00 a 13:00 Hrs.
Abstract:
Resumen:

El agrupamiento de datos de dimensiones grandes es un problema importante y común en áreas como la bio-informática (por ejemplo, para encontrar subtipos de cáncer en datos provenientes de micro-arreglos de expresión genética para crear tratamientos específicos a cada individuo), procesamiento de texto o text mining (por ejemplo, para agrupar documentos de tal forma de facilitar la búsqueda rápida de documentos relevantes a un query). En este trabajo nosotros introducimos el agrupamiento de datos mediante el modelo de Potts como un método de agrupamiento basado en núcleos (kernels). Este esta basado en el trabajo de Blatt, Wiseman y Domany (1996), quienes basados en modelos y algoritmos conocidos en Física, usaron el modelo de Potts para crear una herramienta de agrupamiento de datos.

Conjeturamos que la clave del éxito de los métodos basados en núcleos esta en su habilidad para ejecutar el agrupamiento de datos a través de un modelamiento no-paramétrico implícito de la función de densidad de los datos.

Una de las etapas esenciales del agrupamiento de datos por el modelo de Potts es la estimación de lo que podemos asimilar a su parámetro de lisaje. Este corresponde a la temperatura de la densidad de Potts. Nosotros presentamos una versión bayesiana de nuestro modelo; elucidamos una ley a priori apropiada para la temperatura explotando ideas provenientes de la teoría de grafos aleatorios; y estimamos la ley a posteriori de la temperatura a través de un algoritmo estocástico basado en técnicas de Monte Carlo de poblaciones. Parte de este trabajo se efectuó con la colaboración de Nicolas Wicker, Université de Strasbourg e Institut de Génétique et de Biologie Moléculaire et Cellulaire; Larissa Stanberry, Departamento de estadística, University of Bristol; y Werner Stuetzle, Departamento de estadística, University of Washington-Seattle.
2010-04-21
Wilfredo Palma. Pontificia Universidad Católica de Chile
Estimacion de procesos localmente estacionarios
Sala 2 (Víctor Ochsenius) - Facultad de Matemática, PUC. 16:45 Hrs.
Abstract:
Resumen: Esta charla discute la estimacion de procesos localmente estacionarios fuertemente dependientes. Esta metodologia permite el análisis estadistico de series de tiempo que exhiben no estacionaridad y persistencia. Se introducen modelos con parametros que varian en el tiempo y se propone un metodo de estimacion de Whittle de dichos parametros. En este trabajo se establecen algunas porpiedades fundamentales de estos estimadores, incluyendo consistencia, normalidad asintotica y eficiencia.
[Trabajo conjunto con Ricardo Olea, Ann. Stat. 2010].
2010-01-11
Armin Schwartzman. Department of Biostatistics, Harvard University
INFERENCE FOR EIGENVALUES AND EIGENVECTORS OF GAUSSIAN SYMMETRIC MATRICES
Sala 2 (Víctor Ochsenius) - 15:00 Hrs. Facultad de Matemáticas - UC
Abstract:
Abstract:
In this talk I present maximum likelihood estimators (MLEs) and
log-likelihood ratio (LLR) tests for the eigenvalues and eigenvectors of
Gaussian random symmetric matrices of arbitrary dimension, where the
observations are independent repeated samples from one or two
populations. These inference problems are relevant in the analysis of
Diffusion Tensor Imaging data, where the observations are 3 × 3
symmetric positive definite matrices. The parameter sets involved in the
inference problems for eigenvalues and eigenvectors are subsets of
Euclidean space that are either affine subspaces, polyhedral convex
cones, or embedded submanifolds that are invariant under orthogonal
transformations. We show that for a class of sets that includes the ones
considered here, the MLEs of the mean parameter do not depend on the
covariance parameters if and only if the covariance structure is
orthogonally invariant."
2009-12-16
Eleazar Eskin. University of California, los Angeles.
Leveraging joint test status distribution for an optimal significance testing
Sala 2 (Víctor Ochsenius) - Facultad de Matemáticas -14:00 hrs.
Abstract:
Abstract:
In multiple hypothesis testing, there’s often structure in the decisions made about individual observations. Take a gene expression
study where the expressions of n genes are collected over m tissues, hypotheses about individual observations, such as whether a gene is associated with a genetic variation in two similar tissues are often related. Standard procedures often answer these questions about groups of observations by considering the contexts independently. However, there often exists information in the groups, for example an individual gene is probably associated with a genetic variation in two similar tissues. In order to fully account for this information, a procedure must make decisions about the observations
2009-11-11
Ernesto San Martín. Pontificia Universidad Católica de Chile
Efectividad de las Escuelas Chilenas: Un análisis de valor agregado teniendo en cuenta problemas de endogenidad
SALA 3 SECTOR DE POSTGRADO
Abstract:
El Ministerio de Educación encargó un estudio piloto de valor agregado en el cual académicos del Departamento de Estadística de la Pontificia Universidad Católica de Chile, junto a académicos del Centro de Medición MIDE UC, participaron (dentro del grupo de académicos, se cuenta el autor de este seminario). Dicho estudio está basado en un panel compuesto de dos mediciones del SIMCE: la del 2004 y 2006. En el 2004, los estudiantes medidos cursaban 8 año de enseñanza básica; en el 2006, la gran mayoría de ellos cursaban segundo año de enseñanza media.
Tradicionalmente, un estudio de valor agregado se realiza ajustando modelos lineales jerárquicos, donde el efecto aleatorio definido a nivel de escuela representa la efectividad de la misma. Siguiendo la literatura especializada, dicho efecto aleatorio representa el valor agregado de la escuela controlando por las covariables que se incluyen en el modelo. Los establecimientos educacionales son ordenados en base a la predicción del efecto aleatorio.
En este seminario se por qué el efecto aleatorio en un modelo lineal jerárquico puede ser interpretado como un indicador de Valero Agregado. Luego, se Reportarán los resultados del estudio piloto de valor agregado, enfatizando el efecto de ciertas covariables. También se señalarán las hipótesis subyacentes de un modelo lineal jerárquico y se proporcionará evidencia empírica de que la base de datos SIMCE 2004-2006 no satisface. Técnicamente, se trata de que hay covariables endógenas (es decir, generadas en el sistema), lo que implica que los rankings que se reportan no son del todo correctos. Se discutirá este aspecto y se mostrará que, bajo endogenidad, el efecto aleatorio de un modelo lineal jerárquico ya no representa el concepto de valor agregado. Se propondrá una corrección de la predicción del efecto aleatorio, para así obtener los indicadores de valor agregado, los cuales serán comparados con los indicadores estándares.
2009-11-04
Víctor Leiva. Departamento de Estadistica,universidad de Valparaiso
Modelos de Daños Acumulativos: Estimación, Regresión, Diagnóstico e Implementación
Sala 3 (sector postgrado) - Facultad de Matematicas PUC - 16:45 - 17:45 Hrs.
2009-10-21
Fernando Quintana. Pontificia Universidad Católica de Chile
Modelos Flexibles para Distribuciones Continuas Univariadas
Sala 3 - (Sector Postgrado) - Facultad de Matemáticas - UC 16:45 a 17:45 Hrs.
Abstract:
Abstract: Basándose en una representación constructiva, que distingue entre un mecanismo de asimetría P y una distribución simétrica basal F, se presentan dos clases flexibles de distribuciones. Ellas se generan usando modelos no paramétricos para ya sea P o F. En esta charla se ilustran los dos enfoques, con especial atención a propiedades de los modelos, construcción de las priori y sus efectos, y se discuten recomendaciones generales para su uso.
2009-09-23
Jorge González. Centro de Medición Mide UC - Pontificia Universidad Católica de Chile
Estimación de modelos logístico-normales basada en métodos de Quasi-Monte Carlo
Sala 1 - Facultad de Matemáticas - UC 16:45 Hrs.
Abstract:
Para tomar en cuenta la dependencia entre observaciones pertenecientes a una misma unidad de análisis, la familia de modelos lineales generalizados mixtos asume que algunos de los coeficientes en el modelo no son fijos, sino efectos aleatorios que siguen una distribución definida sobre la población de unidades. Uno de los métodos de estimación más populares para modelos con efectos aleatorios es el método de máxima verosimilitud marginal (Bock & Aitkin, 1981). Bajo este enfoque, la contribución de los efectos aleatorios a la verosimilitud está representada como una integral (por lo general, analíticamente intratable) sobre su distribución, haciendo necesaria la utilización de métodos numéricos de integración en el proces
2009-09-09
Carlos Araujo. Pontificia Universidad Católica de Chile
Buenas Prácticas en la Enseñanza de la Estadística Clásica Básica
Sala 1 - Facultad de Matemáticas - UC 16:45 Hrs.
2009-08-12
Heleno Bolfarine. Universidad de Sao Paulo, Brasil
Asymmetric link functions
Sala 3 (sector postgrado)- Facultad de Matematicas
Abstract:
Summary: We discuss binary model fitting with asymmetric links.
Emphasis is placed on models for the so called item response theory
typically applied to educational data.
We make use of Bayesian methodology based on Markov chain Monte Carlo.
2009-08-10
Arthur Pewsey. University of Extremadura, Cáceres, Spain
Modelling Circular Data
Sala 3 - (Sector Postgrado) - Facultad de Matemáticas - UC