[Todos] hoy Lunes 14 de diciembre, 18hs, Pablo Heiber, charla en el DC
Verónica Becher
vbecher en dc.uba.ar
Lun Dic 14 13:16:07 ART 2015
La charla será en el Laboratorio 4 del Departamento de Computación.
---
El Lunes 14 de Diciembre a las 18 hs, Pablo Ariel Heiber dará una charla
en el DC titulada:
" Encuestando más que personas: técnicas de muestreo pesado y su
implementación distribuida"
Aula a definir (en Pabellón I, Ciudad Universitaria)
Pablo Heiber se Licenció y Doctoró en Ciencias de la Computación en la
FCEN, UBA, en la que también fue docente por 9 años. Actualmente
continúa conectado con la facultad contribuyendo a la organización
local, nacional y latinoamericana de la competencia ACM ICPC. Desde 2015
trabaja en Google Inc en San Francisco, donde se dedica a estudiar
cuantitativamente el índice del buscador de dicha compañía.
Resumen: Recientemente estuvimos inundados durante meses de encuestas
que fallaron en determinar con precisión el resultado de ambas rondas de
la elección presidencial. La técnica de muestreo no se usa solamente
cuando el universo analizado son personas, sino siempre que cierta parte
de la información a analizar es muy costosa a nivel plata, tiempo,
memoria o cualquier otro recurso, con respecto al tamaño del universo
analizado. Por ejemplo, para ciertos tamaños de base de datos, es
factible en tiempo y memoria hacer un proceso lineal sobre todos los
registros, pero si se quiere hacer un acceso de red con muchos saltos
por cada uno, el tiempo total o el ancho de banda requerido vuelve
prohibitivo el análisis. En esta charla comento un análisis teórico y
experimental sobre los métodos de muestreo y su implementación en un
entorno distribuido cuando el universo analizado es pesado, es decir,
consideramos una distribución no uniforme. Por ejemplo, al momento de
conseguir financiamiento, podemos pesar a las personas por su capacidad
económica, o cuando analizamos la velocidad de acceso a cierto sitio de
internet, podemos pesarlos por la frecuencia de dichos accesos. Como
resultado, presento un método de mínima varianza entre todos los métodos
no sesgados, y muestro experimentalmente que reduce un 50% el costo del
análisis respecto de la mejor de un conjunto de otras alternativas,
manteniendo la misma complejidad algorítmica y posibilidad de ejecución
distribuida.
Spoiler alert: No tengo la menor idea de por que fallaron las encuestas
pre-electorales.
Están todos invitados.
Verónica
Más información sobre la lista de distribución Todos