[Todos] Lunes 14 de diciembre, 18hs, Pablo Heiber, charla en el DC

Veronica Becher vbecher en dc.uba.ar
Jue Dic 10 10:43:18 ART 2015


El Lunes 14 de Diciembre a las 18 hs, Pablo Ariel Heiber dará una charla en el DC titulada:

" Encuestando más que personas: técnicas de muestreo pesado y su implementación distribuida"

Aula a definir (en Pabellón I, Ciudad Universitaria)


Pablo Heiber se Licenció y Doctoró en Ciencias de la Computación en la FCEN, UBA, en la que también fue docente por 9 años. Actualmente continúa conectado con la facultad contribuyendo a la organización local, nacional y latinoamericana de la competencia ACM ICPC. Desde 2015 trabaja en Google Inc en San Francisco, donde se dedica a estudiar cuantitativamente el índice del buscador de dicha compañía.

Resumen: Recientemente estuvimos inundados durante meses de encuestas que fallaron en determinar con precisión el resultado de ambas rondas de la elección presidencial. La técnica de muestreo no se usa solamente cuando el universo analizado son personas, sino siempre que cierta parte de la información a analizar es muy costosa a nivel plata, tiempo, memoria o cualquier otro recurso, con respecto al tamaño del universo analizado. Por ejemplo, para ciertos tamaños de base de datos, es factible en tiempo y memoria hacer un proceso lineal sobre todos los registros, pero si se quiere hacer un acceso de red con muchos saltos por cada uno, el tiempo total o el ancho de banda requerido vuelve prohibitivo el análisis. En esta charla comento un análisis teórico y experimental sobre los métodos de muestreo y su implementación en un entorno distribuido cuando el universo analizado es pesado, es decir, consideramos una distribución no uniforme. Por ejemplo, al momento de conseguir financiamiento, podemos pesar a las personas por su capacidad económica, o cuando analizamos la velocidad de acceso a cierto sitio de internet, podemos pesarlos por la frecuencia de dichos accesos. Como resultado, presento un método de mínima varianza entre todos los métodos no sesgados, y muestro experimentalmente que reduce un 50% el costo del análisis respecto de la mejor de un conjunto de otras alternativas, manteniendo la misma complejidad algorítmica y posibilidad de ejecución distribuida.
Spoiler alert: No tengo la menor idea de por que fallaron las encuestas pre-electorales.


Están todos invitados.


Verónica



Más información sobre la lista de distribución Todos