[Todos] hoy Lunes 14 de diciembre, 18hs, Pablo Heiber, charla en el DC

Verónica Becher vbecher en dc.uba.ar
Lun Dic 14 13:16:07 ART 2015



La charla será en el Laboratorio 4 del Departamento de Computación.


---

El Lunes 14 de Diciembre a las 18 hs, Pablo Ariel Heiber dará una charla 
en el DC titulada:

" Encuestando más que personas: técnicas de muestreo pesado y su 
implementación distribuida"

Aula a definir (en Pabellón I, Ciudad Universitaria)


Pablo Heiber se Licenció y Doctoró en Ciencias de la Computación en la 
FCEN, UBA, en la que también fue docente por 9 años. Actualmente 
continúa conectado con la facultad contribuyendo a la organización 
local, nacional y latinoamericana de la competencia ACM ICPC. Desde 2015 
trabaja en Google Inc en San Francisco, donde se dedica a estudiar 
cuantitativamente el índice del buscador de dicha compañía.

Resumen: Recientemente estuvimos inundados durante meses de encuestas 
que fallaron en determinar con precisión el resultado de ambas rondas de 
la elección presidencial. La técnica de muestreo no se usa solamente 
cuando el universo analizado son personas, sino siempre que cierta parte 
de la información a analizar es muy costosa a nivel plata, tiempo, 
memoria o cualquier otro recurso, con respecto al tamaño del universo 
analizado. Por ejemplo, para ciertos tamaños de base de datos, es 
factible en tiempo y memoria hacer un proceso lineal sobre todos los 
registros, pero si se quiere hacer un acceso de red con muchos saltos 
por cada uno, el tiempo total o el ancho de banda requerido vuelve 
prohibitivo el análisis. En esta charla comento un análisis teórico y 
experimental sobre los métodos de muestreo y su implementación en un 
entorno distribuido cuando el universo analizado es pesado, es decir, 
consideramos una distribución no uniforme. Por ejemplo, al momento de 
conseguir financiamiento, podemos pesar a las personas por su capacidad 
económica, o cuando analizamos la velocidad de acceso a cierto sitio de 
internet, podemos pesarlos por la frecuencia de dichos accesos. Como 
resultado, presento un método de mínima varianza entre todos los métodos 
no sesgados, y muestro experimentalmente que reduce un 50% el costo del 
análisis respecto de la mejor de un conjunto de otras alternativas, 
manteniendo la misma complejidad algorítmica y posibilidad de ejecución 
distribuida.
Spoiler alert: No tengo la menor idea de por que fallaron las encuestas 
pre-electorales.


Están todos invitados.


Verónica




Más información sobre la lista de distribución Todos