Curso Big Data: Una introducción a los desafíos para las Ciencias Sociales

El curso, especialmente dictado por el Dr. Juan Grigera para investigadoras/es del IEALC, plantea en cuatro encuentros una breve introducción al BigData para las ciencias sociales. Se propone ofrecer un panorama general y realizar una reseña de los actuales usos de estas técnicas, presentar su lógica y explorar posibles utilizaciones en otros proyectos. El curso no pretende introducirse en los detalles de utilización de todas las técnicas presentadas sino permitir una aproximación informada a los desafíos y
posibilidades abiertas por éstas.

28/Mayo Introducción: BigData ¿que hay de nuevo?
Definición de BigData y delimitación del campo. Las tres ‘V’ de BigData. Producción
de datos y procesamiento. Paywalls. Ética y política del uso de datos.

4/Junio – Procesamiento de textos y construcción de corpus
Técnicas básicas de procesamiento de texto: texto en bajo y alto nivel. Parsing de
lenguajes artificiales. Expresiones regulares. Construcción de corpus: APIs, web
scraping y OCR

11/Junio – Natural Language Processing
Estadística de textos (concordancia, diagramas de dispersión, bigramas,
colocaciones, distribuciones de frecuencia, etc.). Análisis de texto: segmentación y
tokenización. Chunking, lemmantización, folding y stemming, Part of Speech
Tagging. Named Entity Resolution, Topic Modeling, Autoclassification.

18/Junio – ‘Inteligencia Artificial’
‘Inteligencia Artificial’ definiciones y controversias. Técnicas supervisadas y no
supervisadas. Regresión, Clasificación, Agrupamiento y Filtrado colaborativo