************************************************
Enunciado del trabajo práctico final:
Primera parte (text mining) /
Segunda parte (parsing).
************************************************
Filminas de la segunda mitad del curso (parsing).
************************************************
Profesor: José Castaño (Universidad de Buenos Aires)
Horario: Lunes, martes y miércoles de 9 a 12 hs (9 horas de clase)
Duración: 9 horas.
El objetivo de la minería de texto consiste en encontrar, verificar o descubrir información que está presente en textos mediante técnicas de extracción automática. Típicamente se extrae información sobre entidades, propiedades de entidades, acontecimientos o relaciones entre entidades, de modo que la información extraída pueda ser tratada con métodos más convencionales, por ejemplo volcada en una base de datos, u ofrecida al usuario que la requiere en un formato más amigable.
Se verá el uso de clasificadores como herramienta fundamental para el procesamiento de textos tanto desde la perspectiva de Procesamiento del Lenguaje Natural, como de la Recuperación de Información. Se verán las técnicas para el minado de opinión o sentimiento y las técnicas para extracción de entidades, atributos y relaciones. Asimismo se hará énfasis en la evaluación de los resultados.
El objetivo del curso es que los alumnos adquieran las bases fundamentales y una primera aproximación a los problemas más complejos.
Profesor: Gabriel Infante-López (Universidad Nacional de Córdoba)
Horario: Jueves y viernes de 9 a 12 hs (6 horas de clase)
En este breve curso presentaremos una perspectiva computacional a la inducción automática de estructuras sintácticas. Existen diversos paradigmas para la inducción de estructuras y cada uno intenta optimizar una metrica bien definida. En este curso mostraremos dos paradigmas distintos. En el primero, basado en un esquema supervisado, se intenta aprender estructuras a partir de estructuras ejemplos. En el segundo, se intenta descubrir estructuras a partir de oraciones de lenguaje natural que no tienen visible ninguna estructura. Para el primero mostraremos los algoritmos clásicos de inducción de gramáticas probabilisticas y para el segundo mostraremos como se pueden inducir gramáticas utilizando modelos de Machine Learning y modelos basados en compresión de datos.