20. P4. Ensemble de pipelines#

Nota

Lee con atención la práctica 2 del bloque 2. Realiza los ejercicios y una entrega unificada (práctica 2, 3 y 4), la cual se anunciará en la introducción de la asignatura y a través del uaCloud.

Tiempo de dedicación: 3 horas (asíncrona) + 3 horas trabajo independiente

20.1. Clase práctica.#

20.1.1. Ensemble de pipelines: Caso de estudio de Análisis de Sentimientos#

20.1.2. Descripción#

En esta clase práctica estudiaremos cómo diseñar distintos sistemas de clasificación textual que alimentan un meta ensamblador que se comporta como un sistema de votación. Se orientarán ejercicios a resolver en los que el estudiante deberá proponer y diseñar sistemas de análisis de sentimientos teniendo en cuenta lo estudiado en esta práctica.

Las entregas de ejercicios se han de hacer a través del UAcloud>Evaluación>[Nombre de la práctica].

20.1.3. Ejemplo demostrativo#

Transformers Ensemble:

20.1.4. Ejercicios#

20.1.4.1. Ejercicio 1#

Basándose en el ejemplo anterior haga uso del siguiente dataset y diseñe su propio sistema para el análisis de sentimientos. Se disponibilizan unas funciones python para la limpieza y carga de dataset.

  • sample_data/ejercicio_tripadvisor.csv

  • tripadvisor_Utils.py

20.1.4.2. Ejercicio 2#

Basándose en el ejemplo anterior haga uso del siguiente dataset y diseñe su propio sistema para el análisis de sentimientos. Se disponibilizan unas funciones python para la limpieza y carga de dataset.

  • sample_data/ejercicio_bbc_train.csv

  • sample_data/ejercicio_bbc_test.csv

20.1.4.3. Ejercicios adicionales#

Elige alguno de los siguientes datasets y conforma tu propio sistema de sentiment analysis.

20.1.5. Criterios a tener en cuenta para la práctica:#

  • El cuaderno a entregar no debe tener errores de ejecución.

  • Cada modificación de autor incorporada en cuaderno debe ser señalada con comentario. Por ejemplo ####Codigo NOMBRE_DEL_AUTOR ….#####.

  • Se deben comentar y describir los aportes realizados por el autor, y explicar los motivos

  • Se deben evaluar varias opciones de experimentación (i.e. preprocesamiento, configuraciones, tecnologías, modelos) y explicarlas.

  • Se deben describir discusiones y conclusiones del estudio.