Trovit

Big Data i MapReduce

Responsable del curs

Laura Balbastre Soler

Objectius del curs

Big Data és una col·lecció de grans volums de dades que no poden ser processats utilitzant tècniques de computació tradicionals. El model de computació mapreduce permet paralelitzar el tractament d’aquestes dades. Una de les principals avantatges de MapReduce és que podem solucionar aquest tipus de problemes utilitzant múltiples ordinadors de gamma bàsica.

Programa

Sessió 1
1. Big Data: Per què i on
2. Iniciació a Apache Hadoop i MapReduce
3. Eines de Hadoop per processar dades

Sessió 2
1. Instal·lació QuickStarts for CDH 5.8 de Cloudera
2. Implementació d’un job MapReduce amb Hadoop

Sessió 3
1. Iniciar-se amb Apache Spark
2. Hadoop vs Spark
3. Implementació d’un job amb Spark
4. Casos d’ús a Trovit

Horari

30 gener de 8:00 a 11:00
31 gener de 8:00 a 11:00
1 febrer de 8:00 a 11:00

Seminaris Empresa 2017 - Facultat d'Informàtica de Barcelona - apre

fib.upc.edu