Laura Balbastre Soler
Big Data és una col·lecció de grans volums de dades que no poden ser processats utilitzant tècniques de computació tradicionals. El model de computació mapreduce permet paralelitzar el tractament d’aquestes dades. Una de les principals avantatges de MapReduce és que podem solucionar aquest tipus de problemes utilitzant múltiples ordinadors de gamma bàsica.
Sessió 1
1. Big Data: Per què i on
2. Iniciació a Apache Hadoop i MapReduce
3. Eines de Hadoop per processar dades
Sessió 2
1. Instal·lació QuickStarts for CDH 5.8 de Cloudera
2. Implementació d’un job MapReduce amb Hadoop
Sessió 3
1. Iniciar-se amb Apache Spark
2. Hadoop vs Spark
3. Implementació d’un job amb Spark
4. Casos d’ús a Trovit