Massively Parallel Machine Learning ( Máster EIT Digital Data Science)

Titulaciones en las que se imparte:

  • Máster Universitario de Ingeniería Informática (EIT Digital - Data Science)


Curso académico: 2022-2023



Créditos: 3


Objetivos generales

This course introduces to the parallelization of Machine Learning algorithms (supervised and unsupervised) on Big Data distributed computing platforms. In particular, MapReduce and RDD paradigms are explained jointly with the corresponding distributed platforms supporting them (Hadoop and Apache Spark). Using several well-known machine learning algorithms, the student will learn how to parallelize machine learning algorithms using the corresponding Hadoop and Apache Spark APIs.


Guías de Aprendizaje


El programa, la bibliografía y la Normativa de Evaluación se puede consultar en la Guía de Aprendizaje


Profesorado y tutorías


Grupos y horarios

Grupo Horario Profesorado
Único Consultar 1º. semestre Mozo Velasco, Alberto




Más información

Content and Learning Activities

Unit 1: Distributed computing platforms for Big Data

1.1. Introduction to big data

1.2. MapReduce and Hadoop

1.3. RDDs and Spark

Unit 2: Scalable machine learning

2.1. Introduction to machine learning

2.2. Scalable optimizacion


