Skip to Content

CIENTÍFICO DE DATOS CLOUDERA

Objetivos: 

  • Capturar, manejar, almacenar, transformar, buscar y visualizar un conjunto de datos de gran volumen y complejidad y relacionarlos entre sí para extraer información de valor a partir de ellos mediante una solución Big Data de código abierto como Cloudera.

Colectivo al que va dirigido: 

Prioritariamente trabajadores/as desempleados, con carácter general residentes en la Comunidad de Madrid, inscritos en la red de oficinas. Cuando los participantes sean trabajadores ocupados éstos deberán ser, con carácter general residentes en la Comunidad de Madrid o prestar sus servicios en centros de trabajo ubicados en la misma.
Se recomiendan los siguientes requisitos mínimos:

  • Dominio de inglés a nivel de lectura.
  • Conocimientos y/o experiencia profesional en el campo de análisis de datos.
  • Conocimiento de algún lenguaje de programación de uso general (Python, R,..).

A criterio de la Dirección General de Formación se podrán establecer pruebas de conocimientos para el acceso a este curso.

Duración: 150 horas.

Relación de Módulos Formativos presenciales:

  • Módulo 1: Ciencia de datos y aprendizaje automático a escala.
  • Módulo 2: Visión general del ecosistema de Hadoop.
  • Módulo 3: Introducción a Cloudera Data Science Workbench.
  • Módulo 4: Apache Spark 2.
  • Módulo 5: Gestión del dato (lectura, escritura, transformación, agrupación, limpieza, calidad,…).
  • Módulo 6: Aprendizaje automático con Spark MLib.
  • Módulo 7: Modelos de regresión, clasificación y clustering.
  • Módulo 8: Validación cruzada de modelos y ajuste de hiperparámetros.
  • Módulo 9: Construcción de tuberías y despliegue de modelos de aprendizaje automático.

Inscríbete

Consulta nuestro calendario de cursos gratuitos

Solicita tu curso gratuito