Skip to Content

CIENTÍFICO DE DATOS CLOUDERA

Objetivos: 

  • Capturar, manejar, almacenar, transformar, buscar y visualizar un conjunto de datos de gran volumen y complejidad y relacionarlos entre sí para extraer información de valor a partir de ellos mediante una solución Big Data de código abierto como Cloudera.

Colectivo al que va dirigido: 

Prioritariamente trabajadores/as desempleados, con carácter general residentes en la Comunidad de Madrid, inscritos en la red de oficinas. Cuando los participantes sean trabajadores ocupados éstos deberán ser, con carácter general residentes en la Comunidad de Madrid o prestar sus servicios en centros de trabajo ubicados en la misma.
Se recomiendan los siguientes requisitos mínimos:

  • Dominio de inglés a nivel de lectura.
  • Conocimientos y/o experiencia profesional en el campo de análisis de datos.
  • Conocimiento de algún lenguaje de programación de uso general (Python, R,..).

A criterio de la Dirección General de Formación se podrán establecer pruebas de conocimientos para el acceso a este curso.

Modalidades: virtual y presencial (consultar calendario)

Requisitos de equipamiento de los alumnos en caso de modalidad virtual

En el caso de los cursos de esta especialidad que se impartan mediante modalidad de AULA VIRTUAL, el hardware/software necesario por parte del alumno es:

  • Ordenador portátil o sobremesa. Procesador i3 o superior.
  • Memoria recomendada 4 GB de RAM
  • Conexión a internet estable
  • Auriculares y micrófono
  • Navegador: recomendamos el uso de Google Chrome, con el plugin "Clipboard Permission Manager" instalado, para acceder a la videoconferencia y tener habilitado el Copy & Paste entre la máquina host y los laboratorios.

Duración: 150 horas.

Relación de Módulos Formativos presenciales:

  • Módulo 1: Ciencia de datos y aprendizaje automático a escala.
  • Módulo 2: Visión general del ecosistema de Hadoop.
  • Módulo 3: Introducción a Cloudera Data Science Workbench.
  • Módulo 4: Apache Spark 2.
  • Módulo 5: Gestión del dato (lectura, escritura, transformación, agrupación, limpieza, calidad,…).
  • Módulo 6: Aprendizaje automático con Spark MLib.
  • Módulo 7: Modelos de regresión, clasificación y clustering.
  • Módulo 8: Validación cruzada de modelos y ajuste de hiperparámetros.
  • Módulo 9: Construcción de tuberías y despliegue de modelos de aprendizaje automático.

Inscríbete

Consulta nuestro calendario de cursos gratuitos

Solicita tu curso gratuito