Saltar al contenido

Portada - CIENTÍFICO DE DATOS CLOUDERA

CURSOS 20-21

CIENTÍFICO DE DATOS CLOUDERA

INSCRIPCIÓN

CRN

contenido - CIENTÍFICO DE DATOS CLOUDERA

Modalidad

Virtual y presencial

(Consultar calendario)

Duración

150 horas

contenido 2 - CIENTÍFICO DE DATOS CLOUDERA

Objetivos:

Capturar, manejar, almacenar, transformar, buscar y visualizar un conjunto de datos

de gran volumen y complejidad y relacionarlos entre sí para extraer información de valor a partir de ellos mediante una solución Big Data de código abierto como Cloudera.

 

contenido 3 - CIENTÍFICO DE DATOS CLOUDERA

Colectivo al que va dirigido:

Prioritariamente trabajadores/as desempleados, con carácter general residentes en la Comunidad de Madrid, inscritos en la red de oficinas. Cuando los participantes sean trabajadores ocupados éstos deberán ser, con carácter general residentes en la Comunidad de Madrid o prestar sus servicios en centros de trabajo ubicados en la misma.
Se recomiendan los siguientes requisitos mínimos:

  • Dominio de inglés a nivel de lectura.
  • Conocimientos y/o experiencia profesional en el campo de análisis de datos.
  • Conocimiento de alguno de estos lenguajes de programación: Python, Scala, R o Java.

A criterio de la Dirección General de Formación se podrán establecer pruebas de conocimientos para el acceso a este curso.

Conocimientos previos necesarios para la prueba de nivel:

  • Se requiere tener conocimientos básicos de programación utilizando alguno de estos lenguajes: Python, Scala o R y algún conocimiento explorando o analizando datos y/o desarrollando modelos estadísticos.

  • Recomendable estar familiarizado con comandos Linux

  • Aunque durante el curso se hará una introducción a estas herramientas recomendable conocimiento básico de Spark, Hadoop.

  • No se requieren conocimientos de la plataforma Cloudera.

  • La prueba consta de 15 preguntas en inglés y 15 en castellano

contenido 4 - CIENTÍFICO DE DATOS CLOUDERA

Ordenador Recursos

Hardware/software necesario por parte del alumno es:

  • Ordenador portátil o sobremesa. Procesador i3 o superior.
  • Memoria recomendada 4 GB de RAM
  • Conexión a internet estable
  • Auriculares y micrófono
  • Navegador: recomendamos el uso de Google Chrome, con el plugin "Clipboard Permission Manager" instalado, para acceder a la videoconferencia y tener habilitado el Copy & Paste entre la máquina host y los laboratorios.

contenido 5 - CIENTÍFICO DE DATOS CLOUDERA

Módulos que se incluyen:

1 Ciencia de datos y aprendizaje automático a escala
2 Visión general del ecosistema de Hadoop
3 Introducción a Cloudera Data Science Workbench
4 Apache Spark 2
5 Gestión del dato (lectura, escritura, transformación, agrupación, limpieza, calidad,…)
6 Aprendizaje automático con Spark MLib
7 Modelos de regresión, clasificación y clustering
8 Validación cruzada de modelos y ajuste de hiperparámetros
9 Construcción de tuberías y despliegue de modelos de aprendizaje automático

150 Horas

Footer

Centro de Formación en Tecnologías de la información y las comunicaciones de Madrid

C/Arcas del Agua, 2 (Sector 3) Getafe

+34 91 683 81 60; C. P. 28905

centrof.madridsur@madrid.org