CURSOS 22-23-24

DESARROLLADOR BIG DATA EVENT STREAMING PROCESSING

INSCRIPCIÓN

CRN

Modalidad

Presencial

(Consultar calendario)

Duración

220 horas

Vídeos

Perfiles profesionales del Big Data y el análisis datos y cursos de Cloudera explicados por un experto.

Descripción del curso:

El curso ofrece los conceptos clave y la experiencia que los participantes necesitan para introducir y procesar datos en un clúster Hadoop, utilizando herramientas y técnicas tales como Spark (incluyendo Spark Streaming y Spark SQL), Flume, Kafka y Sqoop; además adquirirán las competencias para automatizar la ingesta, flujo, transformación y salida de datos mediante el uso de Apache NiFi y el expertise de un profesional para la Administración Big Data Cloudera de Apache Hadoop.

Por otro lado, alcanzarán los conocimientos y habilidades necesarias en UNIX y Linux para ser capaces de interactuar con el sistema operativo y realizar las principales tareas de administración, como llevar a cabo la instalación, configuración y monitoreo de Cloudera Manager, y la optimización, mantenimiento y detección de problemas del clúster.

Objetivos:

Al finalizar la acción formativa el alumnado estará capacitado para:

Realizar aplicaciones Spark Streaming, de procesamiento en tiempo real, implementar Kafka y usar Apache Nifi para la ejecución y monitorización de Dataflows.

Colectivo al que va dirigido:

Prioritariamente trabajadores desempleados, con carácter general residentes en la Comunidad de Madrid, inscritos en la red de oficinas. Cuando los participantes sean trabajadores ocupados éstos deberán ser, con carácter general residentes en la Comunidad de Madrid o prestar sus servicios en centros de trabajo ubicados en la misma.

A criterio de la Dirección General de Formación se podrán establecer pruebas de conocimientos para el acceso a este curso.

Se recomiendan los siguientes requisitos mínimos:

Dominio de inglés a nivel de lectura (la prueba de nivel será en inglés)
Conocimientos básicos de programación, especialmente en Python, Java y Scala (durante el curso se presentan ejemplos de Apache Spark y ejercicios prácticos en Scala y Python, por ello se recomienda la capacidad de programar como mínimo en uno de estos dos lenguajes de programación).
Conocimientos de la línea de comandos básica de Linux.
Conocimientos básicos de SQL.
No es necesario tener un conocimiento previo de Apache Hadoop.

Recursos relacionados:

Sistemas operativos:

Base de datos:

SQL

Programación:

Relación de contenidos formativos presenciales:

1	Programación Python para Spark Streaming
2	Programación Scala para Spark Streaming
3	Cloudera Data Engineering: Developing Applications with Apache Spark
4	Cloudera Training for Apache Kafka
5	Cloudera DataFlow: Flow Management with Apache NiFi