Saltar al contenido

Cabecera

CURSOS 22-23-24

DESARROLLADOR SPARK BIG DATA CLOUDERA

INSCRIPCIÓN

CRN

Contenido

Modalidad

Presencial

(Consultar calendario)

Duración

200 horas

Certificación

CDP Data Engineer CDP-3002

Descripción del curso:

El curso ofrece los conceptos clave y la experiencia que los desarrolladores necesitan para introducir y procesar datos en un clúster Hadoop, utilizando las herramientas y técnicas más actuales tales como Apache Spark (incluyendo Spark Streaming y Spark SQL), Flume, Kafka y Sqoop, para desarrollar aplicaciones paralelas de alto rendimiento en Cloudera Data Platform (CDP).

Con Spark, los desarrolladores pueden escribir sofisticadas aplicaciones en paralelo para tomar mejores decisiones, más rápidas y acciones interactivas, aplicadas a una amplia variedad de casos de uso, arquitecturas e industrias.

Objetivos:

Al finalizar la acción formativa el alumnado estará capacitado para:

Introducir y procesar datos en un clúster Hadoop utilizando herramientas y técnicas tales como Spark (incluyendo Spark Streaming y Spark SQL), Flume, Kafka y Sqoop.

Colectivo al que va dirigido:

Prioritariamente trabajadores/as desempleados, con carácter general residentes en la Comunidad de Madrid, inscritos en la red de oficinas. Cuando los participantes sean trabajadores ocupados éstos deberán ser, con carácter general residentes en la Comunidad de Madrid o prestar sus servicios en centros de trabajo ubicados en la misma.

A criterio de la Dirección General de Formación se podrán establecer pruebas de conocimientos para el acceso a este curso.

Se recomiendan los siguientes requisitos mínimos:

  • Dominio de inglés a nivel de lectura (toda la prueba de nivel será en inglés)
  • Conocimientos generales de sistemas operativos e informática
  • Conocimientos generales en programación.
  • Conocimientos sobre la línea de comandos básica de Linux
  • Conocimientos básicos de algún lenguaje de programación (Java, Scala, Python...)
  • Conocimiento básico de SQL
  • Durante el curso se presentan ejemplos de Apache Spark y ejercicios prácticos en Scala y Python, por ello se recomienda la capacidad de programar como mínimo en uno de estos dos lenguajes de programación.


Relación de contenidos formativos presenciales:

1 Introducción a SQL.
2 Programación Python.
3 Programación Scala.
4 Preparing with Cloudera Data Engineering.

200 horas

Examen de certificación: 

La ejecución y financiación del programa formativo incluye la presentación de los alumnos que han realizado el curso con aprovechamiento al examen para obtener esta certificación (o aquella que la sustituya al momento de su impartición), y que gestionará la empresa adjudicataria, sin coste alguno para el alumno.

  • CDP Data Engineer CDP-3002

Vídeos

Perfiles profesionales del Big Data y el análisis datos y cursos de Cloudera explicados por un experto.



Recursos para preparar las pruebas de nivel:

  • Linux:
    • Fundamentals of Red Hat Enterprise Linux
    • https://www.udemy.com/course/shell-interprete-de-comandos-de-linux-aprende-desde-cero/
    • https://www.udemy.com/course/shell-interprete-de-comandos-de-linux-aprende-desde-cero/

    • https://www.udemy.com/course/gnulinux-desde-cero/

  • Python:
    • https://www.udemy.com/course/programacion-para-principiantes-en-python/

    • https://www.udemy.com/course/introduccion-a-la-programacion-con-python-juan-de-la-torre/

  • Scala
    • https://www.udemy.com/course/stairway-to-scala-setup-instructions/
  • Sql
    • https://www.udemy.com/course/aprende-sql-desde-cero-hasta-avanzado-como-un-profesional/

Footer

Centro de Formación en Tecnologías de la información y las comunicaciones de Madrid

C/Arcas del Agua, 2 (Sector 3) Getafe

+34 91 683 81 60; C. P. 28905

centrof.madridsur@madrid.org