Перейти к содержимому

Machine Learning

MasterClass de Machine Learning en el CFTICEn Machine learning los ordenadores aplican técnicas de aprendizaje estadístico para identificar patrones en los datos de manera automática. Estas técnicas pueden ser utilizadas para hacer predicciones con una alta precisión. “The field of study that gives computers the ability to learn without being explicitly programmed”. Dijo Arthur Samuel en el 1959. Mas recientemente Tom Mitchell en el 1995 escribió: “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.” Aunque el Machine Learning no es un concepto nuevo, en los últimos años ha tenido un auge exponencial en su uso y aplicación. Una de las razones principales de este auge es el aumento en la capacidad de procesamiento y la disminución de los costes del mismo, permitiendo así que pueda estar al alcance de todos: El BigData.

El objetivo de este seminario es presentar los conceptos fundamentales vinculados con el Machine Learning. También se mostrará la manera en que Spark ML con Python y CDSW (Cloudera Data Science Workbench) implementa estos conceptos de manera sencilla con el fin de realizar aplicaciones prácticas Durante la presentación veremos demos de ML supervised learning y unsupervised learning y en particular los tres métodos de aplicación diferenciados:

  • Método de Regresión. Este método se utiliza para predecir el valor de un atributo continuo. Consiste en encontrar la mejor ecuación que atraviese de forma óptima un conjunto de puntos (ndimensiones). Se utiliza cuando la precisión no es crítica y el número de variables es pequeño
  • Método de Clasificación. Método utilizado para predecir un resultado de un atributo con valor discreto (a, b, c, …) dadas unas características (Xo, X1, X2, X3,.... Xn). El método simple de clasificación es el binario, donde se clasifica un registro de variables de entrada en 1 o 0. La clasificación múltiple es una extensión de la clasificación binaria
  • Método de Clustering. Este método se utiliza cuando se necesita clasificar las instancias de datos pero no se conocen previamente las categorías. Esta agrupación permite construir grupos (cluster) coherentes de instancias teniendo en cuenta las variables de la data. En palabras sencillas, permite encontrar qué se tiene en la data.

Si estás interesado en asistir, estas son las coordenadas:

Día: 18 de Mayo de 2018.
Hora: De 11:00 a 13:30.
Lugar: Salón de actos del CFTIC.

Inscripción en: https://cftic.centrosdeformacion.empleo.madrid.org/masterclass 

Está abierto a que cualquier persona se pueda apuntar, sean trabajadores, estudiantes, desempleados,etc.

El acceso es gratuito, pero es necesario registro previo para control de aforo.

Os esperamos.

Ponente Seminario Cloudera

Ponente Mauro B Pazienza

Mauro B. Pazienza

Mauro Pazienza es Senior Training Specialist en PUE.

Cloudera ha concedido a Mauro Pazienza, instructor oficial de PUE, el premio Best Instructor EMEA FY17. Con más de 20 años de experiencia en formación y consultoría IT en áreas como administración, desarrollo y big data, Mauro está actualmente enfocado en la impartición de cursos oficiales en Cloudera en toda Europa