O CESGA introdúcenos no potencial de Apache Spark 2 en materia de datos a gran escala

martes, 9 de xullo do 2019 Redacción

O Centro de Supercomputación de Galicia vainos achegar ás posibilidades dunha das principais ferramentas da actualidade para traballar con información a gran escala. Estamos a falar do obradoiro Big Data: Usando Spark 2, que se celebra do 16 ao 19 de xullo (en horario de 10.00 a 14.00 horas) e que será moi indicado para todos aqueles profesionais que queiran introducirse no devandito sistema de computación.
Apache Spark, para quen non o saiba, é un ingrediente extra para acadar meirandes (moito máis grandes) velocidades de procesamento de datos das que xeralmente coñecemos. O seu punto máis forte reside na súa capacidade para dividir ou paralelizar o traballo en diferentes máquinas que traballan da maneira máis eficiente posíbel.
Ao final do curso os asistentes terán os coñecementos necesarios para comezar a utilizar Spark nas súas tarefas cotiás de análises de datos. Nun plano máis detallado, saberán como transformar datos en Spark usando RDDs, como convertir datos en Spark usando DataFrames e Spark SQL, como transformar datos en Spark desde R usando Sparklyr, como preparar e lanzar un traballo de Spark, e como facer monitoraxe dun traballo de Spark.

PUBLICIDADE