O CESGA introdúcenos no potencial de Apache Spark 2 en materia de datos a gran escala
martes, 9 de xullo do 2019
O
Centro de Supercomputación de Galicia vainos achegar ás
posibilidades dunha das principais ferramentas da actualidade para
traballar con información a gran escala.
Estamos a falar do obradoiro Big Data: Usando Spark 2, que
se celebra do 16 ao 19 de xullo (en horario de 10.00 a 14.00 horas) e
que será moi indicado para todos aqueles profesionais que queiran
introducirse no devandito sistema de computación.
Apache
Spark, para quen non o saiba, é un ingrediente extra para acadar
meirandes (moito máis grandes) velocidades de procesamento de datos
das que xeralmente coñecemos. O seu punto máis forte reside na súa
capacidade para dividir ou paralelizar o traballo en diferentes
máquinas que traballan da maneira máis eficiente posÃbel.
Ao
final do curso os asistentes terán os coñecementos necesarios para
comezar a utilizar Spark nas súas tarefas cotiás de análises de
datos. Nun plano máis detallado, saberán como transformar datos en
Spark usando RDDs, como convertir datos en Spark usando DataFrames e
Spark SQL, como transformar datos en Spark desde R usando Sparklyr,
como preparar e lanzar un traballo de Spark, e como facer monitoraxe
dun traballo de Spark.