Big Data Infrastructure
Descrizione del corso: L’infrastruttura è la base su cui si poggia ogni architettura Big Data (BD): è cruciale avere i giusti strumenti per analizzare e conservare i tuoi dati all’inizio di ogni processo BD.
Obiettivi: La finalità generale del corso Big Data Infrastructure è di fornire ai partecipanti i principali concetti sulla tecnologia Big Data, con particolare riferimento ai Haddop e Spark per la gestione e lo sviluppo delle applicazioni.
Contenuti: Big Data Infrastrcture: i componenti, i database relazionali (NoSQL), i processi in tempo reale; Fondamenti di HDFS e MapReduce; L’eco-sistema dei progetti Apache Appliance; Introduzione ad Hadoop Distributed File System; Distribuzione dei processi in un cluster; 8 Ecosystem Hadoop; Problematiche risolvibili con Hadoop; Apache Spark: i fondamenti; Sviluppare le applicazioni con le APIs Scala; Spark Streaming; Spark SQL e Dataframes
Destinatari del corso: Amministratori di rete, Programmatori, Sistemisti.
Livello di corso: Base
Metodologia della didattica: Aula
Modalità di verifica finale: esercitazione finale su prove simulate