

Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una introduzione alla elaborazione di big data e al ruolo del data scientist. Esplora i sistemi di elaborazione big data, la natura eterogenea dei dati, il ruolo del data scientist e le competenze richieste. Inoltre, tratta il concetto di machine learning, la scalabilità e i sistemi distribuiti, con un focus su spark e la scalabilità orizzontale.
Tipologia: Appunti
1 / 3
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


Big Data = Dati eterogenei, di diversa natura e origine. Quando si parla di big data non ci si riferisce ad uno strumento specifico, ma ad un set di più strumenti. Il lavoro di un data scientist è capire quale sia lo strumento più adatto, a volte anche costruirseli.
2. CHI È IL DATA SCIENTIST Figura professionale molto recente ed ibrida. Trova soluzioni a problemi nuovi, deve inventarsi dei nuovi tools per risolverli. Questo perché deve avere diverse competenze, non è specifica di un determinato settore. Si muove principalmente in 3 ambiti:
In un sistema distribuito dobbiamo tenere in considerazione tre cose: