




















































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Appunti di data analytics 2025/2026
Tipologia: Appunti
1 / 92
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





















































































Negli ultimi anni il marketing ha subito un cambiamento strutturale profondo, dovuto principalmente alla crescente disponibilità di dati e alla riduzione dei costi delle tecnologie di raccolta e analisi. Questo ha portato a un passaggio da un marketing basato prevalentemente su intuizioni e ricerche intenzionali a un marketing guidato dai dati (data-driven marketing).
Il cambiamento non è solo tecnologico, ma anche cognitivo e culturale: oggi le decisioni di marketing partono sempre più spesso dai dati comportamentali, ovvero dalle tracce lasciate dai consumatori nelle loro interazioni digitali e transazionali. A differenza dell’era analogica, questi dati sono associabili a individui e famiglie specifiche, rendendo possibile un’analisi molto più granulare del comportamento del consumatore.
Questo nuovo scenario introduce un vero e proprio imperativo analitico: il marketing moderno deve saper gestire dati eterogenei, interpretarli correttamente e trasformarli in insight utili per il processo decisionale.
L’analisi dei dati rappresenta oggi un elemento essenziale per il successo aziendale non solo nel marketing, ma anche in ambiti come la finanza e la produzione. Le decisioni efficaci non si basano più su ipotesi o percezioni soggettive, ma su evidenze empiriche.
Dal punto di vista competitivo, la capacità di analizzare i dati consente alle imprese di:
● individuare pattern e tendenze rilevanti,
● reagire in modo tempestivo ai cambiamenti del mercato,
● ottimizzare processi e risorse.
La data analysis non si limita a descrivere ciò che è accaduto, ma permette di generare nuova conoscenza, avviare processi decisionali più efficaci e sostenere l’innovazione. In questo senso, i dati diventano una vera e propria risorsa strategica.
L’analisi dei dati utilizza algoritmi, metodi e sistemi informatici per estrarre conoscenza sia da dati strutturati sia da dati non strutturati. Un algoritmo può essere definito come una procedura passo-passo che consente di risolvere un problema o eseguire un calcolo.
Gli strumenti di analisi spaziano da soluzioni semplici come Excel o software statistici open source come R, fino a sistemi avanzati di Machine Learning, in grado di migliorare le proprie prestazioni nel tempo grazie a processi iterativi.
L’obiettivo principale dell’analisi dei dati è prevedere e ottimizzare i risultati, supportando le decisioni in molteplici ambiti: marketing, business, industria e scienze sociali.
L’analisi dei dati è un processo sistematico che comprende:
● raccolta,
● pulizia,
● trasformazione,
● modellazione dei dati,
con lo scopo di scoprire informazioni utili, comprendere il passato e supportare le decisioni.
Il Data Mining, invece, rappresenta una fase avanzata e specifica dell’analisi dei dati. Utilizza tecniche statistiche, di intelligenza artificiale e di machine learning per individuare pattern nascosti, correlazioni e tendenze significative in grandi moli di dati, con un forte orientamento alla previsione.
In sintesi:
● l’analisi dei dati cerca di capire cosa è successo e perché,
● il data mining mira a prevedere cosa succederà e a scoprire relazioni non immediatamente evidenti.
L’analisi qualitativa mira a comprendere il perché dei comportamenti, esplorando motivazioni, percezioni ed esperienze attraverso dati non numerici, come interviste e focus group.
L’analisi quantitativa si concentra sul cosa e sul quanto, utilizzando dati numerici per individuare pattern, relazioni statistiche e tendenze su larga scala.
Usate insieme, permettono una comprensione profonda e valida del comportamento del consumatore.
Esistono quattro principali modalità di indagine:
● abduttiva, che cerca la spiegazione più plausibile partendo da osservazioni incomplete;
● deduttiva, che verifica ipotesi derivate da teorie esistenti;
● induttiva, che generalizza partendo da osservazioni specifiche;
● combinata, che integra i tre approcci per raggiungere la consilienza.
Comprendere queste differenze è fondamentale per interpretare correttamente i risultati delle analisi.
I dati non sono fatti assoluti, ma evidenze. È essenziale distinguere tra:
● denotazione, ciò che i dati mostrano direttamente;
● connotazione, ciò che i dati potrebbero indicare.
Un’analisi corretta richiede di interrogarsi su cosa i dati mostrano, cosa suggeriscono, cosa non mostrano e quali nuove domande aprono.
Le serie temporali permettono di analizzare l’evoluzione del comportamento del consumatore nel tempo, individuando trend, stagionalità e anomalie. Sono fondamentali per:
● prevedere le vendite,
● valutare l’efficacia delle campagne,
● analizzare il churn,
● comprendere la risposta a promozioni e variazioni di prezzo.
L’analisi dei dati si articola in quattro livelli:
● descrittiva: cosa è successo,
● diagnostica: perché è successo,
● predittiva: cosa succederà,
● prescrittiva: cosa dovremmo fare.
L’analisi prescrittiva rappresenta l’attuale frontiera ed è strettamente legata a AI, Machine Learning e Big Data, poiché suggerisce direttamente azioni ottimali.
La ricerca intenzionale non scompare, ma complementa l’analisi dei dati comportamentali. Include sondaggi, esperimenti, neuroscienze e metodi qualitativi come interviste, focus group ed etnografia.
Questi strumenti permettono di cogliere motivazioni profonde che i soli dati transazionali non riescono a spiegare.
La differenza tra IA tradizionale e IA generativa è centrale e molto probabile nelle domande a crocette.
L’IA tradizionale è progettata per svolgere compiti specifici, come classificazione, rilevamento o previsione. Ogni task richiede un modello dedicato e competenze tecniche avanzate. I risultati sono generalmente deterministici e prevedibili.
L’IA generativa, invece, si basa su modelli versatili, capaci di svolgere molte attività diverse a partire da semplici istruzioni in linguaggio naturale (prompt). L’output non è una classificazione, ma un contenuto nuovo e originale, coerente con i pattern appresi durante l’addestramento.
Questo passaggio ha democratizzato l’accesso all’IA, rendendola utilizzabile anche da utenti non tecnici.
I Foundation Models sono modelli di grandi dimensioni addestrati su enormi quantità di dati, capaci di essere adattati a molteplici compiti. All’interno di questa categoria rientrano i Large Language Models (LLM).
Gli LLM sono specializzati nella comprensione e generazione del linguaggio naturale. Sono in grado di:
● comprendere il contesto semantico,
● generare testi coerenti,
● svolgere più task contemporaneamente (traduzione, sintesi, sentiment analysis, copywriting).
Modelli come GPT, Claude, Gemini o LLaMA sono esempi di LLM utilizzati nel marketing conversazionale, nella creazione di contenuti e nell’analisi dei consumatori.
Alla base dei modelli generativi moderni vi sono le reti neurali profonde e, in particolare, l’architettura Transformer, introdotta nel paper Attention Is All You Need (2017).
Il funzionamento si articola in fasi chiave:
● tokenizzazione, in cui il testo viene suddiviso in unità minime;
● embedding, che trasforma i token in vettori numerici;
● self-attention, il meccanismo che consente al modello di pesare l’importanza delle diverse parti del testo;
● decodifica, che genera l’output parola per parola mantenendo coerenza e contesto.
Questo approccio ha superato i limiti delle architetture precedenti, permettendo modelli più scalabili, paralleli e accurati.
Esistono diverse architetture di modelli generativi, ciascuna con caratteristiche specifiche.
Le GAN (Generative Adversarial Networks) funzionano tramite la competizione tra un generatore e un discriminatore e sono particolarmente efficaci nella generazione di immagini realistiche.
I Variational Autoencoders (VAE) comprimono i dati in uno spazio latente e li ricostruiscono, consentendo una generazione più controllata e interpretabile.
I Transformer rappresentano oggi l’architettura dominante per il linguaggio naturale e sono alla base dei modelli GPT e simili.
L’IA generativa è oggi uno dei principali motori di crescita tecnologica ed economica. Il mercato globale dell’IA mostra una crescita esponenziale, con valori stimati nell’ordine dei trilioni di dollari entro il 2030.
Gli Stati Uniti guidano gli investimenti privati, seguiti da Cina ed Europa. L’adozione aziendale è ormai diffusa: una larga maggioranza delle imprese utilizza l’IA in almeno una funzione aziendale, con impatti significativi su produttività, efficienza e ricavi.
Nel marketing e nella consumer analytics, l’IA generativa viene utilizzata per:
Riprendiamo dal punto in cui ci eravamo fermati, entrando nella parte più tecnica ma molto probabile all’esame a crocette: tokenizzazione, funzionamento dei Transformer, input/output e logica predittiva.
Per poter elaborare il linguaggio umano, i modelli di Intelligenza Artificiale devono prima trasformare il testo in una forma numerica. Questo processo prende il nome di tokenizzazione.
La tokenizzazione consiste nel suddividere una frase in token, che possono essere parole intere, parti di parole o singoli caratteri. Ogni token viene poi associato a un identificatore numerico che il modello può elaborare.
Nei modelli linguistici moderni, il vocabolario può contenere decine di migliaia di token, motivo per cui la previsione della parola successiva non è una semplice classificazione binaria, ma una scelta probabilistica tra migliaia di possibilità.
Nel marketing, la tokenizzazione è fondamentale perché permette ai modelli di:
● generare copy coerenti,
● creare descrizioni prodotto personalizzate,
● analizzare il sentiment dei clienti,
● rispondere in modo naturale nei chatbot.
Dopo la tokenizzazione, ogni token viene trasformato in un embedding, cioè un vettore numerico multidimensionale che rappresenta il significato semantico del token.
Gli embedding consentono al modello di comprendere che parole diverse possono essere semanticamente vicine. Ad esempio, termini come “cliente”, “consumatore” e “utente” avranno rappresentazioni numeriche simili.
Questo passaggio è cruciale perché permette ai modelli di:
● cogliere relazioni di significato,
● mantenere coerenza contestuale,
● adattare il tono e lo stile del linguaggio.
Dal punto di vista della consumer analytics, gli embedding sono ciò che consente all’IA di comprendere preferenze, emozioni e intenzioni espresse nei testi.
Il vero elemento rivoluzionario dei Transformer è il meccanismo di self-attention.
La self-attention permette al modello di valutare quali parti dell’input sono più rilevanti per interpretare ogni parola. In altre parole, il modello non legge il testo in modo sequenziale rigido, ma considera tutte le parole contemporaneamente, assegnando pesi diversi a seconda del contesto.
Questo consente di:
● comprendere frasi lunghe e complesse,
● gestire ambiguità linguistiche,
● mantenere coerenza semantica anche su testi estesi.
Nel marketing, la self-attention è ciò che rende possibile:
● risposte contestuali nei chatbot,
● copy coerenti con il brand,
● analisi accurate del sentiment anche in testi ambigui.
I modelli vengono:
L’uso dei modelli generativi nel marketing comporta un cambiamento strutturale:
● il contenuto diventa dinamico,
● l’esperienza cliente diventa personalizzata,
● l’analisi del comportamento si integra con la generazione automatica.
L’IA non sostituisce il marketer, ma ne amplifica la capacità decisionale, rendendo centrale la strategia, l’interpretazione dei dati e la supervisione dei contenuti.
Le domande più probabili su questa parte riguardano:
● differenza tra token e embedding
● ruolo della self-attention
● differenza tra IA tradizionale e generativa
● cosa fa un LLM
● perché i Transformer sono rivoluzionari
Se vuoi, nel prossimo messaggio posso:
● chiudere definitivamente il secondo pacchetto con una sintesi orientata alle crocette
● oppure passare al terzo pacchetto di slide
L’Intelligenza Artificiale Generativa ha un impatto diretto sull’analisi del comportamento del consumatore perché consente di unire analisi e produzione di contenuti in un unico processo.
Tradizionalmente, i dati dei consumatori venivano utilizzati per:
● segmentare il pubblico,
● prevedere comportamenti,
● valutare performance passate.
Con l’IA generativa, questi stessi dati diventano input per la creazione attiva di output, come messaggi personalizzati, suggerimenti di prodotto, esperienze conversazionali e contenuti adattivi. Il comportamento del consumatore non è più solo osservato, ma anticipato e influenzato in tempo reale.
Uno dei principali vantaggi dell’IA generativa è la possibilità di realizzare una personalizzazione massiva, ovvero contenuti diversi per utenti diversi, senza aumentare proporzionalmente i costi.
Grazie ai modelli generativi:
● ottimizzare costi, prestazioni e affidabilità.
Dal punto di vista aziendale, questo approccio rende l’IA generativa:
● più scalabile,
● più flessibile,
● più sostenibile economicamente.
L’uso dell’IA generativa solleva questioni etiche rilevanti, soprattutto in ambito marketing:
● trasparenza dei contenuti generati,
● rischio di bias nei modelli,
● autenticità della comunicazione,
● responsabilità nell’uso dei dati.
Per questo motivo, l’adozione dell’IA deve essere accompagnata da linee guida etiche, supervisione umana e una chiara definizione degli obiettivi strategici.
Il secondo pacchetto di slide si chiude con una riflessione sul futuro: l’IA generativa non è una tecnologia passeggera, ma un cambiamento strutturale.
Le organizzazioni e i professionisti che sapranno:
● comprendere i modelli,
● interpretare i dati,
● integrare creatività e analisi,
avranno un vantaggio competitivo significativo. Per il marketer del futuro, la competenza non è “fare tutto con l’IA”, ma saperla usare in modo strategico e consapevole.
L’analisi delle transazioni rappresenta uno dei pilastri fondamentali della consumer analytics, perché consente di osservare il comportamento reale del consumatore, non ciò che dichiara di fare. I dati transazionali e di attività permettono infatti di studiare quando, come, quanto e con quale frequenza i clienti acquistano prodotti o servizi.
Questi dati offrono ampie opportunità sia per analisi descrittive, che ricostruiscono ciò che è accaduto, sia per analisi predittive, che cercano di anticipare comportamenti futuri come la fedeltà, l’abbandono o l’aumento della spesa.
Un elemento centrale di questo capitolo è l’attenzione ai bias comportamentali, come l’acquisto ripetuto, la fedeltà apparente o la ricerca di varietà. Questi bias possono essere individuati sia a livello individuale sia a livello aggregato, analizzando le dinamiche temporali e spaziali degli acquisti.
Il focus dell’analisi si concentra quindi su concetti chiave come:
● fedeltà del cliente,
● valore del cliente,
● fidelizzazione,
● churn (abbandono),
● pattern di acquisto nel tempo.
L’ultima fase è quella di advocacy, in cui il cliente soddisfatto diventa promotore del brand. Non solo continua ad acquistare, ma lo raccomanda attivamente ad altri, generando passaparola positivo e valore aggiuntivo per l’azienda.
La Customer Journey Mapping è uno strumento strategico che consente di visualizzare in modo strutturato l’esperienza del cliente lungo tutte le fasi del percorso. Questa mappatura permette di collegare ogni fase a metriche specifiche, rendendo l’analisi misurabile e orientata alle decisioni.
Nella fase di awareness si utilizzano metriche come impression, reach, traffico al sito e tempo medio sulla pagina, utili per valutare l’efficacia dei canali di comunicazione.
Durante l’acquisition diventano centrali indicatori come il tasso di conversione, il costo di acquisizione cliente (CPA), il tasso di abbandono del carrello e il click-through rate delle call to action.
Nell’onboarding si analizzano metriche legate all’adozione del prodotto, come il tempo necessario per percepire il valore (time-to-first-value) e il churn precoce.
Nella fase di engagement si osservano frequenza di utilizzo, utenti attivi, valore del cliente e indicatori di soddisfazione.
Infine, nella fase di advocacy entrano in gioco metriche come il Net Promoter Score, il tasso di referral e le recensioni positive.
L’analisi integrata delle metriche lungo il Customer Journey consente di generare insight azionabili, ovvero indicazioni concrete per migliorare le strategie di marketing.
Ad esempio, un aumento del costo di acquisizione accompagnato da un basso engagement può indicare una scarsa qualità dei lead o problemi nell’esperienza iniziale del cliente. Un alto tasso di abbandono del carrello, invece, suggerisce criticità nel processo di checkout, nel prezzo o nella fiducia.
L’aspetto fondamentale è che il Customer Journey non va analizzato solo in modo quantitativo, ma integrato con elementi qualitativi, come emozioni, aspettative e percezioni del cliente.
Nel prossimo messaggio possiamo:
● andare avanti con fedeltà del cliente, NPS e Customer Lifetime Value
● oppure, se preferisci, spezzare il capitolo in blocchi “da crocette” man mano
Dimmi tu e proseguiamo subito.
Perfetto, continuiamo in modo lineare e senza salti, mantenendo lo stesso stile discorsivo da magistrale e focalizzandoci sui concetti più rilevanti per le domande a crocette.
Riprendiamo dal cuore del capitolo: fedeltà del cliente, impatto economico, NPS e valore del cliente.
La fedeltà del cliente non coincide semplicemente con il fatto che un consumatore acquisti più volte lo stesso prodotto. Si tratta di un costrutto complesso e multidimensionale, che include sia componenti economiche sia psicologiche.
In termini generali, la fedeltà può essere definita come l’impegno del cliente a mantenere una relazione nel tempo con un’azienda, riducendo la probabilità di passare ai concorrenti, anche in presenza di alternative valide. Questo impegno può manifestarsi in forme diverse e con intensità differenti.
La fedeltà del cliente si articola in tre dimensioni principali.
La fedeltà comportamentale riguarda ciò che il cliente fa concretamente. È misurabile attraverso indicatori oggettivi come la frequenza degli acquisti, il volume di spesa e la regolarità delle transazioni. Un cliente che acquista spesso lo stesso brand mostra un alto livello di fedeltà comportamentale, ma questo non implica necessariamente un legame emotivo.