Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Clustering analysis applicata, Appunti di Statistica Inferenziale

Università degli Studi di Siena (UNISI)Statistica Inferenziale

clustering o analisi dei gruppi (dal termine inglese cluster analysis introdotto da Robert Tryon nel 1939) è un insieme di tecniche di analisi multivariata dei dati volte alla selezione e raggruppamento di elementi omogenei in un insieme di dati

Tipologia: Appunti

2018/2019

Caricato il 21/05/2019

michele-papasidero 🇮🇹

(1)

2 documenti

1 / 81

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

Clustering

Sistemi informativi per le Decisioni

Slide a cura di Prof. Claudio Sartori

Scopri Appunti di Statistica Inferenziale Università degli Studi di Siena (UNISI)

Documenti correlati

Analisi Multivariata in Economia: Clustering, PCA e Regressione Panel

Clustering Modellistico

Analisi Statistica Multivariata: Regressione Multipla e Clustering

relazione clustering

Clustering: Suddividere un insieme eterogeneo in sottoinsiemi

Introduzione al Clustering: Tecniche di Data Mining

Text Clustering - Parte 1

Grafici statistici e metodi di clustering

Data Mining e clustering

Riassunto parte di Clustering

Clustering con modelli mistura

Clustering e Data Mining

Anteprima parziale del testo

Scarica Clustering analysis applicata e più Appunti in PDF di Statistica Inferenziale solo su Docsity!

Clustering

Sistemi informativi per le Decisioni

Slide a cura di Prof. Claudio Sartori

Clustering

Scenario: Analisi e gestione dei mercati

Customer profiling

Quali tipi di cliente acquistano quali prodotti?

Clustering, classificazione

Identificare le richieste dei clienti

Trovare il prodotto migliore per clienti diversi

Predire quali fattori possono attrarrenuovi clienti

Produrre informazioni di sommario

Rapporti multi-dimensionali

Sintesi statistiche descrittive

Clustering

Clustering - descrizione del problema

input:

un insieme di N oggetti d-dimensionali

output:

determinare un partizionamento naturaledell'insieme di dato in k clusters + rumore

proprietà desiderate nei cluster:

oggetti nello stesso cluster sono simili^ Î

massimizzata la similarità intra-cluster

oggetti in cluster diversi sono differenti^ Î

minimizzata la similarità inter-cluster

Clustering

Prospettiva di ricerca

Dal passato...^

il clustering è un problema ben noto in statistica

ricerche più recenti

machine learning ^

database ^

visualizzazione

... per il futuro^

algoritmi efficaci ed efficienti per il clustering di grandi insiemidi dati (in rapido aumento), con elevato numero di dimensioni,molto rumore

richiede scalabilità rispetto a:

numero di punti dati (N) ^

numero di dimensioni (d) ^

livello di rumore ^

frequenza di aumento del numero di punti dati

Clustering

Alcuni datiPotrebberofacilmente esseremodellati comeuna distribuzionegaussiana con 5componentiMa cerchiamouna soluzione più“amichevole”e soddisfacente...

Clustering

Compressione con perdita Supponiamo di dovertrasmettere le coordinatedi punti presi a casoda questo insieme: dovremoideare un meccanismodi codifica/decodifica.Limitazione: ci è permessodi trasmettere soltanto due bitper punto. La trasmissione sarà con perdita (lossy)Perdita =

somma dei quadrati

degli errori tra le coordinatedecodificate e quelle originali.Quale codifica/decodificaminimizza la perdita?

Clustering

Idea due Supponiamo di dovertrasmettere le coordinatedi punti presi a casoda questo insieme: dovremoideare un meccanismodi codifica/decodifica.Limitazione: ci è permessodi trasmettere soltanto due bitper punto. La trasmissione sarà con perdita (lossy)Perdita =

somma dei quadrati

degli errori tra le coordinatedecodificate e quelle originali.Quale codifica/decodificaminimizza la perdita?

Idee migliori?

partizionare lo spazio in una griglia,decodificare ogni coppia di bit come ilcentroide di tutti i dati nella rispettiva griglia

Clustering

K-means

chiedi all’utente quanti

cluster vuole

(es. k=5)

Clustering

K-means

chiedi all’utente quanti

cluster vuole

(es. k=5)

scegli a caso

posizioni

come centri

ogni punto trova quale è

il suo centro più vicino

Clustering

K-means

chiedi all’utente quanti

cluster vuole

(es. k=5)

scegli a caso

posizioni

come centri

ogni punto trova quale è

il suo centro più vicino

ogni centro trova

il centroide dei puntiche possiede...

Clustering

K-meansPartenza Example generated byDan Pelleg’s super-duperfast K-means system:

Dan Pelleg and AndrewMoore. Accelerating Exactk-means Algorithms withGeometric Reasoning.Proc. Conference onKnowledge Discovery inDatabases 1999,(KDD99) (available onwww.autonlab.org/pap.html

)

Clustering

K-meanscontinua…

Clustering

K-meanscontinua…

Clustering

K-meanscontinua…