
Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
DOMANDE DATA MINING RISOLTE
Tipologia: Prove d'esame
1 / 1
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!

DOMANDE TIPO CORSO DI DATA MINING A.A. 2013-
Il datawarehouse aziendale ed il data mart Il data warehouse è un archivio informatico contenente i dati di un'organizzazione, progettati per consentire di produrre facilmente analisi e relazioni utili a fini decisionali-aziendali. Ha 4 caratteristiche principali: è orientata al soggetto, integrata, non volatile e variabile nel tempo. Orientata al soggetto: i dati vengono archiviati in modo da essere facilmente letti o elaborati dagli utenti. Integrata : il data warehouse deve essere in grado di integrarsi perfettamente con la moltitudine di standard utilizzati dalle diverse applicazioni dalle quali colleziona i dati. È variabile nel tempo poiché il suo orizzonte temporale oscilla solitamente tra i 5 e i 10 anni, e in questo lasso di tempo i dati raccolti non sono altro che una sofisticata serie di “istantanee” scattate in precisi istanti temporali. Non volatile : Ogni volta che si aggiorna non si perdono le informazioni precedenti, ma si va solo ad aggiungere un’altra istantanea. Componenti essenziali di un sistema data warehouse sono anche gli strumenti per localizzare, estrarre, trasformare e caricare i dati, gli strumenti per gestire un dizionario dei dati e gli strumenti di business intelligence. Due approcci per la creazione di un data warehouse: creazione di un unico archivio centralizzato oppure unione di diversi database tematici (data mart). Un’altra importante componente del sistema di data warehouse è la raccolta di data mart. Un data mart è un database tematico, rappresentato di solito in forma semplice, espressamente rispondente a specifici obiettivi (per esempio, data mart di marketing).
Gli indici di eterogeneità Si calcolano per distribuzioni di caratteri qualitativi. Situazioni estreme: 1)Eterogeneità nulla, quando tutte le unità presentano la medesima modalità del fenomeno in oggetto,, ovvero p (^) i=1 per un certo i, p (^) i = 0 per ogni altro i; 2) Eterogeneità massima quando le unità sono ripartite uniformemente tra le k modalità del carattere, p (^) i =1/k, per i=1,2,…k