Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi Dati di Mercato: Obiettivo, Processo Quantitativo, Tipi e Caratteristiche di Dati, Appunti di Database Distribuiti

Una panoramica dell'analisi dei dati di mercato, compreso l'identificazione e formulazione degli obiettivi, il processo quantitativo, i tipi e le caratteristiche dei dati. Il documento copre le categorie qualitative e quantitative, le distribuzioni di frequenza e probabilità, e le analisi univariata, bivariata e multivariata.

Tipologia: Appunti

2021/2022

Caricato il 02/01/2022

alessandro-micagni
alessandro-micagni 🇮🇹

5

(3)

5 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DATA ANALISIS (guarda slides)
Ricerche di mercato
Svolte da strutture interne (in caso di grandi aziende) oppure fornitori esterni generalisti( nielsen,
ipsos, doxa) oppure ricerche multyclient ed ad hoc , inoltre vi sono i fornitori specializzati per
segmento, attività e tipo d’analisi.
PROCESSO DELL’ANALISI QUANTITATIVA DI MERCATO
1. Identificazione e formulazione dell’obbiettivo
2. Quale formula di ricerca ? esplorativa, descrittiva o causale-predittiva
3. Quali dati?
Sondaggio (survey)
Rilevazione di dati primari con interviste strutturate a un campione di soggetti molto generale e
potenzialmente costoso, il quale richiede competenze e rigore nel definire gli obbiettivi, i dati
rilevati sono dati dichiarati e non dati oggettivi
alternative
5/10/2021
le analisi si basano su matrici di dati per unità variabili
Ogni riga è un unità statistica
Le colonne sono le variabili
Interpretazione geometrica :
Ogni variabile si può interpretare come una dimensione
Ogni unità si può interpretare come un punto nello spazio con k dimensioni
CARATTERISTICHE DEI DATI
1. CATEGORICI (qualitativi)
2. NUMERICI (quantitativi)
I CATEGORICI si suddividono in NOMINALI E ORDINARI, i nominali sono BINARI
I NUMERICI si suddividono in INTERVALLI E RAPPORTI
CATEGORICI = si esprimono in categorie o modalità
Ogni unità deve appartenere ad una e una sola categoria
Non si possono eseguire operazioni aritmetiche
Si possono calcolare frequenze e percentuali
Nominali (come le marche )
Ordinali = le categorie sono ordinate, ma le distanze tra di esse non sono uguali (istruzione,
scala Mercalli, classifiche e ordinamenti, scale Likert (spesso si usano come scale
numeriche)
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Analisi Dati di Mercato: Obiettivo, Processo Quantitativo, Tipi e Caratteristiche di Dati e più Appunti in PDF di Database Distribuiti solo su Docsity!

DATA ANALISIS (guarda slides) Ricerche di mercato Svolte da strutture interne (in caso di grandi aziende) oppure fornitori esterni generalisti( nielsen, ipsos, doxa) oppure ricerche multyclient ed ad hoc , inoltre vi sono i fornitori specializzati per segmento, attività e tipo d’analisi. PROCESSO DELL’ANALISI QUANTITATIVA DI MERCATO

  1. Identificazione e formulazione dell’obbiettivo
  2. Quale formula di ricerca? esplorativa, descrittiva o causale-predittiva
  3. Quali dati? Sondaggio (survey) Rilevazione di dati primari con interviste strutturate a un campione di soggetti molto generale e potenzialmente costoso, il quale richiede competenze e rigore nel definire gli obbiettivi, i dati rilevati sono dati dichiarati e non dati oggettivi alternative 5/10/ le analisi si basano su matrici di dati per unità variabili Ogni riga è un unità statistica Le colonne sono le variabili Interpretazione geometrica :  Ogni variabile si può interpretare come una dimensione  Ogni unità si può interpretare come un punto nello spazio con k dimensioni CARATTERISTICHE DEI DATI
  4. CATEGORICI (qualitativi)
  5. NUMERICI (quantitativi) I CATEGORICI si suddividono in NOMINALI E ORDINARI, i nominali sono BINARI I NUMERICI si suddividono in INTERVALLI E RAPPORTI CATEGORICI = si esprimono in categorie o modalità  Ogni unità deve appartenere ad una e una sola categoria  Non si possono eseguire operazioni aritmetiche  Si possono calcolare frequenze e percentuali  Nominali (come le marche )  Ordinali = le categorie sono ordinate, ma le distanze tra di esse non sono uguali (istruzione, scala Mercalli, classifiche e ordinamenti, scale Likert (spesso si usano come scale numeriche)

DATI NUMERICI

Rappresentano informazioni intrinsicamente numeriche , si può eseguire ogni tipo di calcolo si suddividono in :  A intervalli (lo zero è convenzionale)  A rapporti (lo zero significa assenza del fenomeno) I numerici sono suddivisi in discreti (conteggio) o continui (misura). I numeri sono sempre rappresentati come un insieme finito di cifre, quindi non esistono numeri reali, sono sempre numeri interi. DATI BINARI (dicotomici) Sono dati nominali, ma si possono utilizzare come dati numerici in molte analisi, un dato categorico con k categorie si può trasformare in k dati binari. (one hot encoding) Codificando i dati con risposte si o no e reinterpretandoli con 0 si o 1 no ad esempio. Codificando la variabile posso trovare la media di una variabile inizialmente categorica. Qualunque variabile categorica nominale può essere convertita in un insieme di variabili binarie. LIVELLI DI ANALISI

  1. Analisi univariata ; una variabile alla volta, statistiche descittive
  2. Analisi bivariata ; relazioni tra due variabilli
  3. Analisi multivariata : k variabili alla volta ANALISI UNIVARIATA Distribuzioni di frequenza Associa ad ogni possibile valore di una variabile la frequenza relativa o assoluta con la qualsiasi presenta Si può applicare a qualsiasi tipo di dato:  Per variabili discrete fornisce tutta l’informazione disponibile  Per variabili continue si raggruppano i valori in classi Guarda slide per definizioni e ripassa (IMPORTANTE) definizione e funzione delle statistiche e non formule MEDIA, VARIANZA,MODA,MEDIANA ,PERCENTILI E QUARTILI,DEVIAZIONE STANDARD e SCARTO INTERQUARTILE. La media sfrutta meglio l’informazione rispetto alla mediana, poiché la media è più sensibile alle variazioni mentre la mediana non varia al cambio di un unico valore estremo. Cerca on line il codice per trovare il trova e sostituisci ctrl + f Ricorda somma automatica quando ho più dati Per far rimanere un valore di una formula fermo quando copio una cella blocco righe e colonne mettendoci davanti il simbolo el dollaro/$F$11 , gli indirizzi relativi diventano assoluti(command + t per mettere il numero con il dollaro) Per esame ricorda le diverse formattazioni disponibili con excel Control maiuscolo freccina mi selezionano le colonne e le righe Per continuare a guardare l’intestazione faccio blocc riquadri nella sezione visualizza Per bloccare sia riga che colonna vado in B2 e faccio blocca riquadri Usa la funzione conta.se per le distribuioni di frequenza

 la correlazione non implica una relazione di causa effetto: afferma che tra due variabili c’è una relazione sistematica, ma non che una determina l’altra. (esempio di relazioni non lineari sono le parabole ). Mi dice se c’è una relazione, non di che tipo di relazione si tratta.(ci dice la forza della relazione) RELAZIONE TRA UNA VARIABILE CATEGORICA ED UNA NUMERICA  Si analizza mediante la differenza in media  La variabile categorica identifica i gruppi  Si confrontano le medie della variabile numerica nei gruppi  Se le medie nei gruppi sono diverse c’è una relazione  Se le medie sono uguali non c’è relazione CORRELAZIONE E DIFFERENZA IN MEDIA Sono concetti diversi ed indipendenti. RELAZIONE TRA DUE VARIABILI CATEGORICHE  Dipendenza o indipendenza tra due variabili categoriche  Si analizza con le frequenze congiunte, che si rappresentano con tabelle a doppia entrata In tabella righe e colonne sono le due variabili categoriche, le frequenze ai bordi sono i totali di righe e colonne (distribuzioni di frequenza delle variabili) Le frequenze congiunte ci mostrano la frequenza dei casi che presentano una determinata caratteristica delle due variabili categoriche. Due variabili sono indipendenti se la distribuzione di una non dipende dai valori dell’altra. Si vede vedendo le distribuzioni relative delle singole righe. (se le frequenze sono uguali su tutte le righe è uguale alla riga dei totali in colonna. Le variabili sono indipendenti quando sono uguali su tutte le colonne ed inoltre uguali a quella dei totali. Indipendenza significa che :  le percentuali di riga sono approssimativamente uguali in tutte le righe (uguale per le colonne)  le frequenze congiunte dipendono solo dalle frequenze marginali  le frequenze osservate sono uguali a quelle teoriche frequenza teorica dipende solo dalla frequenza marginale Frequenza teorica= frequenza che avrei se le variabili fossero indipendenti = totale riga per totale colonna diviso numero totale di unità (guarda slide) Se le teoriche corrispondono alle osservate vi è indipendenza. X al quadrato (chi quadrato) , valore che confronta le frequenze osservate con le frequenze teoriche calcolando la distanza dall’indipendenza. ( differenza al quadrato tra freq.osservate e freq. Attese diviso le frequenze teoriche (che sono uguali alle attese)

Chi quadrato= 0 indipendenza Chi quadrato maggiore di 0 vi è dipendenza 19/10/ (guardare slide) DISTRIBUZIONE DI PROBABILITÀ  Le distribuzioni di frequenza sono in genere basate su dati osservati (basati su un campione)  Le distribuzioni di probabilità sono i corrispondenti modelli teorici probabilistici di riferimento  Ne esistono moltissime, per modellare fenomeni diversi  Si distinguono distribuzioni discrete e continue (variabile discreta= distribuzione discreta, variabile continua= distribuzione continua) DISTRIBUZIONI DI PROBABILITÀ DISCRETE Una distribuzione discreta è un’associazione tra i valori che una variabile aleatoria può assumere e la probabilità di ognuno di questi valori. La somma delle probabilità è uguale a 1. DISTRIBUZIONI CONTINUE  Per variabili discrete la probabilità è concentrata nei punti  Per variabili continue la probabilità è l’area che sottende la curva  L’area totale sotto la curva è 1  La probabilità in un singolo punto è zero  L’area sotto la curva tra i due valori presi in considerazione a e b rappresenta la probabilità che x sia compresa tra questi due valori. DISTRIBUZIONE NORMALE La distribuzione normale (gaussiana) è una distribuzione continua definita trameno infinito e più infinito. Importante ricordare che nella formula gli unici due parametri sono media e la varianza (deviazione standard) della distribuzione. La media caratterizza la posizione orizzontale, facendo scorrere la curva lungo l’asse orizzontale. La deviazione standard ci indica quanto è concentrata la probabilità nella curva, più la deviazione è ampia più la curva è schiacciata e si disperde la probabilità. La distribuzione normale è simmetrica con le probabilità concentrate al centro, media= moda= mediana. Una volta passati dal caso pratico al caso teorico sono in grado di rispondere a domande come :  Qual è la probabilità di valori tra a e b?  Qual è la probabilità di aver valori maggiori di a? Per calcolare l area utilizzo stat distribution.com La distribuzione normale è la forma limite delle altre distribuzioni. DISTRIBUZIONE NORMALE STANDARD Se la media è 0 e la deviazione standard è 1 la distribuzione è una normale standard. Qualunque variabile casuale normale può essere convertita in una variabile standardizzata madiante l’operazione di standardizzazione: Z= x-media fratto deviazione standard + slide