











Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
banca dati esame statistica Mercatorum
Tipologia: Dispense
1 / 19
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!












La Statistica si divide in: Statistica descrittiva e inferenza Tra gli obiettivi della Statistica ritroviamo: Validare un modello attraverso l'osservazione dei dati In un'analisi sulle PMI innovative, la spesa per Ricerca e Sviluppo dell'azienda è: Una variabile di interesse La popolazione statistica è formata da: Individui intesi come unità di osservazione Il fenomeno statistico è: La variabile di interesse Tra i vantaggi di fare un campione ritroviamo: Economicità e Tempestività Nella definizione soggetivista la probabilità è data da: Un valore soggettivo L'inferenza statistica è una procedura analitica che: Permette di passare dal particolare al generale Il campione è definito come: Un sottoinsieme della popolazione La statistica descrittiva si occupa di: Descrivere e sintetizzare le informazioni raccolte Tra gli svantaggi ad analizzare direttamente l'intera popolazione abbiamo: Costi elevati I caratteri qualitativi si distinguono in: Sconnessi e ordinabili Sulle modalità di un carattere qualitativo sconnesso si possono fare solo operazioni di: Uguaglianza e disuguaglianza Se la modalità del carattere osservato è espresso con un attributo abbiamo: Un carattere qualitativo Il carattere "Reddito mensile" è: Quantitativo continuo Il carattere "Squadra di calcio per cui si tifa" è: Qualitativo sconnesso Se la modalità del carattere osservato è espressa con un numero abbiamo: Un carattere quantitativo Il carattere "Numero di figli per coppia" è: Quantitativo discreto
I caratteri quantitativi si distinguono in: Discreti e continui Sulle modalità di un carattere quantitativo discreto si possono fare solo operazioni di: Tutte Il carattere "Comune di nascita" è: Qualitativo sconnesso Con Xi si indica: La i-esima modalità Le frequenze si possono calcolare per le seguenti tipologie di caratteri: Tutti Le frequenze semplici si determinano effettuando: Il conteggio Se su otto PC osservati in un ufficio, tre risultano difettosi, tre corrisponde a: La frequenza semplice della modalità difettosi, del carattere "Funzionamento PC" Il totale delle frequenze è uguale al: Totale delle osservazioni Con il simbolo Σ si indica: La sommatoria Con ni si indica: La i-esima frequenza Nelle distribuzioni di frequenza, le modalità dei caratteri quantitativi continui sono: Raggruppate in classi Per un carattere qualitativo sconnesso, l'elenco con cui si riportano le modalità nella tabella di frequenze è: Arbitrario L'ultima classe di un carattere quantitativo continuo è: Una classe aperta o chiusa Il totale delle frequenze percentuali è: Cento Le frequenze relative si calcolano: Dividendo le frequenze semplici per il totale n Le frequenze cumulate si ottengono: Facendo la somma passo passo delle rispettive frequenze Il totale delle frequenze relative è: Uno Le frequenze relative si possono calcolare per quali tipologie di caratteri: Tutti Le frequenze percentuali si calcolano: Moltiplicando le frequenze relative per cento Con N3 si indica: La frequenza cumulata semplice della terza modalità Le frequenze cumulate possono calcolarsi: Per caratteri almeno ordinabili
Quando si calcola la densità di frequenza implicitamente si fa l'ipotesi di: Equidistribuzione L'area del rettangolo è dato da: Dipende dal fenomeno analizzato La moda è una media: Di posizione Nel caso di carattere quantitativo continuo, la moda corrisponde alla modalità con: Massima densità Le medie vengono chiamate anche: Indici di tendenza La moda si può calcolare: Per qualsiasi carattere La capacità informativa della Mediana è: Superiore alla Moda La media è espressa attraverso: Un solo valore Se due modalità presentano uguale massima frequenza diremo che: La distribuzione è bimodale Sono definite Medie di Posizione, quelle medie che si riferiscono: Alla particolare posizione occupata da una osservazione La moda è definita come quella modalità che presenta: Massima frequenza Guardando un grafico a torta, la moda corrisponde a: La sezione più grande La mediana è quel valore che occupa all'interno della distribuzione, la posizione: Centrale Per determinare il valore al centro della distribuzione è utile calcolare: Le frequenze cumulate Se n è dispari, la posizione occupata dalla Mediana sarà: (n+1)/ La posizione della Mediana deve essere: Un numero intero La distribuzione viene divisa dalla Mediana lasciando: Metà delle osservazioni prima della Mediana e metà dopo Se il carattere è per classi: Si deve applicare una formula particolare per trovare il valore all'interno della classe La Mediana può calcolarsi per caratteri: Almeno qualitativi ordinabili
Se n è pari, esistono due posizione centrali: n/2 e n/2)+ Se ho osservato i valori 0, 5, 2, la mediana è: 2 Se ho rilevato il carattere "Comune di residenza", la mediana: Non si può calcolare I Quantili sono: Dipende da quanto si è fissato k Il secondo quartile corrisponde a: La Mediana I Quartili sono: 3 I Decili dividono la distribuzione in: 10 parti Il terzo quartile lascia a destra il: 25% delle osservazioni Per trovare i quartili si divide n per: 4 I quantili e i quartili possono calcolarsi per: Caratteri almeno ordinabili Il primo quartile lascia alla sua sinistra il: 0 Il primo decile lascia alla sua destra il: 0,01 oppure 90% Sul carattere "Livello di reddito" si possono calcolare: Tutti i quantili, per k qualsiasi La media aritmetica può calcolarsi per: Caratteri quantitativi Se in una distribuzione si sono osservati i valori estremi 3 e 20, la media: Sarà compresa tra questi valori Se su una distribuzione ho calcolato una media pari a 7 e aumento di 2 tutti i valori osservati, la nuova media sarà pari a: 9 La media aritmetica è una media: Analitica La somma degli scarti dalla media è: Nulla Se ho osservato i voti degli esami su un gruppo di 7 femmine ed è pari a 25 e su un gruppo di 5 maschi che è 23, la media totale sarà: 24, Nel calcolo della media aritmetica si considerano: Tutte le osservazioni Se su una distribuzione ho calcolato una media pari a 8 e sottraggo a tutti i valori osservati 2, la nuova media sarà pari a: 6
Se ho calcolato sui dati una varianza pari a 5 e poi moltiplico tutti i valori originari di 2, la nuova varianza sarà: 20 Su una distribuzione ho calcolato la varianza ed è pari a 3. Aumento tutti i valori di due. La nuova varianza è: 3 Se devo confrontare la variabilità di due distribuzioni uso: Il coefficiente di variazione La standardizzazione è: Una trasformazione lineare dei dati I valori standardizzati sono: Con media nulla Il coefficiente di variazione è dato da: Sqm diviso la media Il Box-plot è: Un grafico sulla variabilità In una distribuzione ho calcolato una media = 3 e un sigma = 2. Il valore standardizzato di 1 è: - Un valore standardizzato negativo: Indica che il valore è sotto la media Un valore standardizzato superiore a 3 indica: Un dato anomalo I valori standardizzati: Non hanno unità di misura Se la distribuzione A ha sigma = 3 e la distribuzione B un sigma = 7, allora: Non posso saperlo, se non conosco le medie La frequenza congiunta si riferisce: Ad una coppia di modalità X,Y La distribuzione condizionata X/Y ci esprime come: Si distribuisce la X per un dato valore della Y La distribuzione marginale si riferisce a: Solo una variabile (X o Y) La tabella doppia permette di analizzare: L'interdipendenza In una tabella doppia è possibile ricavarsi: Due distribuzioni marginali Esistono tante distribuzioni condizionate della X: Quante sono le modalità della Y Per la distribuzione marginale si può calcolare anche la media: Dipende se il carattere è quantitativo
La somma delle frequenze relative congiunte è: 1 Le distribuzioni condizionate e quella marginale sono: Dipende dalla distribuzione Le distribuzioni marginali e condizionate possono essere determinate in termini di frequenze: Assolute, relative e percentuali Se X è indipendente da Y, allora: Anche Y sarà indipendente da X Affinchè ci sia dipendenza perfetta, la tabella deve essere: Quadrata Nell'analisi della connessione i due caratteri X e Y sono: Qualsiasi Con nij si indica: La frequenza assoluta doppia Nel caso di indipendenza le frequenze doppie sono uguali a: Il prodotto delle marginali diviso il totale Se tutte le distribuzioni condizionate sono uguali tra loro allora c'è: Indipendenza Nella dipendenza perfetta: Ad ogni modalità della X corrisponde solo una modalità della Y e viceversa Se le condizionate sono uguali, allora: Sono uguali anche alla marginale In una distribuzione con 50 osservazioni, se n1.=10 e n.1= 10, in caso di indipendenza deve aversi: n11= Nel caso di dipendenza perfetta, la conoscenza della modalità di X mi definisce: Con certezza la modalità assunta dalla Y Nel caso di massima dipendenza il valore del chi2 è: n x min((h-1),(k-1)) Nell'analisi dell'indipendenza, la contingenza è data da: cij = (nij - n*ij) L'indice del chi2 è un indice di indipendenza: Assoluto L'indice del chi2 è uguale a zero se: Se tutte le frequenze osservate sono uguali a quelle teoriche L'indice di Cramer varia tra: Zero e uno Se l'indice di Cramer = 1, significa che si ha: Massima dipendenza L'indice del chi2 può essere negativo nel caso in cui: Mai
Se r=-0.95, allora: X e Y sono fortemente legate linearmente La presenza di dati anomali: Può alterare il risultato del coefficiente di correlazione Nella retta di regressione le due variabili X e Y sono: Entrambe quantitative I minimi quadrati vengono usati per specificare: La migliore retta di regressione Con il termine "coefficiente di regressione" si intende: Il coefficiente angolare della retta di regressione Nella retta di regressione X e Y sono con un legame di: Dipendenza di una sull'altra La retta dei minimi quadrati è quella retta che: Più si avvicina ai punti osservati Se ho una retta di regressione Y=2+1.5X allora posso dire che: All'aumentare di una unità di X, Y aumenta di 1. Se ho una retta di regressione Y=2+1.5X allora posso dire che: Il coefficiente di correlazione è positivo Se ho una retta di regressione Y=2+1.5*X allora posso dire che quando X è 2, il valore teorico di Y sarà: 5 La relazione tra X e Y può essere in generale espressa: Da una qualsiasi funzione f L'intercetta della retta esprime: La parte di Y indipendente da X Il coefficiente R2 è un indice di: Bontà di adattamento Se ho R2= 0.75 allora posso dire che: La retta non spiega il 25% Il valore osservato Y può essere scomposto in: Y teorico più un residuo e La varianza della Y è scomposta come: Var(Y) = Var(Y^) + Var(e) Se ho un coefficiente di correlazione pari a -0.5, allora: R2= 0. Il coefficiente di determinazione varia tra: Zero e uno Indicare se è possibile avere un coefficiente di correlazione negativo e un R positivo: Si R2 esprime quanta parte della variabilità di Y: E' spiegata dalla retta Se la retta passa perfettamente per i punti osservati, R2 sarà pari a: Uno
Se la varianza di Y è uguale alla varianza residua, R2 sarà uguale a: Zero I residui si devono distribuire rispetto alle X: In modo casuale Se ho un R2 = 0.15, posso dire che: Non esiste dipendenza tra la Y e la X Gli outlier sono: Dati anomali Se R2=0 allora: Il coefficiente di regressione è nullo L'istogramma dei residui deve avere una forma: Campanulare Se R2=0.85 posso dire che: La retta spiega molto bene i punti Se la retta di regressione è una retta parallela all'asse delle X, allora: R2= Se i miei punti hanno un andamento perfettamente parabolico, R2 sarà: Zero Se la retta di regressione è una retta parallela all'asse delle Y, allora: R2= Se i residui crescono al variare di X, allora: La retta non è buona Nella definizione classica la probabilità è data da: Il rapporto tra casi favorevoli e casi totali La probabilità è un valore: Compreso tra zero e uno Se A=(2,3,4) e B=(4,5,6), la loro intersezione è: 4 Si definisce esperimento casuale: Un esperimento condotto in situazioni di incertezza Nella definizione frequentista la probabilità è data da: La frequenza relativa, all'aumentare del numero delle prove Se A e B sono indipendenti, allora la probabilità della loro intersezione è: P(a)*P(B) Se A=(2,3,4) e B=(4,5,6), la loro unione è: (2,3,4,5,6) Se A e B sono incompatibili significa che: L'intersezione tra A e B è vuota Nella definizione soggettivista la probabilità è data da: Un valore soggettivo Se A e B sono indipendenti, allora: P(A!B)=P(A)
Il valore atteso corrisponde: Alla media Se n=5 e p=0.5, quanto è la probabilità di avere 2 successi: 0, Se n=5 e p=0.5, quanto è la probabilità di avere 0 successi: 0, Ai fini dell'applicazione della binomiale, le prove devono essere: Ripetute Se n=5 e p= 0.2, allora il valore atteso è: 1 n=5 e p=0.5, quanto è la probabilità di avere 5 successi: o,o Se n=5 e p= 0.2, allora la varianza è: 0.01 (oppure 0.8 nei test) La funzione Normale è definita per valori di X compresi tra: Meno infinito e più infinito Due distribuzioni Normali con stessa varianza e diversa media: Sono identiche per traslazione La funzione di densità Normale ha un andamento: Campanulare All'aumentare della variabilità, la curva Normale si: Abbassa Nella formula della Normale figurano esplicitamente: Media e varianza I punti di flesso della curva Normale si trovano in corrispondenza di: (m-σ) e (μ+σ) Con X~ N(3, 2) si indica una media con: Media = 3 e sqm= 2 Nella funzione Normale: Media, mediana e moda coincidono La curva Normale è particolarmente importante nelle applicazioni della statistica perchè: Molti fenomeni si distribuiscono approssimativamente ad una normale La curva normale è: Una variabile casuale continua La variabile standardizzata ha: Sempre media nulla Le tavole della Normale forniscono i valori di: Pr(Z ≤ zp) = Φ(zp) La trasformazione di standardizzazione è: Z = (X – μ)/σ E' possibile passare da una variabile X ad una standardizzata Z: Sempre La Pr(Z : 0,
La variabile standardizzata ha: Sempre sigma = 1 Se X ha media = 3 e sigma = 2, allora il valore standardizzato di x=1 è: - La normale standardizzata ha andamento: Campanulare Se X = N(1,2), allora Pr(0 : Pr(-0. La Pr(Z : 0, La Pr(Z: 43, La Pr(Z: 25, La PR(Z<0.65) è uguale a: 0. La PR(Z>0.34) è uguale a: 0. Nella curva normale, la Pr(Z : 1 - Pr(Z Nella curva normale, la Pr(Z>b) è uguale a: 1 - Pr(Z La Pr(Z>0.34) è uguale a: 25, La Pr(Z>-0.34) è uguale a: 43, Il valore di z che corrisponde ad una probabilità 0.5 è: 0 Il valore di z che corrisponde ad una probabilità 0.8 è: 0, Sia X una normale con media = 3 e sigma = 2, il suo terzo quartile è: 0, Nella normale standardizzata il terzo quartile è: 0, Tra i vantaggi del campionamento casuale semplice troviamo: Si estraggono i grappoli e poi si osservano tutte le unità all'interno del grappolo Uno degli svantaggi del campionamento a due stadi è: Si rileva una perdita di efficacia quando le unità di primo stadio sono molto simili La frazione di campionamento è data dalla formula: n/N x 100% Il campionamento a grappolo viene usato spesso nel caso di: Ispezionamento delle merci Nel campionamento sistematico si scelgono le unità: Una ogni k della popolazione
Nel test sulla media, se l'ipotesi alternativa è bidirezionale, si accetta se: La statistica-test |z| La statistica usata nell'ambito della verifica delle ipotesi é: Una statistica-test Se non è nota la varianza della popolazione la statistica-test da usare per la verifica delle ipotesi sulla media è: t = (x – μ)/s:√n L'ipotesi alternativa corrisponde a: L'ipotesi che quella nulla non sia verificata La procedura dei test in generale è: Definizione ipotesi, individuazione statistica- test, decisione accettazione L'errore di secondo tipo consiste in: Accettare l'ipotesi nulla quando questa è falsa I formati comunemente usati nelle banche dati e leggibili da Excel sono: Xls, csv e txt La cartella di lavoro di Excel è composta da: Diversi fogli di lavoro In Excel le statistiche standard si trovano come: Funzioni statistiche Esistono in Excel delle routine particolari di carattere statistico che ritroviamo tra: Le analisi dei dati I dati scaricati da banche dati normalmente si presentano: In elenco per unità Dal Menu è possibile scegliere i grafici da costruire. Tra questi ritroviamo: Il grafico a barre e l'istogramma Nella costruzione dell'istogramma Excel commette un errore: Non calcola le densità di frequenze Per costruire le tabelle di frequenze consideriamo: Una procedura manuale Nel caso i dati debbano essere raccolti in intervalli di valori: La funzione "Frequenza" può essere opportunamente applicata Per calcolare le frequenze nel caso di caratteri qualitativi si usa la funzione: =conta.se Nella funzione "Quartile" ponendo nel secondo argomento il valore 3 si ottiene: Il Terzo Quartile
La funzione "Frequenza" permette di scegliere tra: Solo frequenze assolute Se si vuole calcolare la Varianza della popolazione si deve usare la funzione: =pop.var Al fine di calcolare congiuntamente tutte le frequenze rispetto alle varie modalità, la funzione "Frequenza" deve essere digitata in formato: Matriciale E' possibile ricavarsi una tabella riassuntiva di alcune statistiche descrittive usando: L'analisi dei dati La funzione "=VAR(...)" si riferisce alla: Varianza campionaria In Excel tra le statistiche descrittive, con "intervallo" si intende: Il campo di variazione La funzione "=Regr.lin" si trova: Tra le funzioni statistiche Nell'analisi di regressione il grafico appropriato da disegnare con Excel è: Il grafico di dispersione La funzione "=Regr.lin" deve essere digitata su una matrice di dimensione: 2x Se nella funzione "=Regr.Lin" si pone Stat=Vero vengono fornite anche: Devianza di regressione e residua, Coefficiente di determinazione Nella funzione "Correlazione" di Excel le due matrici da selezionare hanno: Stessa dimensione La regressione nell'analisi dei dati fornisce rispetto alla funzione statistica una serie di informazioni di tipo: Inferenziale La correlazione in Excel si calcola tramite: Funzione =correlazione(...) Nell'analisi dei dati, la regressione permette anche di costruire sui residui: Il grafico di dispersione rispetto a X Se nella funzione "=Regr.Lin" si pone Cost=Falso: L'intercetta viene esclusa dalla stima La regressione in Excel può essere determinata con: Con un numero qualsiasi di variabili esplicative