Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statistica domande aperte, Panieri di Statistica

statistica domande aperte paniere per esame

Tipologia: Panieri

2022/2023

Caricato il 14/06/2024

Salvos1991
Salvos1991 🇮🇹

1 documento

1 / 20

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
A proposito della moda descrivere: a) che cos'è la densità di classe e come si calcola; b) la formula della moda per valori suddivisi in classi; c) che cos'è una distribuzione amodale ed una distribuzione
plurimodale
Quando le classi sono equi-ampie si può utilizzare, ai fini del calcolo delle misure centrali e di variabilità, il valore centrale di classe, tenendo conto che tale procedura presenta un certo grado di
approssimazione dei risultati. Qualora, invece, le classi non sono equi-ampie è necessario disegnare per ogni classe un rettangolo che ha per altezza la densità di classe, data dal rapporto fra la frequenza
assoluta ni e lampiezza di classe (ai-1, ai) e per base lampiezza di classe stessa. Mo=Lmo+∗𝐴𝑐𝑙𝑎𝑠𝑠𝑒 dove: Lmo è lestremo in feriore della classe modale. Δfinf è la differenza fra la frequenza assoluta
della classe modale e la frequenza assoluta della classe immediatamente inferiore a quella modale. Δfsup è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe
immediatamente superiore a quella modale. Aclasse è l’ampiezza della classe modale. La distribuzione amodale presenta frequenze tutte uguali. La Moda può essere definita come: una misura di
tendenza centrale che si applica ai caratteri qualitativi e quantitativi ordinabili, in modo crescente o decrescente. Rappresenta la modalità di un carattere che si presenta più volte o che evidenzia il
valore di frequenza più elevato in un insieme di osservazioni. Una distribuzione di valori di un carattere può presentare più mode (in questo caso si definisce “plurimodale”), quando si registra più volte
la stessa frequenza.
A proposito della statistica bayesiana: a) spiegare su quale concetto di probabilità si fonda; b) spiegare che essa è definita anche come statistica delle cause; c) rappresentare la configurazione dello
spazio campionario
Il cosiddetto approccio bayesiano alla probabilità è incentrato sulla determinazione della probabilità dopo aver attuato un esperimento ovvero di aver stabilito la probabilità prima di avere effettuato
lo svolgimento dell’esperimento stesso. La particolarità di tale impostazione va ricercata nel fatto che data la conoscenza dell’esito di un esperimento si va a ricercare la probabilità che esso sia dovuto
ad una o più cause. Non a caso la statistica bayesiana è anche definita statistica delle cause.
Commentare brevemente: a) il significato di errore di I tipo; b) il significato di errore di II tipo; c) il significato di potenza del test e la interrelazione fra teoria della stima e verifica di ipotesi
Se si rifiuta l’ipotesi di interesse sotto quella alternativa quando si sarebbe dovuta accettare, si commette un errore del I tipo. Se si accetta l’ipotesi di interesse sotto quella alternativa quando si sarebbe
dovuta rifiutare, si commette un errore del II tipo. In entrambi i casi si assume una decisione errata o si commette un errore di valutazione. In linea generale è più grave commettere un errore del I tipo
che uno del II. Potenza del test: Si consideri un’ipotesi alternativa H1:μ=μ0. La potenza del test è il complemento a 1 dell’errore di II tipo (1-β). Si può affermare che la potenza del test corrisponde alla
probabilità di rifiutare H0 quando questa è falsa. Quindi si cerca di avere un valore molto alto di questa probabilità, come si ribadisce che α deve avere un valore molto basso al fine di garantire una
bassa probabilità di commettere l’errore di I tipo. Interrelazioni fra teoria della stima e verifica di ipotesi. Dalle considerazioni svolte finora si può notare che esiste una interrelazione tra la teoria della
stima che coinvolge gli intervalli fiduciari e la teoria dei test di ipotesi. Se si prende a riferimento la verifica delle ipotesi per test bidirezionali su una media campionaria nel caso di grandi campioni (n>30)
distribuiti normalmente, il sistema di ipotesi relativo sarà: H0:μ=μ0 vs H1:μ≠μ0.
Commentare brevemente: a) il significato di ipotesi nulla e alternativa; b) il significato di verifica di ipotesi con test unilatero dx; c) il significato di verifica di ipotesi con test unilatero sx e bilatero
Il concetto di test parametrico presuppone di affrontare la verifica di ipotesi sui parametri di una popolazione normale da cui sono estratti i campioni. L’approccio di Neyman e Pearson, noto come test
di ipotesi, prende in considerazione esplicitamente l’ipotesi alternativa rispetto a quella di interesse o nulla. Per ipotesi si intende stabilire un valore a priori riguardante un parametro della popolazione
di interesse. Le due ipotesi in opposizione sono: quella nulla o di interesse, definita H0 e quella alternativa, definita H1. L’ipotesi H0 è quella considerata vera fino a prova contraria. L’ipotesi H1 è quella
in contrapposizione. Le procedure che permettono di decidere se accettare o rifiutare una data ipotesi o di stabilire se un dato campione osservato differisce dai risultati attesi sono definite test statistici
o test d’ipotesi o test di significatività dette anche regole di decisione. Se l’ipotesi nulla H0 è un’affermazione sul valore assunto da un parametro incognito di una popolazione, l’ipotesi alternativa H1
risponde ad una delle seguenti affermazioni: il parametro è maggiore o uguale del valore ipotizzato (test unilatero con coda a destra); il parametro è minore o uguale del valore ipotizzato (test unilatero
con coda a sinistra); il parametro è diverso del valore ipotizzato (test bilatero o a due code).
Commentare brevemente: a) la differenza fra stimatore e stima; b) la proprietà di non distorsione o correttezza; c) la proprietà di efficienza e di consistenza
Per quanto riguarda la stima puntuale non si può dire a priori che essa sia buona o cattiva in quanto non conoscendo il vero valore del parametro, essendo esso incognito, non è possibile fare confronti.
Con stimatore affidabile o non affi dabile, si intende fare riferimento al metodo di stima impiegato le cui proprietà non sono valutabili facendo riferimento ad un singolo campione, ma all’universo di
tutti i campioni possibili. Le proprietà degli stimatori “ottimali” sono la: distorsione o correttezza; efficienza e consistenza. Distorsione. Lo stimatore T si dice corretto o non distorto se il suo valore medio
o atteso è dato da: E(T)=μ per tutti i possibili valori di μ. La distorsione dello stimatore T è data dalla differenza fr a il suo valore medio o atteso e il valore del parametro della popolazione da stimare
ovvero: B(T)=E(T)-μ. Efficienza. Lo stimatore T si dice efficiente se la differenza fra se stesso e il valore del parametro della popolazione da stimare è il più basso possibile ovvero l’efficienza è una misura
di dispersione o di variabilità dello stimatore. Se si hanno più stimatori (T1,T2,......,Tn), il confronto tra di essi in termini di efficienza viene svolto attraverso il confronto fra le relative varianze; si dirà, ad
esempio, che T1 è più efficiente di T2 se la Var(T1)< Var(T2) e via di seguito e quindi si ha una efficienza relativa. Se invece lo stimatore T1, ad esempio, è più efficiente di qualsiasi altro stimatore del
parametro di interesse si può dire che esiste una efficienza assoluta. Consistenza. Uno stimatore T si dice consistente se la sua precisione aumenta all’aumentare della dimensione campionaria. Si dice
che uno stimatore T è asintoticamente consistente se al tendere all’infinito della numerosità campionaria il suo valore o realizzazione tende al valore del parametro ignoto della popolazione. Ciò è
possibile solo se lo stimatore T è consistente in media quadratica ovvero se tende a zero l’errore quadratico medio.
Commentare brevemente: a) la legge debole dei grandi numeri; b) la legge forte dei grandi numeri; c) la disuguaglianza di Markov e la diseguaglianza di Chebyshev
Si può utilizzare la Disuguaglianza di Chebyshev per avere informazioni sulla varianza. Essa stabilisce che, per ogni distribuzione di dati di una popolazione, la percentuale di essi non si allontanano dalla
media per una certa quantità dello scarto quadratico medio è pari almeno a: (1- 1/k2)*100%. La disuguaglianza può assumere la notazione completa rappresentata dalla seguente disuguaglianza: |xi-
µ|k0≤1/k2 dove k è la quantità espressa da un numero puro positivo. Dalla diseguaglianza di Chebyshev deriva la Legge dei grandi numeri che assume due connotazioni: quella forte e quella debole.
Legge debole. Date n variabili mutuamente indipendenti con media μ e varianza σ2 ed un numero positivo a si può affermare che il limite per x che tende a ∞ della probabilità della differenza tra la
media delle v.c. stesse e il valore atteso μ in termini assoluti sia maggiore di un valore intero positivo a è uguale a zero. In simboli si avrà: limx->∞ P[l (X1+X2+….+Xn)/n]-μl>a]=0 Si può dedurre che la
media μ converge in probabilità alla media aritmetica delle Xi per i=1,…,n. Legge forte. Date n variabili mutuamente indipendenti con media μ e varianza, si può affermare che la probabilità che al limite
per n che tende a +∞ la media aritmetica delle stesse sia uguale a μ in valore assoluto, è pari a 1. In simboli si avrà: lim n∞PX1+X2…+Xn)/n= μ|=1.
Disuguaglianza di Markov. Nella situazione in cui non si è a conoscenza della distribuzione della v. c., si potrebbe avere l’esigenza di definire dei limiti alla probabilità. In questa circostanza può tornare
utile, pur con forti limiti, utilizzare la disuguaglianza di Markov dove la probabilità della v.c. X, che deve essere maggiore o uguale alla quantità h, non deve superare il rapporto tra la media e la stessa
quantità h e quindi può essere trovata conoscendo solo il valore atteso. La notazione è:P(Xh) ≤x/h dove X è una v.c. non negativa e x è la media o il valore atteso.
Con quale notazione si calcola: a) lo scarto semplice dalla media e dalla mediana; b) lo scarto medio assoluto dalla media e dalla mediana; c) l'indice di dissomiglianza
Scarto semplice dalla media: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore medio SCsem= |𝑥𝑖 𝑥 |
Scarto semplice dalla mediana: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore mediano SCsem= |𝑥𝑖𝑀𝑒|
Scarto medio assoluto dalla media: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore medio rapportati al numero delle osservazioni SCass= |𝑥𝑖 𝑥|/𝑛
Scarto medio assoluto dalla mediana: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore mediano rapportati al numero delle osservazioni SCass = |𝑥𝑖 𝑀𝑒|/n
Indice semplice di dissomiglianza: È un indice che permette di valutare la dissomiglianza fra due distribuzioni di valori osservati suddivisi in classi ed è dato dalla sommatoria delle differenze medie delle
corrispondenti frequenze relative Idiss=|𝑓1𝑖−𝑓2𝑖|
2
Con quali formule si calcolano: a) la mediana per valori singoli; b) la mediana per classi con il procedimento 1; c) la mediana per classi con il procedimento 2
La mediana occupa la posizione che si ottiene dalla formula: (n+1)/2 = (7+1)/2 = 4^
Dopo aver ordinato l’insieme dei dati in sequenza crescente o decrescente e assegnato la relativa posizione si applicano due principi: 1. se il numero di modalità è Dispari la mediana occupa la posizione
(n+1)/2 ed il suo valore è corrispondente a quello della posizioni trovata; 2. se il numero di modalità è Pari la mediana occupa sempre la posizione (n+1)/2 ma il suo valore è corrispondente a quello
delle due posizioni limitrofe trovate.
Con quali notazioni si esprime: a) la stima puntuale del valore atteso di una proporzione campionaria; b) la stima puntuale della varianza di una proporzione campionaria; c) la stima puntuale della
deviazione standard di una proporzione campionaria
Con quali script di R si implementano: a) la tabella a doppia entrata e le relative frequenze congiunte assolute; b) la tabella delle frequenze teoriche; c) la tabella delle contingenze assolute e quella
delle contingenze assolute al quadrato diviso le frequenze teoriche
Da due popolazioni normali si estraggono due campioni e si studia la differenza fra le due medie campionarie x1 e x2 con varianze note σ12 e σ22 e si vuole individuare: a) la notazione per la regione
di rifiuto; b) la notazione per il calcolo della z empirica; c) il sistema di ipotesi per un test bilatero
Da due popolazioni normali si estraggono due campioni e si studia la differenza fra le due proporzioni campionarie p1 e p2 con n1 e n2 si vuole individuare: a) la notazione per la regione di rifiuto;
b) la notazione per il calcolo della z empirica; c) il sistema di ipotesi per un test unilatero dx
Da una popolazione finita si è estratto un campione di 24 osservazioni e si è ottenuto il valore della varianza campionaria pari a 0,41. Con quali script di R si calcola: a) il valore del quantile della
statistica test; b) la probabilità che la varianza sia maggiore di 0,45; c) la probabilità che la varianza sia minore di 0,39
Dati i seguenti valori di x (7,11,15,16,19) con quali script di R: a) si costruiscono classi per K=2; b) si calcola l'indice di eterogeneità di Gini semplice e massimo; c) si calcola l'indice di eterogeneità di
Gini normalizzato
Dai i seguenti valori di x (7,11,15,16,19): a) costruire classi per K=2; b) calcolare le frequenze relative; c) calcolare l'indice di eterogeneità di Gini semplice, massimo e normalizzato
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Anteprima parziale del testo

Scarica statistica domande aperte e più Panieri in PDF di Statistica solo su Docsity!

A proposito della moda descrivere: a) che cos'è la densità di classe e come si calcola; b) la formula della moda per valori suddivisi in classi; c) che cos'è una distribuzione amodale ed una distribuzione plurimodale Quando le classi sono equi-ampie si può utilizzare, ai fini del calcolo delle misure centrali e di variabilità, il valore centrale di classe, tenendo conto che tale procedura presenta un certo grado di approssimazione dei risultati. Qualora, invece, le classi non sono equi-ampie è necessario disegnare per ogni classe un rettangolo che ha per altezza la densità di classe, data dal rapporto fra la frequenza assoluta ni e l’ampiezza di classe (ai-1, ai) e per base l’ampiezza di classe stessa. Mo=Lmo+∗𝐴𝑐𝑙𝑎𝑠𝑠𝑒 dove: Lmo è l’estremo inferiore della classe modale. Δfinf è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe immediatamente inferiore a quella modale. Δfsup è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe immediatamente superiore a quella modale. Aclasse è l’ampiezza della classe modale. La distribuzione amodale presenta frequenze tutte uguali. La Moda può essere definita come: una misura di tendenza centrale che si applica ai caratteri qualitativi e quantitativi ordinabili, in modo crescente o decrescente. Rappresenta la modalità di un carattere che si presenta più volte o che evidenzia il valore di frequenza più elevato in un insieme di osservazioni. Una distribuzione di valori di un carattere può presentare più mode (in questo caso si definisce “plurimodale”), quando si registra più volte la stessa frequenza. A proposito della statistica bayesiana: a) spiegare su quale concetto di probabilità si fonda; b) spiegare che essa è definita anche come statistica delle cause; c) rappresentare la configurazione dello spazio campionario Il cosiddetto approccio bayesiano alla probabilità è incentrato sulla determinazione della probabilità dopo aver attuato un esperimento ovvero di aver stabilito la probabilità prima di avere effettuato lo svolgimento dell’esperimento stesso. La particolarità di tale impostazione va ricercata nel fatto che data la conoscenza dell’esito di un esperimento si va a ricercare la probabilità che esso sia dovuto ad una o più cause. Non a caso la statistica bayesiana è anche definita statistica delle cause. Commentare brevemente: a) il significato di errore di I tipo; b) il significato di errore di II tipo; c) il significato di potenza del test e la interrelazione fra teoria della stima e verifica di ipotesi Se si rifiuta l’ipotesi di interesse sotto quella alternativa quando si sarebbe dovuta accettare, si commette un errore del I tipo. Se si accetta l’ipotesi di interesse sotto quella alternativa quando si sarebbe dovuta rifiutare, si commette un errore del II tipo. In entrambi i casi si assume una decisione errata o si commette un errore di valutazione. In linea generale è più grave commettere un errore del I tipo che uno del II. Potenza del test: Si consideri un’ipotesi alternativa H1:μ=μ0. La potenza del test è il complemento a 1 dell’errore di II tipo (1-β). Si può affermare che la potenza del test corrisponde alla probabilità di rifiutare H0 quando questa è falsa. Quindi si cerca di avere un valore molto alto di questa probabilità, come si ribadisce che α deve avere un valore molto basso al fine di garantire una bassa probabilità di commettere l’errore di I tipo. Interrelazioni fra teoria della stima e verifica di ipotesi. Dalle considerazioni svolte finora si può notare che esiste una interrelazione tra la teoria della stima che coinvolge gli intervalli fiduciari e la teoria dei test di ipotesi. Se si prende a riferimento la verifica delle ipotesi per test bidirezionali su una media campionaria nel caso di grandi campioni (n>30) distribuiti normalmente, il sistema di ipotesi relativo sarà: H0:μ=μ0 vs H1:μ≠μ0. Commentare brevemente: a) il significato di ipotesi nulla e alternativa; b) il significato di verifica di ipotesi con test unilatero dx; c) il significato di verifica di ipotesi con test unilatero sx e bilatero Il concetto di test parametrico presuppone di affrontare la verifica di ipotesi sui parametri di una popolazione normale da cui sono estratti i campioni. L’approccio di Neyman e Pearson, noto come test di ipotesi, prende in considerazione esplicitamente l’ipotesi alternativa rispetto a quella di interesse o nulla. Per ipotesi si intende stabilire un valore a priori riguardante un parametro della popolazione di interesse. Le due ipotesi in opposizione sono: quella nulla o di interesse, definita H0 e quella alternativa, definita H1. L’ipotesi H0 è quella considerata vera fino a prova contraria. L’ipotesi H1 è quella in contrapposizione. Le procedure che permettono di decidere se accettare o rifiutare una data ipotesi o di stabilire se un dato campione osservato differisce dai risultati attesi sono definite test statistici o test d’ipotesi o test di significatività dette anche regole di decisione. Se l’ipotesi nulla H0 è un’affermazione sul valore assunto da un parametro incognito di una popolazione, l’ipotesi alternativa H risponde ad una delle seguenti affermazioni: il parametro è maggiore o uguale del valore ipotizzato (test unilatero con coda a destra); il parametro è minore o uguale del valore ipotizzato (test unilatero con coda a sinistra); il parametro è diverso del valore ipotizzato (test bilatero o a due code). Commentare brevemente: a) la differenza fra stimatore e stima; b) la proprietà di non distorsione o correttezza; c) la proprietà di efficienza e di consistenza Per quanto riguarda la stima puntuale non si può dire a priori che essa sia buona o cattiva in quanto non conoscendo il vero valore del parametro, essendo esso incognito, non è possibile fare confronti. Con stimatore affidabile o non affidabile, si intende fare riferimento al metodo di stima impiegato le cui proprietà non sono valutabili facendo riferimento ad un singolo campione, ma all’universo di tutti i campioni possibili. Le proprietà degli stimatori “ottimali” sono la: distorsione o correttezza; efficienza e consistenza. Distorsione. Lo stimatore T si dice corretto o non distorto se il suo valore medio o atteso è dato da: E(T)=μ per tutti i possibili valori di μ. La distorsione dello stimatore T è data dalla differenza fra il suo valore medio o atteso e il valore del parametro della popolazione da stimare ovvero: B(T)=E(T)-μ. Efficienza. Lo stimatore T si dice efficiente se la differenza fra se stesso e il valore del parametro della popolazione da stimare è il più basso possibile ovvero l’efficienza è una misura di dispersione o di variabilità dello stimatore. Se si hanno più stimatori (T1,T2,......,Tn), il confronto tra di essi in termini di efficienza viene svolto attraverso il confronto fra le relative varianze; si dirà, ad esempio, che T1 è più efficiente di T2 se la Var(T1)< Var(T2) e via di seguito e quindi si ha una efficienza relativa. Se invece lo stimatore T1, ad esempio, è più efficiente di qualsiasi altro stimatore del parametro di interesse si può dire che esiste una efficienza assoluta. Consistenza. Uno stimatore T si dice consistente se la sua precisione aumenta all’aumentare della dimensione campionaria. Si dice che uno stimatore T è asintoticamente consistente se al tendere all’infinito della numerosità campionaria il suo valore o realizzazione tende al valore del parametro ignoto della popolazione. Ciò è possibile solo se lo stimatore T è consistente in media quadratica ovvero se tende a zero l’errore quadratico medio. Commentare brevemente: a) la legge debole dei grandi numeri; b) la legge forte dei grandi numeri; c) la disuguaglianza di Markov e la diseguaglianza di Chebyshev Si può utilizzare la Disuguaglianza di Chebyshev per avere informazioni sulla varianza. Essa stabilisce che, per ogni distribuzione di dati di una popolazione, la percentuale di essi non si allontanano dalla media per una certa quantità dello scarto quadratico medio è pari almeno a: (1- 1/k^2 )*100%. La disuguaglianza può assumere la notazione completa rappresentata dalla seguente disuguaglianza: |xi- μ|tk0≤1/k^2 dove k è la quantità espressa da un numero puro positivo. Dalla diseguaglianza di Chebyshev deriva la Legge dei grandi numeri che assume due connotazioni: quella forte e quella debole. Legge debole. Date n variabili mutuamente indipendenti con media μ e varianza σ2 ed un numero positivo a si può affermare che il limite per x che tende a ∞ della probabilità della differenza tra la media delle v.c. stesse e il valore atteso μ in termini assoluti sia maggiore di un valore intero positivo a è uguale a zero. In simboli si avrà: limx->∞ P[l (X1+X2+….+Xn)/n]-μl>a]=0 Si può dedurre che la media μ converge in probabilità alla media aritmetica delle Xi per i=1,…,n. Legge forte. Date n variabili mutuamente indipendenti con media μ e varianza, si può affermare che la probabilità che al limite per n che tende a +∞ la media aritmetica delle stesse sia uguale a μ in valore assoluto, è pari a 1. In simboli si avrà: lim n→∞PX 1 +X 2 …+Xn)/n= μ|=1. Disuguaglianza di Markov. Nella situazione in cui non si è a conoscenza della distribuzione della v.c., si potrebbe avere l’esigenza di definire dei limiti alla probabilità. In questa circostanza può tornare utile, pur con forti limiti, utilizzare la disuguaglianza di Markov dove la probabilità della v.c. X, che deve essere maggiore o uguale alla quantità h, non deve superare il rapporto tra la media e la stessa quantità h e quindi può essere trovata conoscendo solo il valore atteso. La notazione è:P(Xth) ≤x/h dove X è una v.c. non negativa e x è la media o il valore atteso. Con quale notazione si calcola: a) lo scarto semplice dalla media e dalla mediana; b) lo scarto medio assoluto dalla media e dalla mediana; c) l'indice di dissomiglianza Scarto semplice dalla media: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore medio SCsem= ∑ |𝑥𝑖 − 𝑥̅ | Scarto semplice dalla mediana: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore mediano SCsem= ∑ |𝑥𝑖 − 𝑀𝑒| Scarto medio assoluto dalla media: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore medio rapportati al numero delle osservazioni SCass= ∑ |𝑥𝑖 − 𝑥̅ |/𝑛 Scarto medio assoluto dalla mediana: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore mediano rapportati al numero delle osservazioni SCass = ∑ |𝑥𝑖 − 𝑀𝑒|/n Indice semplice di dissomiglianza: È un indice che permette di valutare la dissomiglianza fra due distribuzioni di valori osservati suddivisi in classi ed è dato dalla sommatoria delle differenze medie delle corrispondenti frequenze relative Idiss=∑ |𝑓^1 𝑖− 2 𝑓^2 𝑖| Con quali formule si calcolano: a) la mediana per valori singoli; b) la mediana per classi con il procedimento 1; c) la mediana per classi con il procedimento 2 La mediana occupa la posizione che si ottiene dalla formula: (n+1)/2 = (7+1)/2 = 4^ Dopo aver ordinato l’insieme dei dati in sequenza crescente o decrescente e assegnato la relativa posizione si applicano due principi: 1. se il numero di modalità è Dispari la mediana occupa la posizione (n+1)/2 ed il suo valore è corrispondente a quello della posizioni trovata; 2. se il numero di modalità è Pari la mediana occupa sempre la posizione (n+1)/2 ma il suo valore è corrispondente a quello delle due posizioni limitrofe trovate. Con quali notazioni si esprime: a) la stima puntuale del valore atteso di una proporzione campionaria; b) la stima puntuale della varianza di una proporzione campionaria; c) la stima puntuale della deviazione standard di una proporzione campionaria Con quali script di R si implementano: a) la tabella a doppia entrata e le relative frequenze congiunte assolute; b) la tabella delle frequenze teoriche; c) la tabella delle contingenze assolute e quella delle contingenze assolute al quadrato diviso le frequenze teoriche Da due popolazioni normali si estraggono due campioni e si studia la differenza fra le due medie campionarie x1 e x2 con varianze note σ12 e σ22 e si vuole individuare: a) la notazione per la regione di rifiuto; b) la notazione per il calcolo della z empirica; c) il sistema di ipotesi per un test bilatero Da due popolazioni normali si estraggono due campioni e si studia la differenza fra le due proporzioni campionarie p1 e p2 con n1 e n2 si vuole individuare: a) la notazione per la regione di rifiuto; b) la notazione per il calcolo della z empirica; c) il sistema di ipotesi per un test unilatero dx Da una popolazione finita si è estratto un campione di 24 osservazioni e si è ottenuto il valore della varianza campionaria pari a 0,41. Con quali script di R si calcola: a) il valore del quantile della statistica test; b) la probabilità che la varianza sia maggiore di 0,45; c) la probabilità che la varianza sia minore di 0, Dati i seguenti valori di x (7,11,15,16,19) con quali script di R: a) si costruiscono classi per K=2; b) si calcola l'indice di eterogeneità di Gini semplice e massimo; c) si calcola l'indice di eterogeneità di Gini normalizzato Dai i seguenti valori di x (7,11,15,16,19): a) costruire classi per K=2; b) calcolare le frequenze relative; c) calcolare l'indice di eterogeneità di Gini semplice, massimo e normalizzato

Dai seguenti valori del carattere X che assume le modalità (1,1,2,3,4,4,4) e il carattere Y che assume le modalità (A,A,B,C,D,D,D): a) individuare la contingenza assoluta di I riga I colonna; b) individuare la frequenza marginale di I colonna; c) individuare la frequenza marginale di I riga Dai seguenti valori del carattere X che assume le modalità (1,1,2,3,4,4,4) e il carattere Y che assume le modalità (A,A,B,C,D,D,D): a) costruire la tabella a doppia entrata; b) individuare la frequenza congiunta assoluta di I riga I colonna; c) individuare la frequenza teorica di I riga I colonna Data l’equazione della retta stimata y(stim)=12,5 + 0,76x calcolare quale valore stimato si ottiene per la variabile dipendente y fissati i seguenti valori di x: a) 13,8; b) 12,4; c) 16,*

  1. y^=12,5+0,76x a. x=13, y^= 12,5+(0.7613.8)= y^ =22, b. x=12, y^= 12,5+(0.7612,4)= y^ = 21, c. x=16, y^= 12,5+(0.7616,1)= y^ = 24, d. x=15, y^= 12,5+(0.7615,3)= y^ = 24, Data la distribuzione di probabilità Bernoulliana con p=0,07 calcolare: a) la probabilità che x=0; b) la probabilità che x= 1; c) il valore atteso, la varianza e la deviazione standard P Bernoulliana p=0, a. p(x=1)/p(x=1)= p=0, b. p(x=0)/p(x=0)=1-p=1-0.07=0, c. E(x)=p=0, d. Var(x)=p(1-p)=0,07(0,93)=0,0651 Dstd(X)=√p(1−p) = √0,07=0, Data la distribuzione di probabilità Bernoulliana con p=0,07 con quali script di R si calcola: a) la probabilità che x=0; b) la probabilità che x= 1; c) il valore atteso, la varianza, la deviazione standard e il coefficiente di variazione P Bernoulliana p=0, #PROBABILITA’ X=1 → Probabilità di successo perché i successi sono 1 x= n successi x=1 successo x= 0 insuccesso p<- 0,

PROBABILITA’ X=

q<- 1 - p

VALORE ATTESO

Ex <-p → per Bernoulli E(x)=p #VARIANZA VarX<- pq →Var(x)=p(1-p) #DEVIAZIONE STANDARD Data la distribuzione di probabilità Bernoulliana con quali script di R si calcola: a) il quantile; b) la probabilità; c) la probabilità cumulata #QUANTILE qbinom (x,1,p) #PROBABILITA’ (DENSITA’) dbinom (x,1,p) #PROB.CUMULATA (RIPARTIZIONE) pbinom (x,1,p) #NUMERI CASUALI rbinom(x,1,p) Data la distribuzione di probabilità Binomiale con p=0,49 ed n=50 e stabilito un livello di significatività dell’5% con quali script si calcolano: a) il limite superiore dello stimatore intervallare per la proporzione; b) il limite inferiore dello stimatore intervallare per la proporzione; c) la numerosità campionaria e l’ampiezza dell’intervallo. #INTERVALLO DI CONFIDENZA PER LA PROPORZIONE #DATI p<-0, n<- 50 I.inf<-p-qnorm(0,975)sqrt(p(1-p)/n) I.sup<-p+qnorm(0,975)sqrt(p(1-p)/n) amp_it<-zqnorm(0.975)sqrt(p(1-p)/n) num_camp<-(qnorm(0.975)/amp_int)^2p(1-p) n=[z (^) x/2 2 p^(1-p^)/a^2 Data la distribuzione di probabilità Uniforme discreta con N=10 con quali script si calcola: a) la probabilità che x=8; b) la probabilità che x< 2; c) la probabilità che x>7 e che x sia ricompreso fra 8 e 4 #DATI N<- 10 #PROB X=8 p(x)=1/N P8<-1/N #PROB X<2 escluso lo 0 P1<- 1/N pmin2<-p pmin3<.p1+p #PROB X> P9<-1/N P10<-1/N pmag7<-p8+p9+p #PROB 4 7 e che x sia ricompreso fra 8 e 4** a. PROB che x= p(x)=1/N (^) x=1…n quindi p(x=8) =1/10=0, b. PROB che x< p(x<2)=p(x=1)=1/10=0, c. PROB che x> p(x>7)=p(x=8)+p(x=9)+p(x=10)=1/10+1/10+1/10=0, d. PROB che 4 a. P(x=28) =0 nelle uniformi continue la probabilità puntuale è NULLA b. P(x<32)=F(32)-F(20)= =(0,033332)-(0,033320)=0, c. P(x>37)= 1 - P(x<37)=1-[F(37)-F(20)]= =1-[(0,03337)-(0,033320)]=1-0,5661= 0, d. P(31≤x≤44)=F(44)-F(31)= =(0,033344)-(0,033331)=1.4652-1.0323=0. Data la v.c. Binomiale X con p=0,07 e n=11 calcolare: a) la probabilità che x=0; b) la probabilità che x< 3; c) la probabilità che x>2 e che x sia ricompreso fra 3 e 4 Prob Binomiale p=0,07 n= a. P(x=0) p(X=0)= 11 0,07°(1-0.07)^11 -^0 = 0 11! = 11(0.93)^11 =0. 0!(11-0)! b. P(x<3) [=0,1,2] P(x<3)=P(x=0)+ P((x=1)+ P(x=2)= = 11 0,07°(1-0.07)^11 -^0 + 11 *0,07^1 (1-0.07)^11 -^1 + 11 0,07^2 (1-0.07)^11 -^2 = 0 1 2 = 0.45+0.37+0.14= 0. c. P(x>2) P(x>2)=1-P(x≤2)=1- [P(x=0)+ P(x=1)+ è(x=2)] →stessi calcoli di sopra → 1 - 0.96= 0. d. P(3≤x≤4) P(x=3) + P(x=4) 11 * 0,07^3 * (1-0.07)^8 + 11 * 0.07^4 * (1-0.07)^7 = 3 4 11! 910^ * 0.07^3 * (1-0.07)^8 + 11! 8910^ * 0.07^4 * (1-0.07)^7 = 3!(11-3)! 4 !(11-4)! 0,0317+0,0048= 0, Data la v.c. Binomiale X con p=0,07 e n=11 con quali script di R si calcola: a) la probabilità che x=0; b) la probabilità che x< 3; c) la probabilità che x>2 e che x sia ricompreso fra 3 e 4 #DATI n<- 11 p<-0, #PROBABILITA’ (X=0) → densità dbinom(0,11,0.07) #PROBABILITA’ (X<3) → cumulata pbinom(2,11,0.07) 3 escluso #PROBABILITA’ (X>2) 1 - pbinom(2,11,0.07) #PROBABILITA’ (3≤X≤4) dbinom(3,11,0.07)+dbinom(4,11,0.07) Data la v.c. binomiale X con parametri p=0,23 e n=80 Bin~(80;0,23) con quali linee di codice di R si calcola: a) la probabilità che p(X<18); la probabilità che P(X>19); la probabilità che X sia ricompreso fra 17,8 e 19, Data la v.c. continua Chi-quadrato X con n=23 descrivere con quali script si calcola: a) la varianza; b) la deviazione standard; c) l’indice di asimmetria e di curtosi g<- 23 a. var <- 2^g ; var b. sd<- sqrt 8var); sd c. asim <- sqrt (g/8); asim d. curt <- 12/g Data la v.c. continua Chi-quadrato X con n=23 descrivere con quali script si calcola: a) la probabilità che x=8; b) la probabilità che x< 3; c) la probabilità che x> 17 e che x sia ricompreso fra 13 e 20 a. p8 <- pchisq (8,23); p b. p3<- pchisq (3,23) c. p17<- 1 - pchisq(17,23); p p20<-pchisq (20,23); p20- p d. p13<- pchisq (13,23) Data la v.c. continua F di FisherX con g1=16 e g2=24 con quali script si calcola: a) la probabilità che x=18; b) la probabilità che x< 22; c) la probabilità che x> 17 e che x sia ricompreso fra 14 e 19 #DATI g1<- 16 g2<- 24 #PROBABILITA’ (X=18) df(18,g1,g2) #PROBABILITA’ (X<22) pf(22,g1,g2) #PROBABILITA’ (X>17) 1 - pf(22,g1,g2) #PROBABILITA’ (14≤x≤19) pf(19,g1,g2)-pf(14,g1,g2) Data la v.c. continua F i di Fisher X~ F (11,24) come si calcola a) il valore atteso; b) la varianza; c) la deviazione standard? E(F)=1,09; Var(F)=17280; Dv.std(F)=131, Data la v.c. continua Normale standardizzata X con media=0 e dev.std=1 impostare le formule per il calcolo: a) della probabilità che x< 3,2; b) della probabilità che x> 3,7; c) della probabilità che x sia ricompreso fra 3,1 e 4, a. P(x=2.8)= b. P(x<3.2)= P(z<3.2-0/1)= ρ (3.2)=0. c. P(x<3.7)= 1-P (z<3.7-0/1)=1- ρ (3.7)= 1 - 0.9999=0. d. P(3.1 d. Kurt<- 3 Data la v.c. continua Normale X con media =4,7 e dev.std=2,1 come si calcolano: a) la probabilità che x=4,1; b) la probabilità che x< 3,9; c) la probabilità che x> 4,4 e che x sia ricompreso fra 4,2 e 4, a. P(x=4.1) x~N (4.7;4.41) Z=x- 11 P(x=4.1) = 0 probab. puntuale σ=2. b. P(x<3.9) P(x<3.9) = P(z< 3.9-4.7/2.1)= P(z<-0.3809)= ρ (-0.38)= 0. c. P(x > 4.4) 1 - P(x≤4.4)=1-P(z≤4.4-4.7/2.1)= 1-P(z≤-0.1429)=1- ρ(-0.14)=1-0.4443=0. d. P(4.2≤x≤4.5) P(x≤4.5)-P(x<4.2) = P(z≤4.5-4.7/2.1)- P(z<4.2-4.7/2.1)= P=(z≤-0.0952)-P(z<-0.2380)= ρ (-0.10) – ρ(-0.24) = 0.4602-0.4052= 0. Data la v.c. continua Normale X con media =4,7 e dev.std=2,1 con quali script di R si calcola: a) la varianza; b) la deviazione standard; c) l’indice di asimmetria e di curtosi #VARIANZA sd^ #ASIMMETRIA Ias<- 0 #CURTOSI Icur<- 0 Data la v.c. continua Normale X con media =4,7 e dev.std=2,1 con quali script di R si calcola: a) la probabilità che x=4,1; b) la probabilità che x< 3,9; c) la probabilità che x> 4.4 e che x sia ricompreso fra 4,2 e 4, #DATI mean<-4. sd<-2. #PROB (X=4.1) dnorm(4.1, mean,sd) #PROB (X<3.9) pnorm(3.9,mean,sd) #PROB(X>4.4) 1 - pnorm(4.4,mean,sd) #PROB (4.2≤X≤4.5) pnorm(4.5,mean,sd)-pnorm(4.2,mean,sd) Data la v.c. continua t di Student X con n=23 con quali script di R si calcola: a) la probabilità che x=2; b) la probabilità che x< 12; c)la probabilità che x> 17 e che x sia ricompreso fra 11 e 14 a. p2<-pt(2,23);p b. p12<-pt(12,239;p c. p17<- 1 - pt(17,23);p d. p14<-pt(14,23); p11<-pt(11,23); p14-p Data la v.c. continua t di Student X con n=23 con quali script si calcola: a) la varianza; b) la deviazione standard; c)l’indice di asimmetria e di curtosi A. g<-23; var <-g/(g-z); var B. sqm <- sqrt (var); sqm C. assimetria <- 0 D. kurt<- 6 / (g-4); kurt Data la v.c. continua Normale standardizzata Z con media=0 e dev.std=1 con quali script di R si calcola: a) la probabilità che x=2,8; b) la probabilità che x< 3,2; c) la probabilità che x> 3,7 e che x sia ricompreso fra 3,1 e 4, a. P2_8<-pnom(2.8,0,1),P2_ b. P3_2<-pnom(3.2,0,1);p3_ c. P3_7<- 1 - pnom(3.7,0,1);p3_ d. P4_4<-pnom(4.4,0,1); p3_1<-pnom(3.1,0,1); p4_4 – p3_ Data la v.c. Poissoniana X con λ=3,2 con quali script di R si calcola: a) la probabilità che x=10; b) la probabilità che x< 13; c) la probabilità che x>22 e che x sia ricompreso fra 30 e 40 #DATI ℓ<-3. #PROB(X=10)→ prob. puntuale (n, ℓ) dpois(10, 3.2) #PROB (X<13) ppois(12, 3.2) #PROB (X>22) 1 - ppois (22, 3.2) #PROB (30≤X≤40) ppois(40,3.2)-ppois(30,3.2) Data la v.c. t continua di Student X con n=23 impostare la formula per calcolare: a) la probabilità che x< 12; b) la probabilità che x> 17; c) la probabilità che x sia ricompreso fra 11 e 14 n= 23 →gradi di libertà→si lavora con g=n- 1 →g=23- 1 a. P(x=2)= 0 p punt nulla b. P(x<12) P(x<12)= ρ (12,g=22)= 0. c. P(x>17) 1 - P (x≤17)=1- ρ(17, g=22)= 1-0.9995=0. d. P(11≤x≤14) P(x≤14) – P(x<11) Ρ(14,g=22) – ρ(11, g=22)= 0.999 5 - 0.9995= Data la v.c. Uniforme continua X con a=10 e b= 25 calcolare: a) il valore atteso; b) la varianza e la deviazione standard; c) l’indice di asimmetria e di curtosi e lo scostamento? Data la v.c. Uniforme continua X ricompresa nell’intervallo 20-50 con quali script si calcola: a) la probabilità che x=28; b) la probabilità che x< 32; c) la probabilità che x> 37 e che x sia ricompreso fra 31 e 44 #DATI a<- 20 estremi intervallo b<- 50 #PROB (X=28) dunif(28,min=a, max=b) #PROB (X<32) punif( 32 ,min=a, max=b) #PROB (X>37) 1 - punif( 37 ,min=a, max=b) #PROB (31≤x≤44) punif( 44 ,min=a, max=b)- punif( 31 ,min=a, max=b)

Data una v.c. Poissoniana X con λ=3,3 con quali script di R si calcolano; a) il valore atteso; b) la varianza; c) la deviazione standard, l’indice di asimmetria e di curtosi? Date le seguenti classi con le relative frequenze assolute tra parentesi 10-20 (2); 20-30 (3); 30-40 (1); 40-50(4): a) calcolare il I e III quartile; b) calcolare il II quartile; c) rappresentare il grafico a scatola e baffi (box-plot) Date le seguenti classi con le relative frequenze assolute tra parentesi: 10-20 (2); 20-30 (3); 30-40 (1) calcolare: a)lo scarto medio in frequenza assoluta dalla media; b) lo scarto medio in frequenza assoluta dalla mediana; c) l'indice di dissomiglianza Date le seguenti classi con le relative frequenze assolute tra parentesi: 10-20 (2); 20-30 (3); 30-40 (1) descrivere con quali script di R si calcolano: a) lo scarto medio in frequenza assoluta dalla media; b) lo scarto medio in frequenza assoluta dalla mediana; c) l'indice di dissomiglianza Date le seguenti coppie di valori y (1,2,3) e x(12,11,10): calcolare: a) il coefficiente angolare; b) l’intercetta; c) il valore di y(stimato) per un valore di x= a. CALCOLO COEFFICIENTE ANG. PER CALCOLARE L’INTERCETTA y= a+bx b=cov xy = - 0.66 = - 1 σ^2 x 0. cov xy= ∑∑[(xi-𝑥̅ ) * (yi-ӯ)]= 2/3= - 0. n σ^2 x = ∑[( xi-𝑥̅ )^2 ] = 12 +0^2 + (+1)^2 = 2/3 = 0. n B b. CALCOLO INTERCETTA ӯ = a+bx̅ a= ӯ- bx̅ = 2-[(-1)11]= 2-[-11]= 13 c. RETTA STIMATA DI REGRESSIONE y^= a^+b^x → y^=13-x y stimato per x= y^=13- 9 y^= Dati due campioni con n1=35 e n2=45 e mu1=7,2 e mu2=7,9 varianza stimata1=2 e varianza stimata2=3 calcolare lo stimatore intervallare: a) con α=0,01 (t critica=2,375); b) con α=0,05(tcritica=1,665); c) con α=0,1 (tcritica=1,2925) Dati due variabili x ed y con quali script di R si rappresenta: a) l'istogramma; b) il grafico a bastoncini; c) il grafico a dispersione x<-hist(x,plot=FALSE) plot(table(varcard)) plot(varcard) Dati i seguenti dati del carattere X (12,2,3,45) e le relative frequenze assolute (1,4,0,3) calcolare: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli e per valori suddivisi in classi Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) con quali script di R si calcolano: a) la devianza; b) la varianza; c) lo scarto quadratico medio e il coefficiente di variazione X<-c(12,2,3,45,64,32,1,87); #DEVIANZA# Dev_x <-sum(x-media_x)^ 1 metodo var_x <-var(x) 2 metodo n<- 8 #VARIANZA# Var_x<-dev_x/n Var x #SCARTO QUADRATICO# Sqm_x<-sqrt(var_x) #COEFFICIENTE DI VARIAZIONE# Cv_x<-sqm_x/media_x; cuv_x Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative frequenze assolute (0,1,2,3,2,1,3,4) descrivere con quali script di R si calcolano: a) la media aritmetica in frequenza relativa; b) la media geometrica; c) la media armonica library(labstatR) v_c<-c(12,2,3,45,64,32,1,87);v_c m_ar_r.rel<-sum(v_cFreqRel); m_ar_f.relmeang(x) m_geom_f.as<-prod(v_c^FreqAss)^(1/n); m_geom_f.a m_arm_f.as<-sumFì(FreqAss)/sum(FreqAss/v_c); m_arm_f.as meana(x) Dati i seguenti dati del carattere x (22,48,58,61,38,42) calcolare: a) la devianza dalla media; b) la varianza dalla media; c) lo scarto quadratico medio dalla media e il coefficiente di variazione Media= 22+48+58+61+38+42= 44, 6 Dev= (22-44.83)^2 +(48-44.83)^2 +(58-44.83)^2 +(61-44.83)^2 +(38-44.83)^2 ++(42-44.83)^2 =1020. Var= σ^2 = 1 *(22-44.83)^2 +(48-44.83)^2 +(58-44.83)^2 +(61-44.83)^2 +(38-44.83)^2 ++(42-44.83)^2 = 1 *1020.8334=170.1389 ( ≅170.14) 6 6 SMQ= √ σ^2 =√170.13879 =13. C.V.=√^17044 ,.^138983 =0, 2910 (29,10%) x y 𝑥 x̅^ =i-^11 𝑥̅^ Ӯ yi=- 2 ӯ (xi-𝑥̅ )(yi- ӯ) 12 1 1 - 1 - 1 11 2 0 0 0 10 3 - 1 1 - 1

  • 2

Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58) con quali script di R si individuano: a) le classi con il metodo soggettivo; b) le classi con il metodo a radice; c) le classi con il metodo logaritmico

CLASSI CALCOLATE CON IL METODO SOGGETTIVO

x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x k <- 5 ; k n <- length(x);n Classi <- seq(min(x), max(x), length.out = k + 1); Classi plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età") axis(1,at = Classi,cex.axis = 1.1) axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1) #CLASSI CALCOLATE CON IL METODO A RADICE # x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x n<- length(x); n Classi <- ceiling(sqrt(n)); Classi plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età") axis(1,at = Classi,cex.axis = 1.1) axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1) #CLASSI CALCOLATE CON IL METODO LOGARITMICO # x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x # Dati di imput del carattere Età # n <- length(x); n k<- ceiling(1+3.322*log10(n)); k a <- (max(x) - min(x)) / k ; a Classi <- seq(min(x),max(x),length.out = k + 1); Classi plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età") axis(1,at = Classi,cex.axis = 1.1) axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1) Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali formule si calcolano: a) la media aritmetica semplice per valori singoli; b) la media aritmetica semplice in frequenza assoluta; c) la media geometrica per valori singoli Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali script di R si calcolano: a) l’indice di concentrazione di Gini semplice; b) l’indice di concentrazione di Gini massimo e normalizzato; c) la spezzata di Lorenz Dati i seguenti valori centrali di classe x (1,2,3,4,5) e le relative frequenze assolute (2,3,1,5,4) con quali script di R si calcolano: a) la varianza dalla media per classi; b) lo s.q.m. dalla media; c) la devianza dalla media per classi e il coefficiente di variazione x<-(1,2,3,4,5) senza pesi x<1<-(2,3,1,5,4) media_x_1<-sqrt(var(x_1))/ media_x_ media_x<-mean(x) #singoli sqm_x<-sum(((x-media_x)/sqm_x)14)/n I_curt_x_1<-sum((x_1-media_x_1)14/ 9 x (sqm_x_1) Dati i seguenti valori centrali di classe x (1,2,3,4,5) e le relative frequenze assolute (2,3,1,5,4) calcolare: a) la varianza dalla media per classi; b) lo s.q.m. dalla media; c) la devianza dalla media per classi e il coefficiente di variazione Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli e per valori suddivisi in classi x<-(12,2,3,45) senza pesi x<1<-(12,2,2,45,45,45,45) media_x_1<-sqrt(var(x_1))/ media_x_ media_x<-mean(x) #singoli sqm_x<-sum(((x-media_x)/sqm_x)14)/n I_curt_x_1<-sum((x_1-media_x_1)14/ 9 x (sqm_x_1) Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano: a) la media per valori suddivisi in classi; b) lo scarto quadratico medio dalla media; c) l’indice di curtosi con la formula del momento quarto per valori singoli e per valori suddivisi in classi x<-(12,2,3,45) senza pesi x<1<-(12,2,2,45,45,45,45) media_x_1<-sqrt(var(x_1))/ media_x_ media_x<-mean(x) #singoli sqm_x<-sum(((x-media_x)/sqm_x)14)/n I_curt_x_1<-sum((x_1-media_x_1)14/ 9 x (sqm_x_1) Dati i seguenti valori centrali di classe x (3,1,6,5) e le relative frequenze assolute (0,5,1,3) calcolare: a) la media per valori suddivisi in classi; b) lo scarto quadratico medio dalla media; c) l'indice di curtosi utilizzando la formula del momento quarto per valori singoli e per valori suddivisi in classi

Dati i seguenti valori della v.c. x (1,2,3,4) con quale script di R si calcolano: a) la codevianza; b) la covarianza; c) il coefficiente di correlazione di Bravais-Pearson Dati i seguenti valori di x (22,23,24,32,56) con quali script si calcola: a) il I quartile; il II quartile; c) il III quartile a) I Quartile; x<-c(22,23,24,32,56) quantile (x, probs=0,25) b) II Quartile o (mediana) X<-c(22,23,24,32,56) n<-lenghth(x) 0,5(x[n/2]+x[n/2+1] Median (x) c) III Quartile; x<-c(22,23,24,32,56) quantile 8x, probs=0.75) Dati i seguenti valori di x (33,35,38,42,43): a) costruire classi per K=2; b) calcolare la densità di classe; c) calcolare il valore della moda per classi Dati i seguenti valori di X(1,2,3,4) e di Y(11,9,7,5) calcolare: a) la codevianza XY; b) la covarianza XY; c) il coefficiente di correlazione di Bravais-Pearson Dati i seguenti valori di xi (11,12,13,14,15) e ni (0,1,2,3, 4) con quali script di R si calcola; a) la densità di classe; b) la moda per i valori di x; c) la moda per la distribuzione di frequenza Dati i seguenti valori E(X2) =12 e [E(X)]2 =10,5 calcolare: a) il valore atteso; b) la varianza;c) la deviazione standard e il coefficiente di variazione Dati i valori (1,2,3,45) con quale script di R si calcolano: a) i campioni ordinati di numerosità 2 con ripetizione; b) i campioni ordinati di numerosità 2 senza ripetizione; c) i campioni non ordinati di numerosità 2 con ripetizione Dati i valori della devianza di regressione e del residuo e 8 osservazioni calcolare il test F: a) per valori pari rispettivamente a 63692,07 e 2118,636; b) per valori pari rispettivamente a 73692,07 e 2218,636; c) per valori pari rispettivamente a 83692,07 e 3118, 636 DS: Devianza di regressione DR: devianza residuo a. DS= 63692,07 MDS=DS/1=63692,07 F= MDS/MDR= 63692,07/353,106= 180, DR= 2118,636 MDR= DR/(n-2)= 353, n= b. DS= 73692,07 MDS=DS/1= 7369 2,07 F= MDS/MDR= 199. DR= 21 18,636 MDR= DR/(n-2)=369, c. DS= 8 3692,07 MDS=DS/1= 83692,07 F= MDS/MDR= 1 61. 02 DR= 31 18,636 MDR= DR/(n-2)=3 1 9, Dati i valori di P(E)=0,28, P(F)=0,32 e P(E|F)=0,18 calcolare; a) la probabilità unione P(EF) per eventi compatibili o congiunti; b) la probabilità intersezione P(E∩F) per eventi dipendenti e indipendenti; c) la probabilità unione P(EF) per eventi incompatibili o disgiunti

Dati i valori di x (12,16,18,22,26) con quali linee di codice di R si implementano: a) per calcolare la mediana per valori singoli; b) per costruire classi con K=2; c)per calcolare la mediana per valori suddivisi in classi Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa frequenza assoluta (0,1,2,3) calcolare: a) i valori centrali di classe e la frequenza relativa; b) la frequenza cumulata assoluta; c) la frequenza cumulata relativa classi Fre ass Val centr Fre rel Fre cum ass Fre cum rel 12 - 16 0 14 0,00 0 0 16 - 20 1 18 0,17 1 0, 20 - 24 2 22 0,33 3 0, 24 - 28 3 26 0,5 6 1 tot 6 1, Dato a=10 e b= 25 con quale scrip di R si calcolano: a) il valore atteso; b) la varianza e la deviazione standard; c) l’indice di asimmetria, di curtosi e lo scostamento? Dato il valore del coefficiente di correlazione pari a 0,93 e la cov(XY) pari a - 1,24 calcolare: a) il coefficiente di determinazione; b) il prodotto delle deviazioni standard della X e della Y; c) spiegare il significato del segno della covarianza Dato il valore del coefficiente di determinazione pari a 0,97 e la devianza residua pari a 12,7 calcolare: a) la devianza spiegata; b) la devianza totale; c) il coefficiente di correlazione DT= 12,7/1-0.97=423, DS=423,3333-12.7=410. RHO=√ 0,97= 0. Dato il valore dell’intercetta stimata pari a 12,5, un valore della t di Student critica con n-2 gradi di libertà pari a 2,571 ed un valore del relativo error std par a 34,67; dato il valore del coefficiente angolare stimato pari a 61,4, un valore della t di Student critica con n-2 gradi di libertà pari a 2,571 ed un valore del relativo error std pari a 13,45 calcolare: a) lo stimatore intervallare per l’intercetta; b) lo stimatore intervallare per il coefficiente angolare; c) accettare o rifiutare l'ipotesi nulla H0=0 per l’intercetta e per il coefficiente angolare Dato n= 92 e α=0,01, una media campionaria=198 e una varianza=81 quali linee di codice di R si implementano per calcolare: a) la statistica test campionaria; b) il quantile critico; c) il p-value della zeta empirica Dato n=11 e p=0, 20 calcolare: a) il valore atteso; b) la varianza; c) la deviazione standard, l'indice di asimmetria e di curtosi E(X)=2,2; Var(X)=1,76; Dv.std(X)=1,327; IAS(X)=0,452; ICUR(X)=0, Dato n=11 e p=0,20 con quali script di R si calcolano: a) il valore atteso; b) la varianza; c) la deviazione standard, l'indice di asimmetria e di curtosi Dato n=120, una proporzione p=9/60 e una proporzione campionaria=0,10 con quali script di R si calcola: a) la zeta empirica; b) il p-value con α=0,01; c) il p-value con α=0,05; c) il p-value con α=0,

Dato un campione n=41 con una % di pezzi difettosi pari al 2% e una proporzione stimata di 2,3% si scelga la regola di decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576; c) per un test bilatero (Z critica=1,96) Dato un file Excel quali linee di codice di R si utilizzano per: a) importarlo senza il nome della colonna nella prima riga; b) importarlo quando contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) importarlo con la versione di Excel in inglese se nella prima colonna ci sono i nomi di riga con l’estensione a)prova <- scan(«C:/mydat/prova.csv 2 ") b)prova <- read.table(“C:/mydat/prova.csv 2 ", header=TRUE, row.names=1) c)\prova <- read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1) Dato un Modello di Regressione lineare semplice con 7 osservazioni quali gradi di libertà si assegnano: a) alla regressione; b) alla devianza residua; c) ala devianza spiegata e totale a. G.d.l regressione = k parametri K = 1 b. G.d.l. residuo = n- k- 1 = 7- 1 - 1 = 5 c. G.d.l totali = n - 1 = 7- 1 = 6 Dato un Modello di Regressione lineare semplice con i valori della a(stimata) e b(stimato) con quali script di R si calcolano: a) la t empirica dell’intercetta; b) lo stimatore intervallare per l’intercetta e per il coefficiente angolare con α=0,01; c) la t empirica del coefficiente angolare a_stim<-mean(y)_bmean(x) ic_sup_a_stim<-a_stim+qt(0.025,n-2)esqm_int;ic_sup_a_stim ic_inf_a_stim<-a_stim-qt(0.025,n-2)esqm_int;ic_inf_a_stim b_stim<-cov(xy)/var(x) ic_sup_b_stim<-b_stim+qt(0.025,n-2)esqm_coefang;ic_sup_b_stim ic_inf_b_stim<-b_stim-qt(0.025,n-2)*esqm_coefang;ic_inf_b_stim Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-4;250-10;255-11;365-14;485-18;592-25) con quali script di R si calcolano: a) i coefficienti di regressione; b) l’output della regressione; c) le devianze spiegata, residua e totale. Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-4;250-10;255-11;365-14;485-18;592-25) con quali script di R si calcola, a) la devianza spiegata; b) la devianza residua; c) la devianza totale e il coefficiente di determinazione X<-c (4,10,11,14,18,25);x

Y<- c (0,250,255,365,485,592);y Modello<-lm(formula= y ~x, x=t, y=t); modello Stimati<-modello $fitted. values; stimati Ds<-sum((stimati-mean(y))^2);ds Dr<-sum((y-stimati)^2):dr Dt<-ds+dr;dt; determinazione <- ds/dt; determinazione Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-4;250-10;255-11;365-14;485-18;592-25) con quali script di R si calcolano: a) l’ESQM della regressione; b) l’ESQM dell’intercetta; c) l’ESQM del coefficiente angolare x<-c (4,10,11,14,18,25) y<-c (0,250,255,365,485,592) n<- 6 modello<-lm(y~x) summary(modello) stimati<-modello$fitted.values DR<-sum((y-ystim)^2);DR esqm_regr<-sqrt(1/(n-2)DR);esqm_regr esqm_int<-(esqm_regr)sqrt((1/n+((sum(x/n)^2))/dev));esqm_int esqm_coefang<-(esqm_regr)/sqrt(dev);esqm_coefang Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) lo stimatore intervallare per l’intercetta; b) lo stimatore intervallare per il coefficiente angolare; c) spiegare il significato dei punti a) e b) Tenuto conto dell’ipotesi di distribuzione normale del regressore e stabilito che la varianza σ2 è nota, il valore del quantile critico della v.c. z (± zα/2) è ricompreso (il parametro intercetta) Nel caso in cui la varianza della popolazione σ2 è ignota occorre stimarla attraverso lo stimatore s2 che si ottiene dal rapporto fra σ2 e il numero di gradi di libertà che sono n-2 in quanto il modello presenta per definizione due restrizioni. Tenuto conto dell’ipotesi di distribuzione normale del regressore b e stabilito che la varianza σ2 è nota, il valore del quantile critico della v.c. t (± tα/2) è ricompreso: (coefficiente angolare) Nel caso in cui la varianza della popolazione σ2 è ignota occorre stimarla attraverso lo stimatore s2 che si ottiene dal rapporto fra σ2 e il numero di gradi di libertà che sono n-2 in quanto il modello presenta per definizione due restrizioni. Tenuto conto dell’ipotesi di distribuzione normale del regressore b e stabilito che la varianza σ2 è nota, il valore del quantile critico della v.c. t (± tα/2) è ricompreso: Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’errore standard quadratico medio (ESQM) per la regressione; b) l’errore standard quadratico medio (ESQM) per l’intercetta; c) l’errore standard quadratico medio (ESQM) per il coefficiente angolare Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) lo stimatore intervallare per la variabile dipendente media; b) lo stimatore intervallare per la previsione; c) spiegare il significato del punto a) Dopo aver studiato gli intervalli di confidenza per i regressori si passa ad analizzare quelli per il valore atteso della variabile dipendente media ad un livello di fiducia pari a (1-α). L’intervallo di confidenza per il valore atteso della variabile dipendente ad un livello di fiducia (1-α) è dato dalla seguente notazione: Yˆi±tα/2s(Yˆi). Per l’analisi inferenziale sulla previsione si deve prendere in considerazione la stima di un valore singolo che, ovviamente, non è stato ancora osservato. L’intervallo di confidenza per il valore atteso della variabile dipendente ad un livello di fiducia (1-α) è dato dalla seguente notazione: Yˆi±tα/2s(Yi - Yˆi) Dato un Modello di Regressione lineare semplice quali sono le formule per calcolare: a) il coefficiente angolare; b) l’intercetta; c) la devianza spiegata e Residua Dato un Modello di Regressione lineare semplice quali sono le formule per calcolare: a) la devianza totale; b) R2; c) R2 aggiustato e test F

Descrivere quali grafici sono più appropriati per rappresentare: a) una distribuzione dei costi indiretti di una produzione; b) una distribuzione generica di valori suddivisi in classi;c) una relazione fra due variabili x ed y (di ogni risposta rappresentare un esempio senza preoccuparsi della correttezza grafica) Descrivere sinteticamente il significato delle ipotesi base cui sottostà il Modello di Regressione lineare semplice: a) linearità sui regressori; b) normalità dei residui; c) valore atteso dei residui nullo In un Modello di regressione lineare semplice si è trovato un valore del coefficiente di regressione a(stim) pari a 11,432 ed un error standard pari a 2,89 e si vuole scegliere la regola di decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilatero (Z critica=1,96) In un Modello di regressione lineare semplice si è trovato un valore del coefficiente di regressione b(stim) pari a 1,48 ed un error standard pari a 0,89 e si vuole sceglier la regola di decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilatero (Z critica=1,96) In una distribuzione della media campionaria per popolazioni finite o senza ripetizione quale notazione si utilizza per calcolare: a) la media campionaria; b) la varianza campionaria corretta; c) la deviazione standard e il coefficiente di variazione La v.c. X è la sommatoria di 80 v.c. bernoulliane e quindi è una v.c. binomiale con parametri p=0,23 e n=80 Bin~(80;0,23). Calcolare: a) il valore atteso;b) la varianza e la deviazione standard; c) la probabilità che p(X<3) e che P(X>2) E(X)=np=800,23=18,4; Var(X)=np(1-p)=800,23*0,77=14,17;DSTD(X)=3, Nel calcolo combinatorio se si vogliono disporre tre oggetti a tre a tre con quali script si calcolano: a) disposizioni semplici senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione e combinazioni semplici senza ripetizione Nel calcolo combinatorio si vogliono disporre tre oggetti a tre a tre e si vogliono calcolare le: a) disposizioni semplici senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione e combinazioni semplici senza ripetizione Nell’analisi della varianza spiegare il significato: a) della devianza spiegata; b) della devianza residua; c) dei relativi gradi di libertà e del test F

L’analisi della varianza (o Anova) si basa sul concetto di scomposizione della varianza totale che si esprime attraverso la seguente notazione: (DT)/n=(DS)/n+(DR)/n dove DT è la devianza totale; DS è la devianza spiegata e DR è la devianza residua ed n è il numero di osservazioni; (DT)/n è la varianza totale; (DS)/n è la varianza spiegata e (DR)/n è la varianza residua. Ad ognuno di questi valori viene associato il relativo numero di gradi di libertà. Questo numero è dato dal totale delle osservazioni n meno il o i vincoli (o restrizioni) a cui le quantità devono sottostare: - per la varianza totale (DT)/n il numero di gradi di libertà è pari a n- 1 - per la varianza spiegata (DS)/n esso è pari a 1 - per la varianza residua (DR)/n pari a n- 2 Infatti poiché DT/n=DS/n+DR/n i relativi gradi di libertà saranno (n-1)=1+(n-

  1. Nell’analisi della varianza si prende in considerazione la statistica test F (o di Fisher) il cui valore esprime la misura per l’accettazione (o non rifiuto) o il rifiuto (o non accettazione) dell’ipotesi nulla. Più il valore della F è prossimo a 1 più si tende ad accettare (o a non rifiutare) l’ipotesi di interesse H0 mentre qualora la statistica test F fosse molto più grande di 1, si tende a rifiutare (o non accettare) l’ipotesi nulla H0 ed accettare ( o non rifiutare) l’ipotesi alternativa. Il test F può essere espresso dalla seguente notazione: F=(R2/k-1)/(1-R2/n-k) dove k è il numero dei regressori e n il numero di osservazioni. Per importare il file di testo "prova.txt" descrivere quali linee di codice di R si utilizzano: a) quando non compare il nome della colonna nella prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) quando ci sono i nomi di riga nella prima colonna a) prova <- scan("c:/mydat/prova.txt") b) prova <- read.table("c:/mydat/prova.txt", header=TRUE) c) prova <- read.table("c:/mydat/prova.txt", header=TRUE, row.names=1) Per α=0,05: a) quali sono gli intervalli delle regioni di accettazione e di rifiuto per un test bilatero; b) quali sono gli intervalli delle regioni di accettazione e di rifiuto per un test unilatero destro; a) quali sono gli intervalli delle regioni di accettazione e di rifiuto per un test unilatero sinistro Quali linee di codice di R si implementano per il calcolo della numerosità campionaria: a) per la media con α=0,01, con σ=5 e con un valore del termine di errore massimo pari a 1,5; b) per la proporzione con α=0,05, con σ=8 e con un valore del termine di errore massimo pari a 0,5; c) per la varianza con α=0,1, con σ=9 e con un valore del termine di errore massimo pari a 0, Quali sistemi di ipotesi si impostano per: a) per un test bilatero per l’intercetta; b) per un test unilatero dx per l’intercetta; c) per un test unilatero sx per l’intercetta e per il coefficiente angolare Quali sono gli estremi dello stimatore intervallare: a) per il coefficiente angolare stimato con varianza nota e ignota; b) per l'intercetta stimata con varianza nota; c) per l'intercetta stimata con varianza ignota X ± Z 1 - α/2σ/√n X ± t 1 - α/2 s/√n Quali sono le notazioni attraverso le quali si individuano: a) l’ipotesi alternativa H1 se Z ≥ zα; b) l’ipotesi alternativa H1 se Z ≥- zα; c) l’ipotesi alternativa H1 se Z ≥ - zα/ Quali sono le notazioni attraverso le quali si individuano: a) la regione di accettazione se Z ≥ zα; b) la regione di accettazione se Z ≥- zα; c) la regione di accettazione se Z ≥ - zα/ Quali sono le notazioni attraverso le quali si individuano: a) la regione di accettazione se Z ≥ zα secondo la tecnica del p-value; b) la regione di accettazione se Z ≥- zα secondo la tecnica del p-value; c) la regione di accettazione se Z ≥ - zα/2 secondo la tecnica del p-value. Quali sono le notazioni con cui si calcolano: a) la zempirica per il coefficiente angolare con varianza nota e come si distribuisce; b) la zempirica per l’intercetta con varianza nota e come si distribuisce; c) la zempirica per il coefficiente angolare con varianza ignota e come si distribuisce

Si estrae un campione casuale di 300 prodotti da cui si rileva una difettosità media del 2% e si vuole calcolare: a) la probabilità che 10 prodotti siano difettosi; b) la probabilità di riscontrare un numero di prodotti difettosi minore di 8 e ricompreso fra 5 e 9; c) il valore atteso Si estrae un campione di 24 contenitori e si vuole calcolare la probabilità di riscontrare una varianza campionaria: a) minore di 0,45; b) maggiore di 0,48; c) compresa fra 0,38 e 0, Si scelgano 100 numeri casuali da una v.c. continua normale con valore atteso 2 e deviazione standard 0,2; quali linee di codice di R si utilizzano per: a) trovare i numeri casuali; b) rappresentare lo sfondo colorato beige del grafico della funzione di densità; c) rappresentare il grafico della funzione di densità rnorm(100,2,0.2)##simulazione di 100 numeri casuali da una Normale curve(dnorm(x,2,0.2),-2, 6, ylab= “Densità”,main= “Grafico della funzione di densità”) Si scelgano 100 numeri casuali da una v.c. continua normale con valore atteso 2 e deviazione standard 0,2; quali linee di codice di R si utilizzano per: a) trovare i numeri casuali; b) rappresentare lo sfondo colore beige del grafico della funzione di ripartizione; c) rappresentare il grafico della della funzione di ripartizione rnorm(100,2,0.2)##simulazione di 100 numeri casuali da una Normale curve(pnorm(x,2,0.2),-2, 6, ylab= “Ripartizione”,main= “Grafico della funzione di ripartizione”) Si vuole calcolare: a) lo stimatore intervallare con α=0,05 (zempirica=1,96) per la proporzione campionaria pari a 0,47 su un campione di 98 elettori; b) lo stimatore intervallare con α=0, (zempirica=2,67) per la proporzione campionaria pari a 0,47 su un campione di 320 elettori; c) lo stimatore intervallare con α=0,05 (zempirica=1,96) per la proporzione campionaria pari a 0,47 su un campione di 1550 elettori.

Si vuole svolgere una indagine statistica con dati a scelta e si vuole: a) stabilire quale strumento di raccolta di dati deve essere utilizzato; b) quali unità statistiche utilizzare; c) quali caratteri e quali modalità scegliere Si può dire che il piano o progetto statistico consiste nella raccolta di tutti i dati. Quindi si specifica il cosa rilevare; il dove rilevare. Si definisce il come rilevare ovvero, ad esempio, attraverso un’indagine diretta. Infine è necessario stabilire il quando rilevare ovvero la tempificazione di raccolta dei dati. Sia X è una v.c. continua con quali notazioni si calcolano: a) il valore atteso; b) la varianza; c) la deviazione standard e il coefficiente di variazione Stimata la varianza campionaria pari a 2,8 e stabilito un livello di significatività dell’1% con quali script di R si calcolano: a) il limite superiore dello stimatore intervallare per la varianza; b) il limite inferiore dello stimatore intervallare per la varianza; c) la numerosità campionaria e l’ampiezza dell’intervallo intervallo per la varianza 2.8, n=50, alfa= 0. DATI varcamp<-2. n<- 50 alpha<-0. I DUE CHI QUADRO DA TAVOLA chi_sup<-qchisq(alpha/2, n-1) chi_sup chi_inf<-qchisq(1-alpha/2, n-1) chi_inf ESTREMO INFERIORE inf<-varcamp(n-1)/chi_inf; inf ESTREMO SUPERIORE sup<-varcamp(n-1)/chi_sup; sup AMPIEZZA ampiezza<-sup-inf; ampiezza la numerosità campionaria non è calcolabile Sugli eventi complessi e relative probabilità si vogliono svolgere i seguenti calcoli: a) P(E)= 0,71; P(F)=0,11 e P(E∩F)=0,55 calcolare la probabilità condizionata P(E|F) b) P(E|F )=0,24 e P(F)=0,11 e P(E∩F)=0,32 calcolare P(E) la probabilità unione P(EF) per eventi compatibili c) P(E|F )=0,48 e P(E)=0,33 e P(E∩F)=0,32 calcolare P(F) Sulla verifica di ipotesi stabilire: a) quando si decide di accettare l’ipotesi nulla H0 sotto quella alternativa H1 quando questa è vera come è la scelta e quale probabilità assume; b) quando si decide di rifiutare l’ipotesi nulla H0 sotto quella alternativa H1 quando questa è falsa come è la scelta e quale probabilità assume; c) quando si decide di accettare l’ipotesi nulla H0 sotto quella alternativa H1 quando questa è falsa come è la scelta e quale probabilità assume?