




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Paniere statistica aperte del prof cocarda
Tipologia: Panieri
1 / 127
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































1. Per importare il file di testo "prova.txt" descrivere quali linee di codice di R si utilizzano: a) quando non compare il nome della colonna nella prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) quando ci sono i nomi di riga nella prima colonna
a) prova < - scan ("c:/mydat/prova.txt") b) prova < - read.table ("c:/mydat/prova.txt", header=TRUE) c) prova < - read.table ("c:/mydat/prova.txt", header=TRUE, row.names=1)
2. Redigere le seguenti linee di codice di R: a) per cambiare una directory di lavoro, per settare una nuova directory e per importare un data frame presente in R; b) per implementare la creazione del data frame "df" utilizzando il comando matrix;c) per implementare la creazione del data frame "df" utilizzando il comando tab
a) Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File l'opzione "Cambia directory" oppure tramite il comando di R: getwd (). Per settare una nuova directory si può usare il comando: setwd(). Se il file che si vuole leggere si chiama prova.txt (contenente vettori colonna di dati senza il nome della colonna nella prima riga) che si trova nella directory mydat del disco C:/ il codice da utilizzare e: prova <- scan(≪C:/mydat/prova.txt"); b) m1<- matrix(1:36, nrow=6) df<-data.frame(m1); df; c) tab <- matrix(c (1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f) colnames(tab) <- c("Ottimo", "Buono", "Discreto") tab.
3. Dato un file Excel quali linee di codice di R si utilizzano per: a) importarlo senza il nome della colonna nella prima riga; b) importarlo quando contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) importarlo con la versione di Excel in inglese se nella prima colonna ci sono i nomi di riga con l’estensione
a) prova < - scan(«C:/mydat/prova.csv2") b) prova < - read.table(“C:/mydat/prova.csv2", header=TRUE, row.names=1) c) \prova < - read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1)
4. Si vuole svolgere una indagine statistica con dati a scelta e si vuole: a) stabilire quale strumento di raccolta di dati deve essere utilizzato; b) quali unità statistiche utilizzare; c) quali caratteri e quali modalità scegliere
Si può dire che il piano o progetto statistico consiste nella raccolta di tutti i dati. Quindi si specifica il cosa rilevare; il dove rilevare. Si definisce il come rilevare ovvero, ad esempio, attraverso un’indagine diretta. Infine è necessario stabilire il quando rilevare ovvero la tempificazione di raccolta dei dati.
5. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) calcolare: a) numeri indici a base fissa e mobile; b) passaggio da base fissa Marzo a base mobile Giugno; c) passaggio da base mobile Febbraio a base fissa Maggio
Tempo Prezzi NIBF NIBM Da NIBM a NIBF Da NIBF a NIBM GEN 17 12,4 12,4/12,4 = 1 - 1 - FEB 17 12,5 12,5/12,4 = 1,008 12,5/12,4=1,008 11,008 = 1,008 1,008/1 = 1, MAR 17 11,9 11,9/12,4=0,9597 11,9/12,5=0,952 1,0080,952=0,9596 0,9596/1,008=0, APR 17 12,9 12,9/12,4 = 1.040 12,9/11,9=1,084 0,95961,084=1,040 1,040/0,9596=1, MAG 17 13,1 13,1/12,4 = 1,055 13,1/12,9=1,016 1,0401,016 = 1,057 1,057/1,040=1, GIU 17 11,1 11,1/12,4 = 0,894 11,1/13,1=0,847 1,057 * 0,84 = 0,895 0,855/1,057=0,
6. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) quali script di R si utilizzano per calcolare: a) numeri indici a base fissa da Gennaio a Marzo; b) numeri indici a base fissa da Marzo a Giugno; c) numeri indici a base mobile
P_2017 < - c(12.4-12.5-11.9,12.9-13.1-11.1) Fissa < - function (P, Base) P/Base Fissa (p_2017, 12.4) # CODICE DI R BASE MOBILE 2017 # p_2017 < - c (12.4-12.5-11.9,12.9-13.1-11.1) Mobile < - function (P_t2, P_t1) P_t2/P_t Mobile(p_2017[-1],p_2017[-6])
#CODICE DI R MEDIA ARITMETICA E CODICE DI R MEDIA GEOMETRICA# X <- c(12.4-12.5-11.9,12.9-13.1-11.1) Mean(x) Media <-Sum(x)/ Library (labstatR) Meang (p_2017)
7. Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa frequenza assoluta (0,1,2,3) calcolare: a) i valori centrali di classe e la frequenza relativa; b) la frequenza cumulata assoluta; c) la frequenza cumulata relativa
Classi Fre ass Val centr Fre rel Fre cum ass Fra cum rel 12-16 0 14 0,00 0 0 16-20 1 18 0,17 1 0, 20-24 2 22 0,33 3 0, 24-28 3 26 0,5 6 1 Tot. 6 1,
10. Descrivere quali grafici sono più appropriati per rappresentare: a) una distribuzione dei costi indiretti di una produzione; b) una distribuzione generica di valori suddivisi in classi; c) una relazione fra due variabili x ed y (di ogni risposta rappresentare un esempio senza preoccuparsi della correttezza grafica)
Se si prende in considerazione la distribuzione dei costi indiretti di una produzione generica, questi possono essere rappresentati attraverso un grafico a torta. Questo grafico, infatti, è molto utile quando si vuole rappresentare la composizione di un “tutto” in parti. Il grafico cartesiano mette in relazione due variabili sui due assi (X,Y), associando normalmente la variabile indipendente o esplicativa all’asse delle ascisse e la variabile dipendente o risposta all’asse delle ordinate. Con il grafico a bolle viene rappresentato il fenomeno statistico in modo simile a quello a dispersione tanto che alcuni lo considerano come vera e propria variante a tale grafico e come una via di mezzo tra il grafico e il cartogramma. l grafico a bolle deve essere letto in modo che le aree delle stesse debbano considerarsi proporzionali alla densità del carattere osservato. L’utilizzo del grafico a bolle è particolarmente indicato per presentazioni di coppie di dati la cui somma ha un qualche significato da un punto di vista aziendalistico. Il grafico ad anello è simile a quello a torta. La differenza consiste nel fatto che vengono rappresentati in più anelli concentrici serie diverse di dati ed ogni anello è suddiviso in parti corrispondenti normalmente alle frequenze percentuali del carattere osservato.
Grafico a bolle Istogramma
Cartesiano Grafico a barre orizzontali e verticali
11. Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative frequenze assolute (0,1,2,3,2,1,3,4) descrivere con quali script di R si calcolano: a) la media aritmetica in frequenza relativa; b) la media geometrica; c) la media armonica
library(labstatR) v_c< -c(12,2,3,45,64,32,1,87);v_c m_ar_r.rel< -sum(v_c*FreqRel); m_ar_f.relmeang(x) m_geom_f.as< -prod(v_c^FreqAss)^(1/n); m_geom_f.a m_arm_f.as< -sumFì(FreqAss)/sum(FreqAss/v_c); m_arm_f.as meana(x)
12. Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali formule si calcolano: a) la media aritmetica semplice per valori singoli; b) la media aritmetica semplice in frequenza assoluta; c) la media geometrica per valori **singoli
#MEDIA ARTITMETICA SEMPLICE# n<-pength(x) sum(x)/n #OPPURE Mean(x)
#MEDIA ARTITMETICA FREQUENZA ASSOLUTA# Sum(x* fre. ass.)/sum(fre. ass.)
#MEDIA ARTITMETICA FREQUENZA RELATIVA# Freq_rel<- fre. ass./sum(fre. ass.) Sum(x*freq_rel)
14. Con quali formule si calcolano: a) la mediana per valori singoli; b) la mediana per classi con il procedimento 1; c) la mediana per classi con il procedimento 2
La mediana occupa la posizione che si ottiene dalla formula: (n+1)/2 = (7+1)/2 = 4^ Dopo aver ordinato l’insieme dei dati in sequenza crescente o decrescente e assegnato la relativa posizione si applicano due principi:
16. Data una distribuzione di valori suddivisi in classi descrivere: a) la formula con cui si calcola il I Quartile; a) la formula con cui si calcola il II Quartile; a) la formula con cui si calcola il III Quartile
a) il I Quartile : Q1=IQ1+ 0.25-FQ1-1 ∆Q FQ1-FQ1- DOVE: IQ1 è l’estremo inferiore della classe dove cade il I quartile. Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile. ∆_Q1 è l’ampiezza della classe che contiene il I quartile.
b) II Quartile (o Mediana): Me=LMe + n/2-(Σni)me c fMe dove: Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che precede quella mediana. N è la frequenza totale. freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella mediana. Freq. ass. Me è la frequenza assoluta della classe mediana. C è l’ampiezza della classe mediana.
c) III Quartile : Q3=IQ1 + 0.75-FQ3-1 ∆Q FQ3-FQ3- dove: IQ3 è l’estremo inferiore della classe dove cade il Q Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui cade il Q Fq3 è la frequenza relativa cumulata fino alla classe
17. Dati i seguenti valori di x (22,23,24,32,56) con quali script si calcola: a) il I quartile; il II quartile; c) il III quartile
a) I Quartile : x<-c(22,23,24,32,56) quantile (x, probs=0,25)
b) II Quartile o (mediana): X<-c(22,23,24,32,56) n<-lenghth(x) 0,5(x[n/2]+x[n/2+1] Median (x)
c) III Quartile : x<-c(22,23,24,32,56) quantile 8x, probs=0.75)
18. Data una distribuzione di valori singoli descrivere con quali formule si calcolano: a) il I Quartile; b) il II Quartile (o Mediana); c) il III Quartile
a) I Quartile:
IQ1 è l’estremo inferiore della classe dove cade il I quartile. Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile. ∆_Q1 è l’ampiezza della classe che contiene il I quartile.
b) II Quartile (o Mediana):
Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che precede quella mediana. N è la frequenza totale. freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella mediana. Freq. ass. Me è la frequenza assoluta della classe mediana. C è l’ampiezza della classe mediana.
c) III Quartile :
IQ3 è l’estremo inferiore della classe dove cade il Q Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui cade il Q Fq3 è la frequenza relativa cumulata fino alla classe che contiene il Q ∆_Q3 è l’ampiezza della classe che contiene il Q3.
19. Con quale notazione si calcola: a) lo scarto semplice dalla media e dalla mediana; b) lo scarto medio assoluto dalla media e dalla mediana; c) l'indice di dissomiglianza
Scarto semplice dalla media: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore medio SCsem= Σ|&'−&̅ | Scarto semplice dalla mediana: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore mediano SCsem= Σ|&'−(| Scarto medio assoluto dalla media: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore medio rapportati al numero delle osservazioni SCass= Σ|&'−&̅ |/) Scarto medio assoluto dalla mediana: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore mediano rapportati al numero delle osservazioni SCass = Σ|&'−(|/n Indice semplice di dissomiglianza: È un indice che permette di valutare la dissomiglianza fra due distribuzioni di valori osservati suddivisi in classi ed è dato dalla sommatoria delle differenze medie delle corrispondenti frequenze relative Idiss=Σ|* 1 '−* 2 '|/
21. Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli e per valori suddivisi in classi
22. Dati i seguenti dati del carattere X (12,2,3,45) e le relative frequenze assolute (1,4,0,3) calcolare: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli e per valori suddivisi in classi
24. Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano: a) la media per valori suddivisi in classi; b) lo scarto quadratico medio dalla media; c) l’indice di curtosi con la formula del momento quarto per valori singoli e per valori suddivisi in classi
x<-(12,2,3,45) senza pesi
x<1<-(12,2,2,45,45,45,45)
media_x_1<-sqrt(var(x_1))/ media_x_
media_x<-mean(x) #singoli
sqm_x<-sum(((x-media_x)/sqm_x)14)/n
I_curt_x_1<-sum((x_1-media_x_1)14/ 9 x (sqm_x_1)
25. Data la seguente matrice di dati composta di tre righe e quattro colonne (0,1,3,4,1,2,3,0,1,5,3,2) relativi ai caratteri X ed Y con quali script di R si calcolano: a) la tabella delle frequenze congiunte assolute; b) la tabella delle frequenze teoriche; c) la tabella delle contingenze assolute e il chi-quadrato
26. Data la seguente matrice di dati composta di due righe e due colonne (0,1,3,4) relativi ai caratteri X ed Y calcolare: a) la frequenza marginale di riga e di colonna; b) la tabella delle frequenze teoriche; c) la tabella delle contingenze assolute e il chi- quadrato
29. Si è svolta un’analisi di Connessione tra il carattere (X) che assume le modalità 1,2 e 3 e il carattere (Y) che assume le modalità A, B e C. I dati rilevati di X sono: (1,1,3,2,3,2,1,3); quelli di (A,A,B,C,A,C,B,A) e si vuole: a)costruire la relativa matrice di dati; b)calcolare le frequenze congiunte assolute e teoriche; c) le contingenze assolute e il chi-quadrato
30. Nel calcolo combinatorio se si vogliono disporre tre oggetti a tre a tre con quali script si calcolano: a) disposizioni semplici senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione e combinazioni semplici senza ripetizione
32. Definire il concetto di probabilità: a) secondo l'approccio classico; b) secondo l'approccio frequentista; c) secondo l'approccio soggettivista ed assiomatico
Secondo l’approccio classico la probabilità si definisce come il rapporto fra il numero di casi favorevoli all’evento E e il numero totale di casi possibili purché egualmente probabili: P=EFAV/E 1 +E 2 +........+Ei dove EFAV è il numero di casi favorevoli all’evento E e la sommatoria di Ei è l’insieme degli eventi possibili equiprobabili. Secondo l’approccio frequentista definito anche come approccio o concezione statistica la probabilità è espressa in termini quantitativi da un valore empirico osservato: la frequenza relativa. Se si osserva un fenomeno attraverso un esperimento costituito da un certo numero di prove in condizioni costanti, si definisce frequenza relativa il rapporto fra il numero k, ovvero il numero delle volte nelle quali l’evento E si e verificato ed il numero totale n delle prove ovvero k/n. A questo concetto di misurazione statistica della probabilità si associa la cosiddetta ”legge empirica del caso”, attraverso la quale si constata che al crescere di n la frequenza relativa tende, ancorché oscillando, ad un valore stabile. Secondo l’approccio soggettivista la probabilità è la misura che il ricercatore assegna a priori ad un evento sulla base del suo grado di fiducia che lo stesso si verifichi. Secondo l’approccio assiomatico la definizione di probabilità presuppone il ricorso al concetto di funzione che associ ad ogni evento elementare dello spazio campionario Ω una probabilità P. A differenza della funzione classica nel caso della funzione di probabilità sull’asse reale vengono riportati gli insiemi o eventi elementari. Anche in questo caso la caratterizzazione della funzione avviene attraverso l’individuazione del dominio denotato con la lettera D (n.d.a), che coincide con il totale degli insiemi o eventi elementari dello spazio campionario Ω e della probabilità P. In simboli
i tre oggetti soprarichiamati {D, Ω, P} costituiscono il cosiddetto spazio di probabilità dove Ω ⊂ D
33. Dati i valori di P(E)=0,28, P(F)=0,32 e P(E|F)=0,18 calcolare; a) la probabilità unione P(E ∪ F) per eventi compatibili o congiunti; b) la probabilità intersezione P(E∩F) per eventi dipendenti e indipendenti; c) la probabilità unione P(E ∪ F) per eventi incompatibili o disgiunti