Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Paniere statistica aperte cocarda, Panieri di Statistica

Paniere statistica aperte del prof cocarda

Tipologia: Panieri

2023/2024

In vendita dal 11/11/2023

Università-economia
Università-economia 🇮🇹

4.5

(69)

42 documenti

1 / 127

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1. Per importare il file di testo "prova.txt" descrivere quali linee di codice di R si
utilizzano:
a) quando non compare il nome della colonna nella prima riga; b) quando contiene due
e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) quando
ci sono i nomi di riga nella prima colonna
a) prova < - scan ("c:/mydat/prova.txt")
b) prova < - read.table ("c:/mydat/prova.txt", header=TRUE)
c) prova < - read.table ("c:/mydat/prova.txt", header=TRUE, row.names=1)
2. Redigere le seguenti linee di codice di R: a) per cambiare una directory di lavoro, per
settare una nuova directory e per importare un data frame presente in R; b) per
implementare la creazione del data frame "df" utilizzando il comando matrix;c) per
implementare la creazione del data frame "df" utilizzando il comando tab
a) Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File l'opzione
"Cambia directory" oppure tramite il comando di R: getwd (). Per settare una nuova directory si può
usare il comando: setwd(). Se il file che si vuole leggere si chiama prova.txt (contenente vettori
colonna di dati senza il nome della colonna nella prima riga) che si trova nella directory mydat del
disco C:/ il codice da utilizzare e: prova <- scan(C:/mydat/prova.txt");
b) m1<- matrix(1:36, nrow=6) df<-data.frame(m1); df;
c) tab <- matrix(c (1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f) colnames(tab) <- c("Ottimo", "Buono",
"Discreto") tab.
3. Dato un file Excel quali linee di codice di R si utilizzano per:
a) importarlo senza il nome della colonna nella prima riga; b) importarlo quando
contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima
riga; c) importarlo con la versione di Excel in inglese se nella prima colonna ci sono i
nomi di riga con l’estensione
a) prova < - scan(«C:/mydat/prova.csv2")
b) prova < - read.table(“C:/mydat/prova.csv2", header=TRUE, row.names=1)
c) \\prova < - read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1)
4. Si vuole svolgere una indagine statistica con dati a scelta e si vuole: a) stabilire quale
strumento di raccolta di dati deve essere utilizzato; b) quali unità statistiche utilizzare;
c) quali caratteri e quali modalità scegliere
Si può dire che il piano o progetto statistico consiste nella raccolta di tutti i dati. Quindi si specifica
il cosa rilevare; il dove rilevare. Si definisce il come rilevare ovvero, ad esempio, attraverso
un’indagine diretta. Infine è necessario stabilire il quando rilevare ovvero la tempificazione di
raccolta dei dati.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Paniere statistica aperte cocarda e più Panieri in PDF di Statistica solo su Docsity!

1. Per importare il file di testo "prova.txt" descrivere quali linee di codice di R si utilizzano: a) quando non compare il nome della colonna nella prima riga; b) quando contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) quando ci sono i nomi di riga nella prima colonna

a) prova < - scan ("c:/mydat/prova.txt") b) prova < - read.table ("c:/mydat/prova.txt", header=TRUE) c) prova < - read.table ("c:/mydat/prova.txt", header=TRUE, row.names=1)

2. Redigere le seguenti linee di codice di R: a) per cambiare una directory di lavoro, per settare una nuova directory e per importare un data frame presente in R; b) per implementare la creazione del data frame "df" utilizzando il comando matrix;c) per implementare la creazione del data frame "df" utilizzando il comando tab

a) Essa può essere visualizzata o modificata cliccando sulla RConsole e aprire da File l'opzione "Cambia directory" oppure tramite il comando di R: getwd (). Per settare una nuova directory si può usare il comando: setwd(). Se il file che si vuole leggere si chiama prova.txt (contenente vettori colonna di dati senza il nome della colonna nella prima riga) che si trova nella directory mydat del disco C:/ il codice da utilizzare e: prova <- scan(≪C:/mydat/prova.txt"); b) m1<- matrix(1:36, nrow=6) df<-data.frame(m1); df; c) tab <- matrix(c (1:18),6, 3);rownames(tab) <- c(a,b,c,d,e,f) colnames(tab) <- c("Ottimo", "Buono", "Discreto") tab.

3. Dato un file Excel quali linee di codice di R si utilizzano per: a) importarlo senza il nome della colonna nella prima riga; b) importarlo quando contiene due e più colonne separate da spazi vuoti con nome delle colonne nella prima riga; c) importarlo con la versione di Excel in inglese se nella prima colonna ci sono i nomi di riga con l’estensione

a) prova < - scan(«C:/mydat/prova.csv2") b) prova < - read.table(“C:/mydat/prova.csv2", header=TRUE, row.names=1) c) \prova < - read.csv(«C:/mydat/prova.csv", header=TRUE, row.names=1)

4. Si vuole svolgere una indagine statistica con dati a scelta e si vuole: a) stabilire quale strumento di raccolta di dati deve essere utilizzato; b) quali unità statistiche utilizzare; c) quali caratteri e quali modalità scegliere

Si può dire che il piano o progetto statistico consiste nella raccolta di tutti i dati. Quindi si specifica il cosa rilevare; il dove rilevare. Si definisce il come rilevare ovvero, ad esempio, attraverso un’indagine diretta. Infine è necessario stabilire il quando rilevare ovvero la tempificazione di raccolta dei dati.

5. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) calcolare: a) numeri indici a base fissa e mobile; b) passaggio da base fissa Marzo a base mobile Giugno; c) passaggio da base mobile Febbraio a base fissa Maggio

Tempo Prezzi NIBF NIBM Da NIBM a NIBF Da NIBF a NIBM GEN 17 12,4 12,4/12,4 = 1 - 1 - FEB 17 12,5 12,5/12,4 = 1,008 12,5/12,4=1,008 11,008 = 1,008 1,008/1 = 1, MAR 17 11,9 11,9/12,4=0,9597 11,9/12,5=0,952 1,0080,952=0,9596 0,9596/1,008=0, APR 17 12,9 12,9/12,4 = 1.040 12,9/11,9=1,084 0,95961,084=1,040 1,040/0,9596=1, MAG 17 13,1 13,1/12,4 = 1,055 13,1/12,9=1,016 1,0401,016 = 1,057 1,057/1,040=1, GIU 17 11,1 11,1/12,4 = 0,894 11,1/13,1=0,847 1,057 * 0,84 = 0,895 0,855/1,057=0,

6. Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) quali script di R si utilizzano per calcolare: a) numeri indici a base fissa da Gennaio a Marzo; b) numeri indici a base fissa da Marzo a Giugno; c) numeri indici a base mobile

CODICE DI R BASE FISSA 2017

P_2017 < - c(12.4-12.5-11.9,12.9-13.1-11.1) Fissa < - function (P, Base) P/Base Fissa (p_2017, 12.4) # CODICE DI R BASE MOBILE 2017 # p_2017 < - c (12.4-12.5-11.9,12.9-13.1-11.1) Mobile < - function (P_t2, P_t1) P_t2/P_t Mobile(p_2017[-1],p_2017[-6])

#CODICE DI R MEDIA ARITMETICA E CODICE DI R MEDIA GEOMETRICA# X <- c(12.4-12.5-11.9,12.9-13.1-11.1) Mean(x) Media <-Sum(x)/ Library (labstatR) Meang (p_2017)

7. Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa frequenza assoluta (0,1,2,3) calcolare: a) i valori centrali di classe e la frequenza relativa; b) la frequenza cumulata assoluta; c) la frequenza cumulata relativa

Classi Fre ass Val centr Fre rel Fre cum ass Fra cum rel 12-16 0 14 0,00 0 0 16-20 1 18 0,17 1 0, 20-24 2 22 0,33 3 0, 24-28 3 26 0,5 6 1 Tot. 6 1,

10. Descrivere quali grafici sono più appropriati per rappresentare: a) una distribuzione dei costi indiretti di una produzione; b) una distribuzione generica di valori suddivisi in classi; c) una relazione fra due variabili x ed y (di ogni risposta rappresentare un esempio senza preoccuparsi della correttezza grafica)

Se si prende in considerazione la distribuzione dei costi indiretti di una produzione generica, questi possono essere rappresentati attraverso un grafico a torta. Questo grafico, infatti, è molto utile quando si vuole rappresentare la composizione di un “tutto” in parti. Il grafico cartesiano mette in relazione due variabili sui due assi (X,Y), associando normalmente la variabile indipendente o esplicativa all’asse delle ascisse e la variabile dipendente o risposta all’asse delle ordinate. Con il grafico a bolle viene rappresentato il fenomeno statistico in modo simile a quello a dispersione tanto che alcuni lo considerano come vera e propria variante a tale grafico e come una via di mezzo tra il grafico e il cartogramma. l grafico a bolle deve essere letto in modo che le aree delle stesse debbano considerarsi proporzionali alla densità del carattere osservato. L’utilizzo del grafico a bolle è particolarmente indicato per presentazioni di coppie di dati la cui somma ha un qualche significato da un punto di vista aziendalistico. Il grafico ad anello è simile a quello a torta. La differenza consiste nel fatto che vengono rappresentati in più anelli concentrici serie diverse di dati ed ogni anello è suddiviso in parti corrispondenti normalmente alle frequenze percentuali del carattere osservato.

Grafico a bolle Istogramma

Cartesiano Grafico a barre orizzontali e verticali

11. Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative frequenze assolute (0,1,2,3,2,1,3,4) descrivere con quali script di R si calcolano: a) la media aritmetica in frequenza relativa; b) la media geometrica; c) la media armonica

library(labstatR) v_c< -c(12,2,3,45,64,32,1,87);v_c m_ar_r.rel< -sum(v_c*FreqRel); m_ar_f.relmeang(x) m_geom_f.as< -prod(v_c^FreqAss)^(1/n); m_geom_f.a m_arm_f.as< -sumFì(FreqAss)/sum(FreqAss/v_c); m_arm_f.as meana(x)

12. Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali formule si calcolano: a) la media aritmetica semplice per valori singoli; b) la media aritmetica semplice in frequenza assoluta; c) la media geometrica per valori **singoli

  1. Descrivere con quali script di R si calcolano: a) la media aritmetica semplice; b) la media aritmetica in frequenza; c) la media geometrica per classi**

#MEDIA ARTITMETICA SEMPLICE# n<-pength(x) sum(x)/n #OPPURE Mean(x)

#MEDIA ARTITMETICA FREQUENZA ASSOLUTA# Sum(x* fre. ass.)/sum(fre. ass.)

#MEDIA ARTITMETICA FREQUENZA RELATIVA# Freq_rel<- fre. ass./sum(fre. ass.) Sum(x*freq_rel)

14. Con quali formule si calcolano: a) la mediana per valori singoli; b) la mediana per classi con il procedimento 1; c) la mediana per classi con il procedimento 2

La mediana occupa la posizione che si ottiene dalla formula: (n+1)/2 = (7+1)/2 = 4^ Dopo aver ordinato l’insieme dei dati in sequenza crescente o decrescente e assegnato la relativa posizione si applicano due principi:

  1. Se il numero di modalità è dispari la mediana occupa la posizione (n+1)/2 ed il suo valore e corrispondente a quello della posizioni trovata;
  2. Se il numero di modalità è pari la mediana occupa sempre la posizione (n+1)/2 ma il suo valore e corrispondente a quello delle due posizioni limitrofe trovate.

16. Data una distribuzione di valori suddivisi in classi descrivere: a) la formula con cui si calcola il I Quartile; a) la formula con cui si calcola il II Quartile; a) la formula con cui si calcola il III Quartile

a) il I Quartile : Q1=IQ1+ 0.25-FQ1-1 ∆Q FQ1-FQ1- DOVE: IQ1 è l’estremo inferiore della classe dove cade il I quartile. Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile. ∆_Q1 è l’ampiezza della classe che contiene il I quartile.

b) II Quartile (o Mediana): Me=LMe + n/2-(Σni)me c fMe dove: Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che precede quella mediana. N è la frequenza totale. freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella mediana. Freq. ass. Me è la frequenza assoluta della classe mediana. C è l’ampiezza della classe mediana.

c) III Quartile : Q3=IQ1 + 0.75-FQ3-1 ∆Q FQ3-FQ3- dove: IQ3 è l’estremo inferiore della classe dove cade il Q Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui cade il Q Fq3 è la frequenza relativa cumulata fino alla classe

17. Dati i seguenti valori di x (22,23,24,32,56) con quali script si calcola: a) il I quartile; il II quartile; c) il III quartile

a) I Quartile : x<-c(22,23,24,32,56) quantile (x, probs=0,25)

b) II Quartile o (mediana): X<-c(22,23,24,32,56) n<-lenghth(x) 0,5(x[n/2]+x[n/2+1] Median (x)

c) III Quartile : x<-c(22,23,24,32,56) quantile 8x, probs=0.75)

18. Data una distribuzione di valori singoli descrivere con quali formule si calcolano: a) il I Quartile; b) il II Quartile (o Mediana); c) il III Quartile

a) I Quartile:

∆ DOVE:

IQ1 è l’estremo inferiore della classe dove cade il I quartile. Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile. ∆_Q1 è l’ampiezza della classe che contiene il I quartile.

b) II Quartile (o Mediana):

)" DOVE :

Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che precede quella mediana. N è la frequenza totale. freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella mediana. Freq. ass. Me è la frequenza assoluta della classe mediana. C è l’ampiezza della classe mediana.

c) III Quartile :

∆# DOVE:

IQ3 è l’estremo inferiore della classe dove cade il Q Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui cade il Q Fq3 è la frequenza relativa cumulata fino alla classe che contiene il Q ∆_Q3 è l’ampiezza della classe che contiene il Q3.

19. Con quale notazione si calcola: a) lo scarto semplice dalla media e dalla mediana; b) lo scarto medio assoluto dalla media e dalla mediana; c) l'indice di dissomiglianza

Scarto semplice dalla media: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore medio SCsem= Σ|&'−&̅ | Scarto semplice dalla mediana: È la sommatoria della differenza semplice in valore assoluto fra i valori osservati e il loro valore mediano SCsem= Σ|&'−(| Scarto medio assoluto dalla media: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore medio rapportati al numero delle osservazioni SCass= Σ|&'−&̅ |/) Scarto medio assoluto dalla mediana: È la sommatoria della differenza in valore assoluto fra i valori osservati e il loro valore mediano rapportati al numero delle osservazioni SCass = Σ|&'−(|/n Indice semplice di dissomiglianza: È un indice che permette di valutare la dissomiglianza fra due distribuzioni di valori osservati suddivisi in classi ed è dato dalla sommatoria delle differenze medie delle corrispondenti frequenze relative Idiss=Σ|* 1 '−* 2 '|/

21. Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli e per valori suddivisi in classi

22. Dati i seguenti dati del carattere X (12,2,3,45) e le relative frequenze assolute (1,4,0,3) calcolare: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli e per valori suddivisi in classi

24. Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano: a) la media per valori suddivisi in classi; b) lo scarto quadratico medio dalla media; c) l’indice di curtosi con la formula del momento quarto per valori singoli e per valori suddivisi in classi

x<-(12,2,3,45) senza pesi

x<1<-(12,2,2,45,45,45,45)

media_x_1<-sqrt(var(x_1))/ media_x_

media_x<-mean(x) #singoli

sqm_x<-sum(((x-media_x)/sqm_x)14)/n

I_curt_x_1<-sum((x_1-media_x_1)14/ 9 x (sqm_x_1)

25. Data la seguente matrice di dati composta di tre righe e quattro colonne (0,1,3,4,1,2,3,0,1,5,3,2) relativi ai caratteri X ed Y con quali script di R si calcolano: a) la tabella delle frequenze congiunte assolute; b) la tabella delle frequenze teoriche; c) la tabella delle contingenze assolute e il chi-quadrato

x/y h1 h2 h3 h

w1 0 1 3 4

w2 1 2 3 0

w3 1 5 3 2

#TABELLA FREQUENZE CONGIUNTE OSSERVATE

tab_oss<-matrix(c(0,1,3,4,1,2,3,0,1,5,3,2)3,4)

raunames(tab)<-c(“w1”,”w2”,”w3”)

colonames(tab)<-c(“h1”,”h2”,”h3”, “h4”)

tab_oss

#TABELLA FREQUENZE CONGIUNTE TEORICHE

tab_te<-matrix.table(tab_oss,1)%*%t(margin.table(tab_oss,2))/sum(tab_oss)

tab_te

#TABELLA CONTINGENTE

tab_co<-(tab_oss-tab_te)

tab_co

#CHI QUADRATO

chi_quad<-sum((tab_co^2)/tab_te)

26. Data la seguente matrice di dati composta di due righe e due colonne (0,1,3,4) relativi ai caratteri X ed Y calcolare: a) la frequenza marginale di riga e di colonna; b) la tabella delle frequenze teoriche; c) la tabella delle contingenze assolute e il chi- quadrato

29. Si è svolta un’analisi di Connessione tra il carattere (X) che assume le modalità 1,2 e 3 e il carattere (Y) che assume le modalità A, B e C. I dati rilevati di X sono: (1,1,3,2,3,2,1,3); quelli di (A,A,B,C,A,C,B,A) e si vuole: a)costruire la relativa matrice di dati; b)calcolare le frequenze congiunte assolute e teoriche; c) le contingenze assolute e il chi-quadrato

30. Nel calcolo combinatorio se si vogliono disporre tre oggetti a tre a tre con quali script si calcolano: a) disposizioni semplici senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione e combinazioni semplici senza ripetizione

32. Definire il concetto di probabilità: a) secondo l'approccio classico; b) secondo l'approccio frequentista; c) secondo l'approccio soggettivista ed assiomatico

Secondo l’approccio classico la probabilità si definisce come il rapporto fra il numero di casi favorevoli all’evento E e il numero totale di casi possibili purché egualmente probabili: P=EFAV/E 1 +E 2 +........+Ei dove EFAV è il numero di casi favorevoli all’evento E e la sommatoria di Ei è l’insieme degli eventi possibili equiprobabili. Secondo l’approccio frequentista definito anche come approccio o concezione statistica la probabilità è espressa in termini quantitativi da un valore empirico osservato: la frequenza relativa. Se si osserva un fenomeno attraverso un esperimento costituito da un certo numero di prove in condizioni costanti, si definisce frequenza relativa il rapporto fra il numero k, ovvero il numero delle volte nelle quali l’evento E si e verificato ed il numero totale n delle prove ovvero k/n. A questo concetto di misurazione statistica della probabilità si associa la cosiddetta ”legge empirica del caso”, attraverso la quale si constata che al crescere di n la frequenza relativa tende, ancorché oscillando, ad un valore stabile. Secondo l’approccio soggettivista la probabilità è la misura che il ricercatore assegna a priori ad un evento sulla base del suo grado di fiducia che lo stesso si verifichi. Secondo l’approccio assiomatico la definizione di probabilità presuppone il ricorso al concetto di funzione che associ ad ogni evento elementare dello spazio campionario Ω una probabilità P. A differenza della funzione classica nel caso della funzione di probabilità sull’asse reale vengono riportati gli insiemi o eventi elementari. Anche in questo caso la caratterizzazione della funzione avviene attraverso l’individuazione del dominio denotato con la lettera D (n.d.a), che coincide con il totale degli insiemi o eventi elementari dello spazio campionario Ω e della probabilità P. In simboli

i tre oggetti soprarichiamati {D, Ω, P} costituiscono il cosiddetto spazio di probabilità dove Ω ⊂ D

33. Dati i valori di P(E)=0,28, P(F)=0,32 e P(E|F)=0,18 calcolare; a) la probabilità unione P(EF) per eventi compatibili o congiunti; b) la probabilità intersezione P(E∩F) per eventi dipendenti e indipendenti; c) la probabilità unione P(EF) per eventi incompatibili o disgiunti