



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Elaborato superato con 2 punti
Tipologia: Prove d'esame
1 / 5
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Corso di Statistica per Economia e Impresa Classe di laurea L- 8 Si riporta l’osservazione dei tentativi di hackeraggio annuali su un campione di dieci pagine web, delle quali si conosce l’entità del traffico, espressa come numero di visitatori all’ora (in migliaia). I valori sono quelli riportati nella seguente tabella: tentativi di hackeraggio utenti ogni ora in migliaia 3 15 2 8 1 6 6 25 4 15 1 5 1 6 4 18 5 22 2 10 A partire da questi dati calcolare, su R: a) La media delle due variabili; b) La mediana delle due variabili; c) La varianza del numero di utenti orario; d) Il coefficiente di variazione dei tentativi di hackeraggio; e) La correlazione tra le due variabili; f) I coefficienti della regressione tra Tentativi di hackeraggio (Y) e Utenti orari (X); g) Esprimere un breve commento. Inviare l’elaborato in formato pdf, includendo le schermate principali dei calcoli su R.
Davide Masola Innanzitutto noto che sto lavorando con dei caratteri quantitativi discreti. Apro R e controllo quale sia la cartella di lavoro corrente: >getwd() Creo sul PC la cartella: C:\Users\ACER\Documents\ELABORATO DI STATISTICA e decido di spostare la directory di lavoro nella mia cartella: >setwd(“ELABORATO DI STATISTICA”) Creo un data-frame a partire da due vettori:
e) Calcolare la correlazione tra le due variabili Per calcolare la correlazione tra le due variabili uso il comando “cor()” e do un nome per comodità: >correlazioneXY ← cor(X,Y) Ottengo che la correlazione tra X e Y è 0. f) Calcolare I coefficienti della regressione tra Tentativi di Hackeraggio (Y) e Utenti Orari (X): Per calcolare I coefficienti della regressione devo prima stimare la retta di regressione con il comando: >RETTADIREGRESSIONE ← lm(Y~X) Ottengo: Quindi I coefficienti della regressione sono: -0.3357 e 0. A questo punto posso scrivere la retta di regressione: Y=0,25X-0,33 e rappresentare il grafico (utilizzo un grafico a dispersione avendo due variabili) con all’interno la retta di regressione, usando I comandi: **>plot(X,Y,main=”Grafico con retta di regressione”,xlab=”Utenti ogni ora in migliaia”,ylab=”Tentativi di hackeraggio”)
abline(RETTADIREGRESSIONE, col=”green”)**
g) Esprimere un breve commento: Noto che il coefficiente di regressione (coefficiente angolare), che è 0.2489, è positivo; quindi la retta sarà crescente. L’intercetta, che è -0.3357, ci dice che la retta interseca l’asse delle Y nel punto P(0, -0,3357). Inoltre, avendo il coefficiente di correlazione, posso calcolare l’indice di bontà di adattamento che risulta: 0,9732. Quindi la retta di regressione riesce a spiegare il 97.32% dei dati. Dalla retta di regressione potrò calcolare I valori teorici di Y in funzione di X. Inoltre può essere utilizzata anche per ricavare I dati non osservati, eseguendo un’analisi di interpolazione. SCHERMATE PRINCIPALI DEI CALCOLI SU R: