



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Elaborato superato con 2 punti
Tipologia: Esercizi
1 / 6
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Corso di Statistica per Economia e Impresa Classe di laurea L- 8 Si riporta l’osservazione dei tentativi di hackeraggio annuali su un campione di dieci pagine web, delle quali si conosce l’entità del traffico, espressa come numero di visitatori all’ora (in migliaia). I valori sono quelli riportati nella seguente tabella: tentativi di hackeraggio utenti ogni ora in migliaia 3 15 2 8 1 6 6 25 4 15 1 5 1 6 4 18 5 22 2 10 A partire da questi dati calcolare, su R: a) La media delle due variabili; b) La mediana delle due variabili; c) La varianza del numero di utenti orario; d) Il coefficiente di variazione dei tentativi di hackeraggio; e) La correlazione tra le due variabili; f) I coefficienti della regressione tra Tentativi di hackeraggio (Y) e Utenti orari (X); g) Esprimere un breve commento.
Ho creato una tabella con i dati in Excel Ho esportato il File in formato CSV in “C:\Users\Mario\Desktop\Mercatorum\Statistica\Elaborato” In RStudio ho dato il comando per cambiare la cartella di salvataggio: >setwd(“C:/Users/Mario/Desktop/Mercatorum/Statistica/Elaborato” Ho importato il file precedentemente creato in una variabile denomiata dati con il comando: >dati<-read.csv(file= "C:/Users/Mario/Desktop/Mercatorum/Statistica/Elaborato/web. csv", header = TRUE, sep = ";", dec = ".") Ho creato un vettore denominato utenti a cui ho assegnato l’intestazione della colonna del file con il comando: >utenti<-dati$Utenti Ne visualizzo il grafico con il comando: >barplot(utenti) Stessa cosa per tentativi: **>tentativi<-dati$Tentativi
barplot(tentativi) Tentativi di hackeraggio Utenti ogni ora (in migliaia)**
Punto c) La varianza del numero di utenti orario: Calcolo la varianza del numero di utenti e la assegno a “varianza_utenti” con il comando: >varianza_utenti<-mean((utenti-mean(utenti))^2) La varianza degli utenti è 45, Punto d) Il coefficiente di variazione dei tentativi di hackeraggio: Per calcolare il coefficiente di variazione dei tentativi, calcolo prima la varianza dei tentativi e la assegno a “varianza_tentativi” con il comando: >varianza_tentativi-<mean((tentativi-mean(tentativi))^2) La varianza dei tentativi è 2, Poi calcolo la deviazione standard e la assegno a “dev_st_tentativi” con il comando: >dev_st_tentativi<-sqrt(varianza_tentativi) La deviazione standard dei tentativi è 1, Ed infine calcolo il coefficiente di variazione e lo assegno a “coeff_var_tentativi” con il comando: >coeff_var_tentativi<-dev_st_tentativi/media_tentativi Il coefficiente di variazione dei tentativi è 0, 586206896551724 Punto e) La correlazione tra le due varibili: Calcolo la correlazione tra le due variabili e la assegno a “rho” con il comando: >rho<-cor(utenti,tentativi) L’indice di correlazione tra le due variabili è pari a 0, *per usare il comando cor() bisogna caricare il pacchetto ineq dalla libreria
Punto f) I coefficienti di regressione tra i tentativi di hackeraggio e utenti orari: Dichiaro una variabile per creare il modello di regressione con il comando: >modello<-lm(utenti~tentativi) Poi uso la funzione summary per mostrarlo: Per la rappresentazione grafica usiamo il grafico a dispersione avendo due variabili: >plot(utenti, tentativi, axes=TRUE)