






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Lezione 1 del corso di statistica seguito per intero e superato al primo tentativo voto 28. Questa è solo la prima lezione ma ci sono anche le altre disponibili
Tipologia: Appunti
1 / 11
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Lezione 1 Negli ultimi decenni siamo nel big data e questi dati sono generati attraverso la produzione aziendale e il server li immagazzina e le aziende ha detto usiamo questi dati e quindi iniziano a chiamare gli statistici per utilizzare questi dati.la statistica analizza non solo il dato numerico, ma anche foto e frasi verbali.l’azienda vuole capire se il nuovo prodotto può piacere alla clientela e la statistica analizza i dati. L’obiettivo è riuscire a capire e leggere un grafico , un output perchè nel mondo del lavoro è sempre più richiesto e un report passa sotto i nostri occhi e va saputo scegliere e la statistica serve per prendere decisioni in condizione deve la info è parziale.partire dalla analisi dei dati per prendere una decisione e anche aziendali e anche politiche e della vita di tutti i giorni. La statistica serve per fare una fotografia di un certo fenomeno per capire qualcosa e la statistica è una macchina fotografica che fotografa un particolare fenomeno che vogliamo studiare. Anche in ambito finanziario per seguire l’andamento dei titoli quotati in borsa. Fare previsioni è un altro obiettivo della statistica e capire come è andato l’andamento del titolo e la statistica si basa un obiettivo vecchio per capire un futuro trend e quindi fare previsioni è un obiettivo della statistica. Ci permette anche di fare dei confronti territoriali e analizzare. Contano anche le parole nel corso di statistica e non solo i numeri. Sappiamo che il telescopio serve per capire cosa succede lontano da noi e la statistica è una sorta di lente di ingrandimento per capire le relazioni sociali e economiche nel mercato e della realtà complessa che stiamo viviendo. Siamo nell’era dei big data dagli anni 90 quando si è sviluppato il www e quindi c’è sempre più bisogno di persone che le sappiano analizzare e in 2 giorni riusciamo a creare una mole di dati che è pari a quella che è stata creata dagli inizi della umanità fino agli anni
Statistica che è una disciplina lontana nel tempo e aveva l’obiettivo al governatore di contare quanto fosse ricco un territorio cioè quanta merce c’era , quanti sudditi c’erano e serviva per contare e misurare la ricchezza dello stato. Il censimento è una attività della statistica cioè contare quante persone stanno in un territorio e anche nei secoli scorsi. La statistica non elimina il rischio ,ma impariamo a misurarlo il rischio. I sondaggi da aziende oppure nelle elezioni politiche e un campione rappresentativo delle elezioni e le proiezioni di tg sono calcoli statistici oppure l’azienda deve prestimare le vendite attese. Impariamo anche le basi del software statistico r/rstudio. Il corso ha 3 macroaree e le prime lezioni sono dedicate alla statistica descrittiva cioè univariata e
bivariata; poi cenni di probabilità e poi statistica inferenziale che permette di misurare l’errore e stimare il fenomeno che ci interessa. Prendere dalle slide Opzione 1) fare 2 parziali oppure generale con assignment che è un lavoro da fare a casa in gruppo con il massimo voto di 26 e si somma al punteggio della assignment e cioè risposta multipla sempre su teoria e esercizi e seconda parte esercizi teoria e esercizi da risolvere. L’assignment deve essere consegnato il 30 dicembre e si prepara da metà corso cioè dal 4 novembre. L’assignment vale massimo 4 punti e si sommano alla media delle prove parziali. Opzione 2 ) prova generale senza assignment con un punteggio max di 30. Sia per i parziali vanno fatti esercizi con r Opzione 3 ) percorso challenge—> a fine corso verso dicembre ci sono 8/10 ore di lab esperienzale e l’ob è capire l’importanza della statistica nel mondo reale e al campionamento. Per il percorso challenge l’esame prevede 2 prove parziali e L’assignment di r nelle stesse modalità standard con scadenza del 30 dic e + il laboratorio esperienzale con la verifica finale che il ricercatore dell’istat indicherà e la prima prova parziale challenge vale 26 e la seconda max 24 e si somma L’assignment e il punteggio del lab esperienzale che è un max di 2. 3 novembre e poi a gennaio. Terminologia e prime definizioni : Slide fornite su LIUC e corsi La statistica ha l’obiettivo ed è un insieme di metodi e tecniche che hanno la finalità di fotografare e cioè descrivere in maniera sintetica un fenomeno oggetto di studio per cercare di trovare un trend che a occhio nudo non risulta. La statistica studia un fenomeno collettivo e non individuale e quindi non è interessata al singolo individuo se sia disoccupato o no, ma di una collettività. Si lavora su una collettività che si chiama popolazione statistica e l’obiettivo è fare una foto per tirare fuori un trend che a occhio nudo non si coglie e la statistica raccogliendo dei dati che siano rappresentativi riusciamo a descrivere ciò che a occhio nudo non siamo in grado di cogliere. L’obiettivo della statistica è fare sintesi cioè lavoriamo su un collettivo , ma dobbiamo fare emergere in sintesi alcune caratteristiche salienti. Con la statistica ci basiamo con i dati che abbiamo e che magari riguardano solo una parte della popolazione che abbiamo in riferimento e dobbiamo degli strumenti che ci permettono di generalizzare anche per dati che non abbiamo e anche per fare delle previsioni nel futuro.
popolazione che non ho osservato? È un azzardo ed È un rischio e la freccia dal blu al verde è un rischio che corro e con la probabilità lo misuriamo per misurare il rischio perchè altrimenti non introdurremo nessun numero. Questa è la operazione della inferenza dai dati osservati a quelli non osservati. Prima di partire da qualsiasi indagine statistica devo capire quale è il fenomeno che voglio studiare e poi devo definire la popolazione statistica = insieme delle unità statistiche sui cui si verifica il fenomeno di interesse e possono essere persone o individui , ma non necessariamente. La popolazione statistica deve essere definita in uno spazio e quindi residenti in un comune, la pop della regione Lombardia e deve essere definita anche nel tempo. E deve essere definita nello spazio e nel tempo sia che sia popolazione fisica che non. La statistica studia fenomeni collettivi definiti su una popolazione statistica che possono essere persone fisiche o entità astratte definita nel tempo e nello spazio. Popolazione statistica e unità statistica = singola unità della popolazione statistica. Quando vogliamo studiare questo fenomeno sulla popolazione possiamo decidere di fare una valutazione completa (censimento ) oppure rilevazione parziale (campione). Pro e contro di rilevazione completa vs rilevazione parziale : -completa è più attendibile e quindi non avrò gli errori campionari -censimento richiede più tempo rispetto il campionamento -costi del censimento sono più elevati rispetto al campionamento. A seconda di quello che si vuole studiare si sceglie il campionamento o censimento e di solito si utilizza di più il campionamento perchè costa meno e richiede meno tempo. Dopo che avremo raccolto i dati del campione in modo che questo campione sia rappresentativo le intervistiamo e vogliamo ottenere delle info che si chiamano variabili che sono caratteristiche che vogliamo avere info che sono unità statistiche. Variabili cioè qualcosa che varia nel nostro campionamento. Es : popolazione statistica gli studenti della LIUC e qualcuno vuole fare una valutazione per vedere se si è soddisfatti del servizio e lo si fa secondo l’età e l’età è una variabile e si chiamano variabili perchè varia e cioè assume valori diversi nella popolazione di riferimento. Questa variabile può essere numerica o qualitativa. La variabile ha delle modalità con valori diversi in cui si osserva tra le nostre unità statistiche. Di variabili ne abbiamo di diversa natura e bisogna classificarle. 2 macro distinzioni:
-qualitativa o anche categorica —> è una variabile che manifesta delle modalità verbali es ) titolo di studio,essere maggiorenne e cioè devo avere come risposta SI o NO( SI CHIAMANO VARIABILI BINARIE). All’interno distinguiamo se la variabile ha un ordine assoluto che vale per tutti ( ordinale —
es : titolo di studio ); oppure no (nominale cioè senza ordine—> es: regione di residenza, colore degli occhi ) -quantitativa o numerica —> varietà numeriche e facciamo delle operazioni numeriche e quindi tutte le numerazioni matematiche e si distinguono in discrete ( assume in valori di numeri naturali e poi pochi valori naturali e che non siano negativi e sono pochi numeri naturali compreso lo zero perchè sono delle variabili di conteggio es: numero di figli in una famiglia, numero di esami superati); variabili continue (può avere valori non interi, oppure anche interi ma così numerosi che devo esprimere in classi ). Le variabili continue possono riguardare tutti i valori anche con la virgola oppure variabili che rappresentano numeri interi, ma sono così tante che devo rappresentare con una variabile continua. Le variabili continue misurano qlc es : il reddito che infatti lo misuro e non lo conto oppure il fatturato delle aziende. Grado di soddisfazione del cliente e le risposta sono molto soddisfatto o per niente soddisfatto ed è una variabile qualitativa ordinale e se questo grado di soddisfazione ha una scala da 1 a 10 ed è sempre qualitativa ordinale e quindi non è numerica. Sesso (maschio o femmina ) è una variabile nominale e anche se mettono maschio 0 e femmina 1 è sempre nominale. Tempo di attesa per il prox autobus è una variabile discreta se sono in centro a Milano se al max aspetto 10 min e se sono in montagna può diventare anche un po’ continua. 20 mercati rionali di una certa città e il numero di clienti I dati raccolti sono rappresentati in una matrice e questo è il punto di partenza della analisi statistica e ogni riga è una unità statistica e ogni colonna raccoglie le info. La popolazione statistica in questo esempio cioè i mercati e l’unità statistica è ogni singolo mercato e ogni riga si riferisce ad ogni mercato e la prima colonna è sempre l’identificativo e quindi non è una variabile di interesse e le altre sono variabili di interesse e il numero di clienti è una variabile quantitativa continua ; vendite in migliaia di euro variabile continua e area geografica qualitativa nominale. È importante quando partiamo da una matrice di dati capire la natura delle variabili.