Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


PANIERE DI STATISTICA UNIMERCATORUM, Panieri di Statistica

PANIERE DI STATISTICA UNIMERCATORUM

Tipologia: Panieri

2022/2023

Caricato il 28/03/2023

Gian3194
Gian3194 🇮🇹

3.5

(2)

2 documenti

1 / 95

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Affinchè ci sia dipendenza perfetta, la tabella deve essere
Quadrata
Ai fini dell'applicazione della binomiale, le prove devono essere
Indipendenti
Ai fini dell'applicazione della binomiale, le prove devono essere
Ripetute
All'aumentare della variabilità, la curva Normale si
Abbassa
All'aumentare di n l'ampiezza dell'intervallo
All'interno delle aziende la trend analysis possono essere utilizzata per analizzare - fra le altre cose - le
Le vendite ed il successo di un prodotto
Amazon utilizza i Big Data per
Individuare nicchie di mercato
Calcolare il coefficiente binomiale con n=3 e k=2
3
Calcolare il coefficiente binomiale con n=5 e k=2
10
Calcolare il coefficiente binomiale con n=7 e k=4
35
Come posso ridurre l'ampiezza dell'intervallo, e quindi dell'errore
Aumentando la numerosità campionaria
Con N3 si indica
La frequenza cumulata semplice della terza modalità
Con Xi si indica
La i-esima modalità
Con X~ N(3, 2) si indica una media con
Media = 3 e sqm= 2
La sommatoria
Con il termine "coefficiente di regressione" si intende
Il coefficiente angolare della retta di regressione
Con l'errore di primo tipo si intende
Rifiutare l'ipotesi nulla quando questa è vera
Con la probabilità p si indica
La probabilità del successo
Con le frequenze cumulate possiamo determinare
Quanti hanno al massimo una data modalità
CON N SI INDICA La frequenza cumulata semplice della terza modalità
Con ni si indica
La i-esima frequenza
Con nij si indica
La frequenza assoluta doppia
CON XN(3, 2) SI INDICA UNA MEDIA CON Media = 3 e sqm= 2
Dato sigma=6, n=50 e una media campionaria pari a 20, quale è l'intervallo ad un livello di significatività del 95%
18,34; 21,66
Determinare la numerosità del campione, nel caso si voglia stimare la proporzione, con un errore massimo di 0.1 ad un
livello di confidenza del 95% 97
Determinare z (nella stima per intervallo) corrispondente ad un livello di confidenza dell' 89%
1.60
Due distribuzioni Normali con stessa varianza e diversa media
Sono identiche per traslazione
E' POSSIBILE AVERE UN COEFFICIENTE DI CORRELAZIONE NEGATIVO E UN R2 POSITIVO?
Si
E' possibile passare da una variabile X ad una standardizzata Z
Sempre
Esistono tante distribuzioni condizionate della X
Quante sono le modalità della Y
Figura che permette di elaborare e migliorare lo sfruttamento dei Big Data
Data scientist
Gli impegati nel settore ICT nelle imprese sono
In crescita
Gli indici di variabilità si calcolano su caratteri
Quantitativi
Gli outlier sono
Dati anomali
Gli strumenti di analisi statistica per i Big Data divengono sempre
Più articolati
Google Analytics permette all'azienda di monitorare
La performance web
Google Analytics permette di
Integrarsi con altri applicativi
Google Analytics è il servizio di analytics
Più usato nel web
Google Analytics è uno strumento
Di web analytics
Google Analytics è uno strumeto molto usato
Nel marketing
Google Trends è uno strumento
Gratuito
Google Trends è uno strumento che permette con facilità di
Scaricare dati su trend
Guardando un grafico a torta, la moda corrisponde a
La sezione più grande
Hadoop è stato sviluppato principalmente da
Yahoo
I Big Data permettono di ricavare
un ingente mole di informazioni
I Big Data rispetto alle fonti convenzionali presentano
alcune criticità
I Big Data sono dati generati
Da uso di strumenti digitali
I Big Data sono stati utilizzati proficuamente nel settore
Della vendita retail
I Big Data, data la loro mole richiedono
Maggiori capacità di memorizzazione
I Big data mettono a disposizione una grande quantità
Di microdati
I Decili dividono la distribuzione in
10 parti
I DOCUMENTI DI NATURA POLITICA
Sono prodotti da enti appartenenti al Sistan
I Quantili sono
Dipende da quanto si è fissato k
I Quartili sono
4
I caratteri qualitativi si distinguono in
Sconnessi e ordinabili
I caratteri quantitativi si distinguono in
Discreti e continui
I consumi finali delle famiglie
Comprendono alcune spese per investimento
I dati di Google trends possono essere estratti
Per diversi domini geografici
I dati primari
Le opinioni raccolte dall'azienda su un campione di clienti
I dati secondari
Rappresentano una fonte di dati
I microdati sono collezioni di
dati elementari
I minimi quadrati vengono usati per specificare
La migliore retta di regressione
I pacchetti di R sono
Insiemi di comandi specifici su un tema
I primi problemi di privacy sono emersi
Negli USA
I punti di flesso della curva Normale si trovano in corrispondenza di
I quantili e i quartili possono calcolarsi per
Caratteri almeno ordinabili
I residui si devono distribuire rispetto alle X
In modo casuale
I risultati delle prove devono essere
Indipendenti
I test statistici sono una delle tecniche
Dell'inferenza statistica
I valori standardizzati
Non hanno unità di misura
I valori standardizzati sono
Con media nulla
Il Box-plot è
Un grafico sulla variabilità
Il Censimento dell'Industria e dei Servizi
E' l'unica indagine che consente analisi fino a livello comunale
Il Programma Statistico Nazionale
Ha durata periodica
Il Sistan
Il baricentro è il punto di coordinate
Media di X e media di Y
Il calcolo della media di una variabile continua avviene tramite
Integrale
Il calcolo delle probabilità di variabili casuali continue si basa
Sugli integrali
Il campione (X1,...,Xn) viene considerato come una
Variabile casuale multipla
Il campione è definito come
Un sottoinsieme della popolazione
Il carattere "Comune di nascita" è
Qualitativo sconnesso
Il carattere "Numero di figli per coppia" è
Quantitativo discreto
Il carattere "Reddito mensile" è
Quantitativo continuo
Il carattere "Squadra di calcio per cui si tifa" è
Qualitativo sconnesso
Il coefficiente R2 è un indice di
Bontà di adattamento
Il coefficiente binomiale esprime
Le combinazioni possibili
Il coefficiente di correlazione assume valori compresi tra
Meno uno e più uno
Il coefficiente di correlazione ha a numeratore
La covarianza
Il coefficiente di determinazione varia tra
Zero e uno
Il coefficiente di variazione è dato da
Sqm diviso la media
Il comando library(nomepacchetto) serve a
Attivare il pacchetto su R
Il comando ls( ) permette di
Visualizzare gli oggetti memorizzati
Il comando rbind(x,y)
Unisce due vettori x e y per riga
Il comando table(x) mi fornisce
La tabella di frequenze assolute
Il costo di produzione di Big Data
È generalmente contenuto
Il data scientist ha competenze
Trasversali
Il data-frame è dato da
Matrici in cui le colonne possono essere di natura differente
Il dato statistico
E' la materia prima da cui è ottenuta l'informazione statistica che si riferisce alla collettività
Il fenomeno statistico è
La variabile di interesse
Il grafico a barre é per caratteri
Quantitativi discreti
Il grafico a dispersione è
Una rappresentazione grafica di due caratteri quantitativi
Il grafico a torta è adatto ai
Caratteri qualitativi sconnessi
Il mercato dei Big Data è
in crescita
Il metadato
E' un'informazione che consente di interpretare correttamente un insieme di dati
Il modello di regressione lineare individua relazioni tra una variabile di risposta ed un set di
Covariate
Il primo decile lascia alla sua destra il
90%
Il primo quartile lascia alla sua sinistra il
25%
IL PROCESSO DI CREAZIONE DI BIG DATA È CARATTERIZZATO DA
elevata complessità
Il processo di creazione di dati è caratterizzato da
elevata complessità
Il punto di partenza dei test statistici è la definizione della
Ipotesi nulla
Il rango è dato da
Valore massimo - valore minimo
IL RAPPORTO UNIONCAMERE Osserva l' evoluzione dei fenomeni attraverso lo studio delle economie territoriali composte prevalenetemente da piccole e piccolissime imprese
Il requisito della comparabilità si utilizza
Quando si confrontano statistiche corrispondenti nello spazio
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f

Anteprima parziale del testo

Scarica PANIERE DI STATISTICA UNIMERCATORUM e più Panieri in PDF di Statistica solo su Docsity!

Affinchè ci sia dipendenza perfetta, la tabella deve essere Ai fini dell'applicazione della binomiale, le prove devono essere QuadrataIndipendenti Ai fini dell'applicazione della binomiale, le prove devono essere All'aumentare della variabilità, la curva Normale si RipetuteAbbassa All'aumentare di n l'ampiezza dell'intervallo All'interno delle aziende la trend analysis possono essere utilizzata per analizzare - fra le altre cose - le DiminuisceLe vendite ed il successo di un prodotto Amazon utilizza i Big Data per Calcolare il coefficiente binomiale con n=3 e k=2 Individuare nicchie di mercato 3 Calcolare il coefficiente binomiale con n=5 e k=2 Calcolare il coefficiente binomiale con n=7 e k=4 (^1035) Come posso ridurre l'ampiezza dell'intervallo, e quindi dell'errore Aumentando la numerosità campionaria Con N3 si indica Con Xi si indica La frequenza cumulata semplice della terza modalitàLa i-esima modalità Con X~ N(3, 2) si indica una media con Media = 3 e sqm= 2 La sommatoria Con il termine "coefficiente di regressione" si intende Con l'errore di primo tipo si intende Il coefficiente angolare della retta di regressioneRifiutare l'ipotesi nulla quando questa è vera Con la probabilità p si indica Con le frequenze cumulate possiamo determinare La probabilità del successoQuanti hanno al massimo una data modalità CON N SI INDICA Con ni si indica La frequenza cumulata semplice della terza modalitàLa i-esima frequenza Con nij si indica La frequenza assoluta doppia CON XN(3, 2) SI INDICA UNA MEDIA CON Media = 3 e sqm= 2 Dato sigma=6, n=50 e una media campionaria pari a 20, quale è l'intervallo ad un livello di significatività del 95% Determinare la numerosità del campione, nel caso si voglia stimare la proporzione, con un errore massimo di 0.1 ad un 18,34; 21, livello di confidenza del 95% Determinare z (nella stima per intervallo) corrispondente ad un livello di confidenza dell' 89% (^97) 1. Due distribuzioni Normali con stessa varianza e diversa media E' POSSIBILE AVERE UN COEFFICIENTE DI CORRELAZIONE NEGATIVO E UN R2 POSITIVO? Sono identiche per traslazioneSi E' possibile passare da una variabile X ad una standardizzata Z Esistono tante distribuzioni condizionate della X SempreQuante sono le modalità della Y Figura che permette di elaborare e migliorare lo sfruttamento dei Big Data Gli impegati nel settore ICT nelle imprese sono Data scientistIn crescita Gli indici di variabilità si calcolano su caratteri Gli outlier sono QuantitativiDati anomali Gli strumenti di analisi statistica per i Big Data divengono sempre Google Analytics permette all'azienda di monitorare Più articolatiLa performance web Google Analytics permette di Google Analytics è il servizio di analytics Integrarsi con altri applicativiPiù usato nel web Google Analytics è uno strumento Google Analytics è uno strumeto molto usato Di web analyticsNel marketing Google Trends è uno strumento Google Trends è uno strumento che permette con facilità di GratuitoScaricare dati su trend Guardando un grafico a torta, la moda corrisponde a Hadoop è stato sviluppato principalmente da La sezione più grandeYahoo I Big Data permettono di ricavare I Big Data rispetto alle fonti convenzionali presentano un ingente mole di informazionialcune criticità I Big Data sono dati generati I Big Data sono stati utilizzati proficuamente nel settore Da uso di strumenti digitaliDella vendita retail I Big Data, data la loro mole richiedono I Big data mettono a disposizione una grande quantità Maggiori capacità di memorizzazioneDi microdati I Decili dividono la distribuzione in I DOCUMENTI DI NATURA POLITICA 10 partiSono prodotti da enti appartenenti al Sistan I Quantili sono I Quartili sono Dipende da quanto si è fissato k 4 I caratteri qualitativi si distinguono in I caratteri quantitativi si distinguono in Sconnessi e ordinabiliDiscreti e continui I consumi finali delle famiglie I dati di Google trends possono essere estratti Comprendono alcune spese per investimentoPer diversi domini geografici I dati primari I dati secondari Le opinioni raccolte dall'azienda su un campione di clientiRappresentano una fonte di dati I microdati sono collezioni di dati elementari I minimi quadrati vengono usati per specificare I pacchetti di R sono La migliore retta di regressioneInsiemi di comandi specifici su un tema I primi problemi di privacy sono emersi I punti di flesso della curva Normale si trovano in corrispondenza di Negli USA I quantili e i quartili possono calcolarsi per I residui si devono distribuire rispetto alle X Caratteri almeno ordinabiliIn modo casuale I risultati delle prove devono essere I test statistici sono una delle tecniche IndipendentiDell'inferenza statistica I valori standardizzati I valori standardizzati sono Non hanno unità di misuraCon media nulla Il Box-plot è Il Censimento dell'Industria e dei Servizi Un grafico sulla variabilitàE' l'unica indagine che consente analisi fino a livello comunale Il Programma Statistico Nazionale Il Sistan Ha durata periodica Il baricentro è il punto di coordinate Il calcolo della media di una variabile continua avviene tramite Media di X e media di YIntegrale Il calcolo delle probabilità di variabili casuali continue si basa Il campione (X1,...,Xn) viene considerato come una Sugli integraliVariabile casuale multipla Il campione è definito come Il carattere "Comune di nascita" è Un sottoinsieme della popolazioneQualitativo sconnesso Il carattere "Numero di figli per coppia" è Il carattere "Reddito mensile" è Quantitativo discretoQuantitativo continuo Il carattere "Squadra di calcio per cui si tifa" è Il coefficiente R2 è un indice di Qualitativo sconnessoBontà di adattamento Il coefficiente binomiale esprime Le combinazioni possibili Il coefficiente di correlazione assume valori compresi tra Il coefficiente di correlazione ha a numeratore Meno uno e più unoLa covarianza Il coefficiente di determinazione varia tra Il coefficiente di variazione è dato da Zero e unoSqm diviso la media Il comando library(nomepacchetto) serve a Il comando ls( ) permette di Attivare il pacchetto su RVisualizzare gli oggetti memorizzati Il comando rbind(x,y) Il comando table(x) mi fornisce Unisce due vettori x e y per rigaLa tabella di frequenze assolute Il costo di produzione di Big Data Il data scientist ha competenze È generalmente contenutoTrasversali Il data-frame è dato da Il dato statistico Matrici in cui le colonne possono essere di natura differenteE' la materia prima da cui è ottenuta l'informazione statistica che si riferisce alla collettività Il fenomeno statistico è Il grafico a barre é per caratteri La variabile di interesseQuantitativi discreti Il grafico a dispersione è Il grafico a torta è adatto ai Una rappresentazione grafica di due caratteri quantitativiCaratteri qualitativi sconnessi Il mercato dei Big Data è Il metadato in crescitaE' un'informazione che consente di interpretare correttamente un insieme di dati Il modello di regressione lineare individua relazioni tra una variabile di risposta ed un set di Il primo decile lascia alla sua destra il Covariate90% Il primo quartile lascia alla sua sinistra il IL PROCESSO DI CREAZIONE DI BIG DATA È CARATTERIZZATO DA 25%elevata complessità Il processo di creazione di dati è caratterizzato da Il punto di partenza dei test statistici è la definizione della elevata complessitàIpotesi nulla Il rango è dato da Valore massimo - valore minimo IL RAPPORTO UNIONCAMERE Osserva l' evoluzione dei fenomeni attraverso lo studio delle economie territoriali composte prevalenetemente da piccole e piccolissime imprese Il requisito della comparabilità si utilizza Quando si confrontano statistiche corrispondenti nello spazio

Il secondo quartile corrisponde a Il settore Ateco è La MedianaUn esempio di metadato Il simobolo nel prompt > sta ad indicare Il terzo quartile lascia a destra il Che il sistema è pronto per ricevere l'istruzione25% delle osservazioni Il totale delle frequenze percentuali cumulate è Il totale delle frequenze percentuali è Non ha senso calcolarloCento Il totale delle frequenze relative è Il totale delle frequenze è uguale al UnoTotale delle osservazioni Il valore atteso corrisponde Il valore di z che corrisponde ad una probabilità 0.5 è Alla media 0 Il valore di z che corrisponde ad una probabilità 0.8 è 0. Il valore osservato Y può essere scomposto in In Italia utilizzano i Big Data principalmente Y teorico più un residuo eLe grandi imprese In R i vettori sono espressi come In un'analisi sulle PMI innovative, la spesa per Ricerca e Sviluppo dell'azienda è Vettore colonnaUna variabile di interesse In una distribuzione con 50 osservazioni, se n1.=10 e n.1= 10, in caso di indipendneza deve aversi In una distribuzione di probabilità si può calcolare n11=2La media e la varianza In una distribuzione ho calcolato una media = 3 e un sigma = 2. Il valore standardizzato di 1 è In una tabella doppia è possibile ricavarsi - 1Due distribuzioni marginali In una tabella doppia, table[ ,1] fornisce In una tabella doppia, table[1 , ] fornisce La tabella di Y condizionatada X1La tabella di X condizionata a Y Indicare se è possibile avere un coefficiente di correlazione negativo e un R2 positivo L'Archivio statistico delle imprese attive (Asia) SiComprende qualsiasi classe dimensionale delle imprese L'Archivio statistico delle imprese attive (Asia) L'Archivio statistico delle imprese attive (Asia) per le unità locali Consente di costruire gli indicatori di demografia delle impreseAnalizza le caratteristiche strutturali del sistema produttivo tra due censimenti L'aggregato spesa delle famiglie L'altezza della barra del grafico a barre deve Comprende la produzione per uso proprioEssere proporzionali alle frequenze osservate L'ampiezza dell'intervallo è dato L'area del rettangolo è dato da Dalla differenza degli estremi dell'intervalloAmpiezza della classe x densità L'ATLANTE STATISTICO DEI COMUNI L'attendibilità delle stime soffre di molteplici errori derivanti da Contiene informazioni di natura sociale ed economicaErrori di precisione nelle indagini campionarie L'errore campionario L'errore di secondo tipo consiste in Si commette in base al tipo di campionamento che si è costruitoAccettare l'ipotesi nulla quando questa è falsa L'estrazione di informazioni (prezzi) da internet mediante un processo informatico L'indagine Istat sul consumo delle famiglie Web scrapingE' utile alle imprese per adeguare l'offerta ai mutamenti nel comportamento di spesa dei consumatori L'indagine PMI L'indice del chi2 può essere negativo nel caso in cui Consente di comparare il risultato economico della propria impresa con quello conseguito dalle imprese simili per caratteristiche strutturaliMai L'indice del chi2 è uguale a zero se L'indice del chi2 è un indice di indipendenza Se tutte le frequenze osservate sono uguali a quelle teoricheAssoluto L'indice di Cramer varia tra L'indice di Cramer è un indice di indipendenza Zero e unoRelativo L'inferenza si interessa a estendere L'informazione campionaria alla popolazione L'inferenza statistica è una procedura analitica che L'insieme di tecniche che permettono al computer di apprendere senza essere esplicitamente e appositamente Permette di passare dal particolare al generale programmati Machine learning L'insieme di tecniche volte alla estrazione di dati e informazini da grandi database L'integrale della funzione di densità della variabile casuale continua è Data miningUno L'intercetta della retta esprime L'intervallo di confidenza ha un livello di garanzia La parte di Y indipendente da X1-alpha L'ipotesi alternativa corrisponde a L'istogramma dei residui deve avere una forma L'ipotesi che quella nulla non sia verificataCampanulare L'ultima classe di un carattere quantitativo continuo è L'unità locale di un'impresa Una classe aperta o chiusaE' assegnata al territorio in cui si trova, indipendentemente dalla residenza dell'impresa cui appartiene La Business Analytics La Business Analytics si occupa di Attraversa diverse funzioni aziendaliAnalisi strategiche La Media campionaria è La Mediana può calcollarsi per caratteri Una variabile casualeAlmeno qualitativi ordinabili La Pr(Z< 0) è uguale a La Pr(Z<-0.34) è uguale a 0,50. La Pr(Z<0.34) è uguale a La Pr(Z<0.65) è uguale a 0.633070, La Pr(Z>-0.34) è uguale a La Pr(Z>0.34) è uguale a 0.633070. La Statistica si divide in La binomiale si basa su un esperimento Statistica descrittiva e inferenzaDicotomico La business analytics può essere alla base della strategia di La capacità informativa della Mediana è DifferenziazioneSuperiore alla Moda La correlazione tra x e y si calcola con La covarianza può assumere valori cor(x,y)Sia negativi che positivi La covarianza può calcolarsi per Caratteri X e Y entrambi quantitativi La covarianza è un indice La curva Normale è particolarmente importante nelle applicazioni della statistica perchè AssolutoMolti fenomeni si distribuiscono approssimativamente ad una normale La curva normale è La densità di frequenza può calcolarsi Una variabile casuale continuaPer qualsiasi frequenza, purché non cumulata La densità di frequenza si calcola come rapporto tra La differenza interquartilica è Frequenza e ampiezza della classeTerzo quartile - primo quartile La differenza interquartilica è Sempre non negativa La difficoltà nel definire la qualità dei dati statistici è La distribuzione binomiale è Agganciata ai processi produttivi posti in essere dalle fonti ufficiali di informazione statistica, ovvero i dati devono soddisfare determinate caratteristiche e requisitiUna variabile casuale disceta La distribuzione condizionata X/Y ci esprime come La distribuzione marginale si riferisce a Si distribuisce la X per un dato valore della YSolo una variabile (X o Y) La distribuzione viene divisa dalla Mediana lasciando La fonte dei dati interni all'azienda Metà delle osservazioni prima della Mediana e metà dopoIndica il soggetto produttore dei dati La fonte dei dati per un'azienda può essere sia interna che esterna La frequenza congiunta si riferisce La sua indicazione è un metadatoAd una coppia di modalità X,Y La funzione Normale è definita per valori di X compresi tra La funzione di densità Normale ha un andamento Meno infinito e più infinitoCampanulare La funzione è La media aritmetica può calcolarsi per Un insieme di comandi elementariCaratteri quantitativi La media aritmetica è una media Analitica La media è espressa attraverso La mediana è quel valore che occupa all'interno della distribuzione, la posizione Un solo valoreCentrale La moda si può calcolare La moda è definita come quella modalità che presenta Per qualsiasi carattereMassima frequenza La moda è una media La normale standardizzata ha andamento Di posizioneCampanulare La popolazione statistica è formata da La posizione della Mediana deve essere Individui intesi come unità di osservazioneUn numero intero La presenza di dati anomali La probabilità è un valore Può alterare il risultato del coefficiente di correlazioneCompreso tra zero e cento La procedura dei test in generale è LA PUBBLICAZIONE CON MAGGIOR DETTAGLIO SETTORIALE E TERRITORIALE È Definizione ipotesi, individuazione statistica-test, decisione accettazioneIl Censimento La puntualità è un concetto legato alla La qualità dei Big Data è molto influenzata dalle TempestivitàTecnologie utilizzate La qualità della produzione statistica richiede LA RELAZIONE DEL GOVERNATORE DELLA BANCA D'ITALIA Di saper trasformare bene un dato statstico in conoscenzaE' tra le pubblicazioni più diffuse a livello nazionale anche se non prodotta da un membro del Sistan La relazione tra X e Y può essere in generale espressa La reperibilità di Big Data è stata facilitata Da una qualsiasi funzione fDall'innovazione tecnologica La retta dei minimi quadrati è quella retta che La sede legale di un'impresa Più si avvicina ai punti osservatiCoincide con la sua unità locale sole se l'impresa è unilocalizzata La somma degli scarti dalla media è La somma delle frequenze relative congiunte è Nulla 1 La somma delle probabilità della variabile casuale discreta è La standardizzazione è UnoUna trasformazione lineare dei dati La statistica descrittiva si occupa di Descrivere e sintetizzare le informazioni raccolte

Se R2=0.85 posso dire che Se X = N(1,2), allora Pr(0 < X < 5) è uguale a La retta spiega molto bene i puntiPr(-0.5 < Z < 2) Se X ha media = 3 e sigma = 2, allora il valore standardizzato di x=1 è Se X è indipendente da Y, allora -1Anche Y sarà indipendente da X Se Y spiegato da una parabola, allora il coefficiente di correlazione è Se al crescere di X, Y diminuisce diremo che i due caratteri sono 0 Discordanti Se al diminuire di X, Y diminuisce diremo che i due caratteri sono Se definisce esperimento casuale ConcordantiUn eseprimento condotto in situazioni di incertezza Se devo confrontare la variabilità di due distribuzioni uso Se devo importare un file in formato csv il comando è Il coefficiente di variazioneread.csv Se dopo aver inviato il comando appare il simbolo +, significa Che il comando è incompleto Se due distribuzioni hanno stessa media e mediana, allora hanno Se due modalità presentano uguale massima frequenza diremo che Non si può dire nulla a priori sulla variabilitàLa distribuzione è bimodale Se ho R2= 0.75 allora posso dire che Se ho calcolato sui dati una varianza pari a 5 e poi moltiplico tutti i valori originari di 2, la nuova varianza sarà La retta non spiega il 25% 20 Se ho osservato i seguenti valori 3, 0, 1, 2, 5, la differenza interquartilica è Se ho osservato i seguenti valori 3, 0, 1, 5, 4, il rango è 3 - 1 = 25 - 0 = 5 Se ho osservato i seguenti valori 3, 3, 3, 3 la variabilità è Se ho osservato i valori 0, 5, 2, la mediana è Nulla 2 Se ho osservato i voti degli esami su un gruppo di 7 femmine ed è pari a 25 e su un gruppo di 5 maschi che è 23, la media totale sarà 24, Se ho osservazioni negative, il rango sarà Se ho rilevato il carattere "Comune di residenza", la mediana Sempre positivoNon si può calcolare Se ho un R= 0.15, posso dire che Se ho un R2 = 0.15, posso dire che Non esiste dipendenza tra la Y e la X Se ho un coefficiente di correlazione pari a -0.5, allora Non esiste dipendenza tra la Y e la XR2= 0. Se ho una retta di regressione Y=2+1.5X allora posso dire che Se ho una retta di regressione Y=2+1.5X allora posso dire che All'aumentare di una unità di X, Y aumenta di 1.5Il coefficiente di correlazione è positivo Se ho una retta di regressione Y=2+1.5*X allora posso dire che quando X è 2, il valore teorico di Y sarà Se i miei punti hanno un andamento perfettamente parabolico, R2 sarà 5 Zero Se i residui crescono al variare di X, allora Se il carattere è costante, la varianza è La retta non è buonaNulla Se il carattere è per classi Se il coefficiente di correlazione è nulla, allora Si deve applicare una formula particolare per trovare il valore all'interno della classeNon esiste legame lineare tra le variabili Se il coefficiente di correlazione è nullo Se il fenomeno rilevato assume valori negativi, la varianza Sono incorrelateE' comunque positiva Se in corrispondenza della classe 5-8 si ha una frequenza pari a 6, la densità sarà Se in una distribuzione si sono osservati i valori estremi 3 e 20, la media 2 Sarà compresa tra questi valori Se l'indice di Cramer = 0, significa che si ha Se l'indice di Cramer = 1, significa che si ha IndipendenzaMassima dipendenza Se la covarianza è nulla, allora X e Y sono Se la distribuzione A ha sigma = 3 e la distribuzione B un sigma = 7, allora IncorrelatiNon posso saperlo, se non conosco le medie Se la modalità del carattere osservato è espressa con un numero abbiamo Un carattere quantitativo Se la modalità del carattere osservato è espresso con un attributo abbiamo Se la popolazione di partenza è Normale, allora la Media campionaria si distribuisce Un carattere qualitativoNormalmente Se la retta di regressione è una retta parallela all'asse delle X, allora Se la retta di regressione è una retta parallela all'asse delle Y, allora R2=0R2= Se la retta passa perfettamente per i punti osservati, R2 sarà pari a Se la varianza della popolazione è 10 e si fa un campione con n=100, la varianza della Media campionarie è Uno0, Se la varianza di Y è uguale alla varianza residua, R2 sarà uguale a Zero Se la varianza è calcolata su dati campionari, la formula Se le condizionate sono uguali, allora Cambia il denominatoreSono uguali anche alla marginale Se lo sqm della popolazione è 4 e il campione è di n=64, quanto è lo sqm della media campionaria Se n è dispari, la posizione occupata dalla Mediana sarà 0.5(n+1)/ Se n è pari, lesistono due posizione centrali Se n=3 e k=1, il coefficiente binomiale è n/2 e n/2)+1Tre Se n=3=k, il coefficiente binomiale è Se n=5 e p= 0.2, allora il valore atteso è Uno 1 Se n=5 e p= 0.2, allora la varianza è Se n=5 e p=0.5, quanto è la probabilità di avere 0 successi 0.80. Se n=5 e p=0.5, quanto è la probabilità di avere 5 successi Se n=e p=0.5, quanto è la probabilità di avere 2 successi 0.0310. Se non conosciamo la distribuzione della popolazione, la distribuzione della Media campionaria è Se non conosco il sigma della popolazione, lo sostituisco con E' Normale per n elevato in base al teorema del limite centraleLa sua stima corretta sc Se non è nota la varianza della popolazione la statistica-test da usare per la verifica delle ipotesi sulla media è Se r=-0.95, allora Se si estrae un campione da una popolazione con media pari a 4, la Media campionaria ha media pari a X e Y sono fortemente legate linearmente 4 Se si vuole commettere un errore massimo pari a 2, con un sigma = 4, ad un livello di confidenza del 95, la numerosità campionaria sarà 16 Se si vuole un intervallo di confidenza con una garanzia del 100%, questo è dato da Se si è in presenza di una relazione lineare inversa, il coefficiente di correlazione è -infinito; + infinitoNegativo Se sigma è ignoto devo usare le tavole Se su due distribuzioni ho la stessa media, allora queste avranno variabilità T-StudentNon necessariamente uguale Se su otto PC osservati in un ufficio, tre risultano difettosi, tre corrisponde a La frequenza semplice della modalità difettosi, del carattere "Funzionamento PC" Se su una distribuzione ho calcolato una media pari a 5 e moltiplico tutti i valori osservati per 3, la nuova media sarà pari a 15 Se su una distribuzione ho calcolato una media pari a 7 e aumento di 2 tutti i valori osservati, la nuova media sarà pari a 9 Se su una distribuzione ho calcolato una media pari a e divido tutti i valori osservati per 2, la nuova media sarà pari a 5 Se su una distribuzione ho calcolato una media pari a e sottraggo a tutti i valori osservati 2, la nuova media sarà pari a Se tutte le distribuzioni condizionate sono uguali tra loro allora c'è 6 Indipendenza Se tutti i valori sono aumentati di una costante a, la varianza Se una distribuzione presenta elevata variabilità, lo sqm è pari Rimane ugualeDipende dai dati Se voglio stimare la retta di regressione di Y rispetto a X, devo scrivere lm(y~x) SE X = N(1,2), ALLORA È UGUALE A SE Y È SPIEGATO DA UNA PARABOLA, ALLORA IL COEFFICIENTE DI CORRELAZIONE È Si sta studiato un fenomeno dicotomico su un campione di n=40 unità e una frequenza relativa pari 0.30. Quanto è 0 l'intervallo di confidenza di p ad un livello del 95% Sia X una normale con media = 3 e sigma = 2, il suo terzo quartile è 0,16; 0,444. Sistemi di raccolta e lettura di dati che permettono agli agenti che operano in un business di ottenere dati immediati Software tipicamente utilizzato dalla Business Analytics Real time analyticsPentaho Sono definite Medie di Posizione, quelle medie che si riferiscono Strumento che permette di raffigurare in maniera integrata e rapida i dati aziendali Alla particolare posizione occupata da una osservazioneDashboard Strumento gratuito che permette di trovare la frequenza di un'espressione o parola sul web Strumento intuitivo che facilita la fruibilità reportistica Google TrendsGrafici Su una distribuzion ho calcolato la varianza ed è pari a 3. Aumento tutti i valori di due. La nuova varianza è Sul carattere "Livello di reddito" si possono calcolare 3 Tutti i quantili, per k qualsiasi Sul sito di R, CRAN sta per Sull'asse delle ascisse nel grafico a barre sono riportate Comprehensive R Archive NetworkLe modalità del carattere Sulle modalità di un carattere qualitativo sconnesso si possono fare solo operazioni di Sulle modalità di un carattere quantitativo discreto si possono fare solo operazionini di Uguaglianza e disuguaglianzaTutte Tra gli obiettivi della Statistica ritroviamo Tra gli svantaggi ad analizzare direttamente l'intera popolazione abbiamo Validare un modello attraverso l'osservazione dei datiCosti elevati Tra i vantaggi di fare un campione ritroviamo Tutte le tipologie dei grafici possono calcolarsi Economicità e TempestivitàPer qualsiasi tipologia di frequenza Un primo aspetto critico nell'uso dei Big Data è la definizione Un problema dei dati ottenuti dai Social Media per le imprese potrebbe essere della popolazione obiettivoIl costo Un valore standardizzato negativo Un valore standardizzato superiore a 3 indica Indica che il valore è sotto la mediaUn dato anomalo

Una definizione di qualità dei dati è fornita da Una garanzia del 100% nell'intervallo di confidenza si ottiene per ISO9001:2015(- infinito; + infinito) Una variabile casuale continuapuò Una variabile casuale discreta può Assumere qualsiasi valore in un intervallo fissatoAssumere un insieme numerabile di risultati Una variabile casuale è una Funzione che può assumere più risultati (^0) 0, 0,11507 36% 0, (^4) 5, (^612) 200 0.4 0. 0.5000 Il coefficiente di determinazione R2 è pari a 0. La retta spiega il 64% del fenomeno

c Il campione

d L'obiettivo conoscitivo

6 Tra i vantaggi di fare un campione ritroviamo:

a Definizione dell'errore campionario

b Esaustività

c Qualità dell'informazione

d Economicità e Tempestività

7 L'inferenza statistica è una procedura analitica che:

a Annulla l'incertezza

b Fornisce tabelle e grafici

c Permette di passare dal particolare al generale

d Lavora sulla popolazione

8 Il campione è definito come:

a Un gruppo di persone

b La variabile di interesse

c Un sottoinsieme della popolazione

d La parte migliore della popolazione

9 La statistica descrittiva si occupa di:

a Individuare il campione

b Trovare la popolazione di riferimento

c Preparare un report finale

d Descrivere e sintetizzare le informazioni raccolte

10 Tra gli svantaggi ad analizzare direttamente l'intera

popolazione abbiamo:

a Costi elevati

b Minor livello di copertura

c Indagini mirate

d Esaustività

Lezione 3: CLASSIFICAZIONE DEI FENOMENI STATISTICI

1 I caratteri qualitativi si distinguono in:

a Sconnessi e ordinabili

b Sconnessi e continui

c Discreti e continui

d Ordinabili e continui

2 Sulle modalità di un carattere qualitativo sconnesso si possono

fare solo operazioni di:

a Tutte

b Minore, maggiore, più e meno

c Minore e maggiore

d Uguaglianza e disuguaglianza

3 Se la modalità del carattere osservato è espresso con un

attributo abbiamo:

a Un'unità statistica

b Un carattere qualitativo

c Una indagine campionaria

d Un carattere quantitativo

4 Il carattere "Reddito mensile" è:

a Qualitativo sconnesso

b Qualitativo ordinabile

c Quantitativo discreto

d Quantitativo continuo

5 Il carattere "Squadra di calcio per cui si tifa" è:

a Qualitativo sconnesso

b Qualitativo ordinabile

Lezione 4: LE DISTRIBUZIONI DI FREQUENZA

1 Con Xi si indica:

a La i-esima frequenza

b La i-esima modalità

c Il carattere oggetto di studio

d Il totale delle osservazioni

2 Le frequenze si possono calcolare per le seguenti tipologie di

caratteri:

a Caratteri qualitativi

b Caratteri quantitatvi discreti

c Tutti

d Caratteri quantitativi continui

3 Le frequenze semplici si determinano effettuando:

a La somma

b Il campionamento

c Il piano dell'esperimento

d Il conteggio

4 Se su otto PC osservati in un ufficio, tre risultano difettosi, tre

corrisponde a:

a La frequenza totale delle osservazioni

b La frequenza semplice della modalità difettosi, del

carattere "Funzionamento PC"

c Alla modalità del carattere "Funzionamento PC"

d Al carattere osservato

5 Il totale delle frequenze è uguale al:

a Totale delle osservazioni

b Totale delle modalità

c Somma del carattere

d Cento

6 Con il simbolo Σ si indica:

a La numerosità totale

b La frequenza semplice

c La sommatoria

d La modalità del carattere

7 Con ni si indica:

a La i-esima frequenza

b La i-esima modalità

c Il carattere oggeto di studio

d Il totale delle osservazioni

8 Nelle distribuzioni di frequenza, le modalità dei caratteri

quantitativi continui sono:

a Espresse tramite attributi

b Elencate

c Non esistono

d Raggruppate in classi

9 Per un carattere qualitativo sconnesso, l'elenco con cui si

riportano le modalità nella tabella di frequenze è:

a Vincolante

b Arbitrario

c Alfabetico

d In ordine crescente

10 L'ultima classe di un carattere quantitativo continuo è:

a Sempre una classe aperta

b Sempre una classe chiusa

c Una classe aperta o chiusa

d Un valore unitario

a Moltiplicando le frequenze semplici per cento

b Dividendo le frequenze relative per cento

c Moltiplicando le frequenze relative per cento

d Dividendo le frequenze semplici per cento

7 Con N3 si indica:

a La frequenza cumulata semplice della terza

modalità

b Il totale delle osservazioni

c La frequenza semplice della terza modalità

d La terza modalità

8 Le frequenze cumulate possono calcolarsi:

a Solo per caratteri continui

b Per caratteri almeno ordinabili

c Per caratteri sconnessi

d Per qualsiasi carattere

9 Con le frequenze cumulate possiamo determinare:

a Quanti hanno al massimo una data modalità

b Quanto è il totale delle osservazioni

c Quanto è il totale delle modalità

d La percentuale

10 Il totale delle frequenze percentuali cumulate è:

a Dipende dalle modalità

b Non ha senso calcolarlo

c Pari a uno

d Pari a cento

Lezione 6 (non ha test)

Lezione 7: RAPPRESENTAZIONI GRAFICHE

1 Il grafico a torta è adatto ai:

a Caratteri qualitativi ordinabili

b Caratteri quantitativi discreti

c Caratteri qualitativi sconnessi

d Caratteri quantitativi continui

2 Tutte le tipologie dei grafici possono calcolarsi:

a Per qualsiasi tipologia di frequenza

b Solo per le frequenze relative

c Solo per le frequenze percentuali

d Dipende dal fenomeno analizzato

3 Nei grafici tramite rettangoli le altezze dei rettangoli devono:

a Essere proporzionali alle frequenze osservate

b Essere uguali alle modalità

c Essere proporzionali alle densità

d Corrispondere al totale delle osservazioni

4 Per un carattere qualitativo ordinabile:

a Il grafico a torta non si pò calcolare

b Non ha senso determinare un grafico a torta

c Si deve usare il grafico a torta

d Dipende dalla tipologia del carattere se usare il grafico a torta

5 Il grafico a barre é per caratteri:

a Quantitativi continui

b Qualitativi sconnessi

c Qualitativi ordinati

d Quantitativi discreti

6 Nel grafico a torta, la sezione corrispondente alla singola

modalità si ottiene con la formula:

a Angolo = frequenza percentuale

b Angolo= modalità / frequenza

a L'ampiezza della classe

b La frequenza percentuale

c La densità di frequenza

d La frequenza cumulata

2 Nell'istogramma alla base si riportano:

a Le modalità discrete

b Le frequenze osservate

c Le densità

d Le classi osservate

3 L'ampiezza dell'intervallo è dato:

a Dalla semisomma degli estremi dell'intervallo

b Dalla differenza degli estremi dell'intervallo

c Dall'estremo inferiore dell'intervallo

d Dall'estremo superiore dell'intervallo

4 Nell'istogramma sulle ordinate si riporta:

a La densità

b La frequenza relativa

c La frequenza percentuale

d La classe

5 La densità di frequenza si calcola come rapporto tra:

a Ampiezza della classe e frequenza

b Frequenza e ampiezza della classe

c Frequenza assoluta e frequenza relativa

d Ampiezza della classe e numerosità totale

6 Se in corrispondenza della classe 5-8 si ha una frequenza pari a

6, la densità sarà:

a 0,

b 3

c 2

d 6

7 La densità di frequenza può calcolarsi:

a Solo per frequenze relative

b Solo per frequenze percentuali

c Solo per frequenze cumulate

d Per qualsiasi frequenza

8 Nell'istogramma l'area del rettangolo corrisponde a:

a La densità di frequenza

b Alla frequenza osservata

c Alla numerosità totale

d Alla modalità

9 Quando si calcola la densità di frequenza implicitamente si fa

l'ipotesi di:

a Concentrazione

b Livellamento

c Equidistribuzione

d Distribuzione

10 L'area del rettangolo è dato da:

a Ampiezza della classe x frequenza

b Numerosità totale x ampiezza della classe

c Ampiezza della classe x densità

d Dipende dal fenomeno analizzato

Lezione 9 (no test)

Lezione 10: INTRODUZIONE ALLE MEDIE

b Dipende dalla tipologia del carattere

c Un insieme di valori

d Un solo valore

7 Se due modalità presentano uguale massima frequenza diremo

che:

a La moda è due

b Non può succedere

c La distribuzione è bimodale

d Si deve fare la semisomma

8 Sono definite Medie di Posizione, quelle medie che si

riferiscono:

a Alla particolare posizione occupata da una osservazione

b Alla modalità che sta al centro

c Al calcolo di una formula sulle osservazioni

d All'individuazione del valore più elevato

9 La moda è definita come quella modalità che presenta:

a Massimo valore osservato

b Valore centrale dell'intervallo

c Minima frequenza

d Massima frequenza

10 Guardando un grafico a torta, la moda corrisponde a:

a L'ultima sezione

b La sezione più grande

c La prima sezione

d La sezione più piccola

Lezione 11: LA MEDIANA

1 La mediana è quel valore che occupa all'interno della

distribuzione, la posizione:

a Iniziale

b Centrale

c Finale

d Semi-somma

2 Per determinare il valore al centro della distribuzione è utile

calcolare:

a Le frequenze cumulate

b Le frequenze percentuali

c La moda

d Il numero di modalità

3 Se n è dispari, la posizione occupata dalla Mediana sarà:

a n/

b (n/2)+

c (n+1)/

d n

4 La posizione della Mediana deve essere:

a Un numero compreso tra 0 e 1

b Un numero pari

c Un numero dispari

d Un numero intero

5 La distribuzione viene divisa dalla Mediana lasciando:

a Un terzo dei valori prima della Mediana e due terzi dopo

b Tutti i valori prima della Mediana

c Metà delle osservazioni prima della Mediana e metà dopo

d Tutti i valori dopo la Mediana

6 Se il carattere è per classi:

a La mediana non può calcolarsi