Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statist scout match SM CV CALCIO, Appunti di Statistica

doc diviso in 3 parti: stat pura, match analysis e scouting

Tipologia: Appunti

2020/2021
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 25/03/2021

nicole-sangiorgio
nicole-sangiorgio 🇮🇹

4.9

(12)

4 documenti

1 / 41

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
INTRODUZIONE AL CORSO:
Cosa intendiamo per statistica nel mondo del calcio? SIGNIFICA DARE ANIMA AI NUMERI. Dobbiamo saper
utilizzare i nr e non dipendere da essi.
Il PREPARATORE ATLETICO è uno dei primi fruitori della statistica, il primo ad utilizzare i numeri per
verificare le condizioni fisiche, il carico di allenamento (GPS), i primi ad interpretare e gestire i dati.
L’ALLENATORE un altro fruitore dei numeri, usa le statistiche, verifica come la propria SQ o quella
avversaria viene schierata, quali sono le linee di passaggio più comuni.
L’OSSERVATORE ed il MATCH ANALYST sono coloro che utilizzano e utilizzeranno sempre di più la statistica
nella propria professione. L’osservatore usa la statistica per avere il maggior numero di dati utili per poter
fare le scelte giuste in ottica di acquisto e di caratteristiche di un nuovo giocatore in quanto il numero parla.
Idem per la Match Analist.
(L’istinto di Walter Sabatini vs la match analysis / istinto vs dati/ pallotta e favore di dati in quanto negli usa
già si adotta da anni la match per svariati sport). Non si esclude che il calcio, negli Usa, abbia attecchito
poco perche rispetto agli altri sport è meno codificabile e più situazionale.
E’ IMPORTANTE IL NUMERO e L USO DEGLI STRUMENTI MA L OCCHIOMETRO NON POTRà MAI ESSERE
ELIMINATO, le partite vanno viste.
Attraverso i GPS posso valutare COME meglio correre durante la partita e quanto.
(individuare la differenza nel numero dei passaggi tra passaggio corto e passaggio che taglia fuori un
avversario) Il solo numero del passaggio positivo non è sufficiente per la valutazione completa di un
giocatore. (la velocità di giocata, cioè la trasmissione del pallone o uno o 2 tocchi, nella statistica non c’è; il
dribbling non lo puoi stabilire se nello stretto o in campo aperto, se superi un avversario in una determinata
zona o in un'altra). VA SEMPRE CONSIDERATO IL CONTESTO E LA SITUAZIONE DI GIOCO.
A COSA SERVONO I NUMERI E COS’è LA STATISTICA:
Creare algoritmi, creare analisi statistiche, preparazione matematica per le palle inattive.
Le percezioni e le visioni sono fondamentali nell’osservazione e nel capire e saper intrepretare i numeri. (le
immagini particolari. Cane, cane dato dal condizionamento, la giovane-vecchia).
A seconda di come noi focalizziamo la ns attenzione, le immagini possono esser viste in maniera differente.
LA NS MENTE Può : NON VEDERE UNA COSA CHE C’è VEDERE UNA COSA CHE NON C’è VEDERE UNA
COSA MA NON UN'ALTRA.
(un calciatore con una qualità che spicca può non farci vedere un'altra dote o un difetto che può avere)
“LA MAPPA NON è IL TERRITORIO, IL NOME NON è LA COSA DESIGNATA” : le ns percezioni, la ns
esperienza, non è detto che corrisponda alla realtà perché siamo condizionati dal ns vissuto e dalle ns
esperienze. OGNI PERCEZIONE/ ESPERIENZA è SOGGETTIVA. La mente ci aiuta a costruire le immagini che
noi crediamo di percepire.
LA STATISTICA è la disciplina che ha come scopo lo studio QUANTITATIVO E QUALITATIVO di un fenomeno
in particolari condizioni di non completa conoscenza di esso o parte di esso.
E’uno strumento del metodo scientifici che si avvale della matematica e del metodo sperimentale per
studiare i fenomeni. Con il termine statistica, nel linguaggio di tutti i giorni, si indicano i risultati numerici di
un processo di sintesi di dati salvati (% possesso palla, media gol).
PER QUELLO CHE SARà L’UTILIZZO CHE NOI FAREMO DELLA STATISTICA adottiamo la seguente
definizione l’uso dei dati in maniera singola o nella loro interazione/correlazione ai fini di avere un
maggior nr di info da utilizzare ai fini dell’acquisto o della scelta dei giocatori, o da utilizzare per la migliore
preparazione della gara dal punto di vista tecnico/tattico da parte dell’allenatore.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
Discount

In offerta

Anteprima parziale del testo

Scarica statist scout match SM CV CALCIO e più Appunti in PDF di Statistica solo su Docsity!

➢ INTRODUZIONE AL CORSO:

Cosa intendiamo per statistica nel mondo del calcio? SIGNIFICA DARE ANIMA AI NUMERI. Dobbiamo saper utilizzare i nr e non dipendere da essi. Il PREPARATORE ATLETICO è uno dei primi fruitori della statistica, il primo ad utilizzare i numeri per verificare le condizioni fisiche, il carico di allenamento (GPS), i primi ad interpretare e gestire i dati. L’ALLENATORE un altro fruitore dei numeri, usa le statistiche, verifica come la propria SQ o quella avversaria viene schierata, quali sono le linee di passaggio più comuni. L’OSSERVATORE ed il MATCH ANALYST sono coloro che utilizzano e utilizzeranno sempre di più la statistica nella propria professione. L’osservatore usa la statistica per avere il maggior numero di dati utili per poter fare le scelte giuste in ottica di acquisto e di caratteristiche di un nuovo giocatore in quanto il numero parla. Idem per la Match Analist. (L’istinto di Walter Sabatini vs la match analysis / istinto vs dati/ pallotta e favore di dati in quanto negli usa già si adotta da anni la match per svariati sport). Non si esclude che il calcio, negli Usa, abbia attecchito poco perche rispetto agli altri sport è meno codificabile e più situazionale. E’ IMPORTANTE IL NUMERO e L USO DEGLI STRUMENTI MA L OCCHIOMETRO NON POTRà MAI ESSERE ELIMINATO, le partite vanno viste. Attraverso i GPS posso valutare COME meglio correre durante la partita e quanto. (individuare la differenza nel numero dei passaggi tra passaggio corto e passaggio che taglia fuori un avversario) Il solo numero del passaggio positivo non è sufficiente per la valutazione completa di un giocatore. (la velocità di giocata, cioè la trasmissione del pallone o uno o 2 tocchi, nella statistica non c’è; il dribbling non lo puoi stabilire se nello stretto o in campo aperto, se superi un avversario in una determinata zona o in un'altra). VA SEMPRE CONSIDERATO IL CONTESTO E LA SITUAZIONE DI GIOCO. ➢ A COSA SERVONO I NUMERI E COS’è LA STATISTICA: Creare algoritmi, creare analisi statistiche, preparazione matematica per le palle inattive. Le percezioni e le visioni sono fondamentali nell’osservazione e nel capire e saper intrepretare i numeri. (le immagini particolari. Cane, cane dato dal condizionamento, la giovane-vecchia). A seconda di come noi focalizziamo la ns attenzione, le immagini possono esser viste in maniera differente. LA NS MENTE Può : NON VEDERE UNA COSA CHE C’è → VEDERE UNA COSA CHE NON C’è → VEDERE UNA COSA MA NON UN'ALTRA. (un calciatore con una qualità che spicca può non farci vedere un'altra dote o un difetto che può avere) “LA MAPPA NON è IL TERRITORIO, IL NOME NON è LA COSA DESIGNATA” : le ns percezioni, la ns esperienza, non è detto che corrisponda alla realtà perché siamo condizionati dal ns vissuto e dalle ns esperienze. OGNI PERCEZIONE/ ESPERIENZA è SOGGETTIVA. La mente ci aiuta a costruire le immagini che noi crediamo di percepire. LA STATISTICA è la disciplina che ha come scopo lo studio QUANTITATIVO E QUALITATIVO di un fenomeno in particolari condizioni di non completa conoscenza di esso o parte di esso. E’uno strumento del metodo scientifici che si avvale della matematica e del metodo sperimentale per studiare i fenomeni. Con il termine statistica, nel linguaggio di tutti i giorni, si indicano i risultati numerici di un processo di sintesi di dati salvati (% possesso palla, media gol). PER QUELLO CHE SARà L’UTILIZZO CHE NOI FAREMO DELLA STATISTICA adottiamo la seguente definizione→ l’uso dei dati in maniera singola o nella loro interazione/correlazione ai fini di avere un maggior nr di info da utilizzare ai fini dell’acquisto o della scelta dei giocatori, o da utilizzare per la migliore preparazione della gara dal punto di vista tecnico/tattico da parte dell’allenatore.

➢ CLASSIFICAZIONI E DISTRIBUZIONI STATISTICHE:

Statistica come raccolta di dati, come visione di sintesi di un fenomeno (il costo della vita, l’occupazione, disoccupazione, tasso di natalità) che viene sintetizzato attraverso un dato ben preciso. E’ un metodo matematico per studiare un fenomeno collettivo in quanto non si parla di osservazione del singolo ma osservazione di fenomeni complessi che presuppongono più individui, abbiamo inoltre analisi riferite al tempo (ISTANTE DI TEMPO; il grado di occupazione dell’Italia nel 2021 oppure PERIODO DI TEMPO l’occupazione in Ita nell’ ultimo semestre). COS’è L’ OGGETTO DELLA NS RILEVAZIONE STAT? E’ rappresentato dalle unità statistiche che compongono il collettivo o popolazione a cui il fenomeno è riferito. Con il termine popolazioni si indica l’insieme delle unità statistiche portatrici di uno o più caratteristiche connesse al fenomeno oggetto di interesse. I caratteri sono le caratteristiche scelte per definire il fenomeno collettivo oggetto di interesse (ciò che ci serve per capire il fenomeno analizzato). Questa classificazione ci serve per passare dal disordine all’ordine, permettendoci di classificare ciò che può esser ritenuto uguale o simile da ciò che può esser ritenuto diverso. ESEMPIO→ il tifo: il fenomeno che vogliamo indagare, l’oggetto della nostra rilevazione stat è il fenomeno del tifo in Ita → l’unità statistica sarà rappresentata dal singolo individuo tifoso → la popolazione sarà costituita da tutti gli individui che tifano per una qualche squadra → il carattere sarà la classificazione dei tifosi a seconda del tifo ( tutti i tifosi dell’ inter avranno un UNICO CARATTERE essere interisti ). Contando il nr di tifosi all’interno di ogni classe, si ottiene un numero che dà la dimensione della classe stessa che in gergo viene definito NUMEROSITà O FREQUENZA. = le persone perdono la loro riconoscibilità individuale e si identificano esclusivamente per la sq per la quale tifano. Questo è il modo in cui andremo a classificare il ns fenomeno (un tot di interisti, un tot di romanisti, un tot di juventini). Nelle distribuzioni statistiche abbiamo 2 TIPI DI CARATTERE: CARATTERE ( le caratteristiche scelte per definire il fenomeno collettivo oggetto di interesse ) QUANTITATIVO E QUALITATIVO. I QUANTITATIVI si rappresentano con X, Y maiuscolo mentre i QUALITATIVI si rappresentano con le prime lettere dell’alfabeto A, B. All’interno dei caratteri QUANTITATIVI abbiamo 2 grandi differenze → i CARATTERI QUANTITATIVI DISCRETI cioè quelli che permettono operazioni di conteggio (nr figli, nr componenti famiglia), tutto ciò che è enumerabile. CARATTERI QUANTITATIVI CONTINUI quando la modalità con cui vengono caratterizzati risulterà una misura (l’età, il peso, l’altezza) NON UN NUMERO. CARATTERI QUALITATIVI ORDINABILI sono quelli che ammettono sequenza con una relazione d’ordine, sono ordinabili secondo una scala ben definita. Classificare le persone dal titolo di studio (carattere qualitativo ordinabile) partendo dalle diverse licenze (elementare, media inferiore, media superiore, laurea etc) CARATTERI QUALITATIVI SCONNESSI sono scambiabili all’interno della distribuzione ( es del tifo, il carattere interista, romanista etc non è ordinabile). Per classificare i caratteri continui e discreti si scelgono modalità che non sono numeri bensì intervalli ( es: intervallo di statura_ quante persone sono alte dal 1.80m e 1.83 ). La frequenza N rappresenta il numero di soggetti ( le unità statistiche) che hanno un certo range di altezza ( la frequenza è determinata da quante persone sono alte tra 1.80m e 1.83). La FREQUENZA→ si ottiene dal rapporto (la divisione) tra tutte le rilevazioni e il numero della frequenza di una determinata rilevazione .la FREQUENZA RELATIVA ci dà il rapporto tra quanti tifosi di una singola sq ci sono rispetto al totale. Questo valore viene moltiplicato per 100 (%). FREQUENZA ASSOLUTA è la numerosità del campione che si vuole analizzare. Le DISTRIBUZIONI DI FREQUENZA si costituiscono raggruppando in classi le N unità stat in base alle K diverse modalità del carattere.

TABELLE PIVOT→ le utilizzo quando ho un numero elevato di dati incrociati tra più elementi. Clicco TABPIVOT, seleziono tutte le colonne di interesse, e ho la possibilità di ricavare totali generali in base a ciò che seleziono di cui voglio analizzare il dato. FUNZIONI MATEMATICHE→ e funzioni statistiche. SOMMA AUTOMATICA, CONTA NUMERI, MEDIA, VEDERE UN NUMERO MAX IN UN ELENCO, ➢ LE MEDIE (media gol 0.50= fa un gol ogni 2 partite ed è un valore di sintesi che da idea immediata della grande capacità realizzativa del giocatore, media reti). Il concetto di media è un concetto molto ampio ed è utilizzato come un valore di sintesi di una distribuzione statistica riassumendo in un unico dato in un unico valore una pluralità di valori, serve come elemento di sintesi. Le medie sono soggette alla CONDIZIONE DI CAUCHY→ il valore medio dovrà essere sempre un valore numerico compreso tra il valore minimo e quello massimo osservato. MEDIA DI POSIZIONE→ sono determinate in base alla frequenza o alla posizione occupata nella graduatoria dell’osservazione individuale. Sono medie di posizione la MODA, MEDIANA, QUANTILI. MEDIA ALGEBRICA→ è quella tenuta dal concorso di tutti i termini della distribuzione attraverso alcune operazioni di tipo algebrico sul valore dei caratteri. Sono le medie ARITMETICHE, GEOMETRICHE, QUADRATICHE. La capacità descrittiva di una media dipende da come essa sintetizza i valori mediati. [Una squadra fa i test e sappiamo che un giocatore corre in partita una media di 10km (media campionato), facendo sempre le stesse prestazioni passando da 11 a 9 , la media ha un buon valore di sintesi, ma se ad inizio stagione correva 14km e nella seconda parte correva per 6km fare un valore 10 di media non tiene conto dell’eccessiva variabilità delle prestazioni di quel determinato giocatore]. Per comprendere il concetto di variabilità: esaminiamo un collettivo composto da 5 individui; carattere quantitativo X = quantità di soldi in tasca→ se tutti e 5 hanno in tasca 50 € il CARATTERE X non ha variabilità( è uguale per tutti) MENTRE SE 4 persone hanno zero € e una sola ha 250€ → il grado di variabilità è enorme. In ambedue i casi la media aritmetica ci dice che ciascuno ha 50€, nel secondo caso non possiamo sintetizzare al meglio il caso. → LE 3 PRINCIPALI MEDIE DI POSIZIONE:

  • MODA→ la modalità del carattere che nell’insieme di osservazioni si presenta con la massima frequenza = carattere modale ove ogni modalità di carattere è frequente per un certo numero di volte, facilmente calcolabile per i caratteri qualitativi e quantitativi raggruppati in classi modali che sono quelle a cui corrisponde la max densità di frequenza. Nel caso in cui più di una modalità è associata ad una frequenza elevata la distribuzione viene detta PLURIMODALE. Questa media di posizione viene maggiormente utilizzata nel campo della moda, usata nel comparto delle confezioni (TAGLIE), attraverso valori modali (grandezza spalla, taglia etc); per una scarpa di unico numero si sceglierebbe una grandezza di sintesi maggiormente utilizzata come il 42(NUMERO MODALE) che è il più venduto nel campo delle calzature. Per determinare il carattere modale nel caso in cui si abbiano caratteri quantitativi si introduce il concetto di DENSITà: DJ=NI/WI → la densità è il RAPPORTO tra la frequenza per l’ampiezza della classe.

Densità → freq DIVISO ampiezza = X1 10/5=2; X2 60/10=6; X3 30/2=15; X4 10/5=2. X3 CORRISPONDE ALLA MAX DENSITà→ è vero che c’è la metà delle frequenze della classe precedente ma la densità è quasi 2,5 volte superiore.

  • MEDIANA→ una media di posizione ammessa solo per i caratteri quantitativi e qualitativi GRADUABILI (quelli che possono essere messi in un ordine ben preciso dal piu basso al piu alto). La mediana è definita come la modalità del carattere associata all’unità che occupa il posto centrale nella successione ordinata delle osservazioni individuali. la così detta MEDIA DI POSIZONE Un esempio immediato di moda e mediana è riportato qui sopra: 345K famiglie esaminate di una grande città del Nord Italia, ognuna di esse è stata catalogata a seconda del NR dei componenti. Nella prima colonna abbiamo il CARATTERE, nella seconda la FREQUENZA DEL CARATTERE e nella terza abbiamo le FREQUENZE CUMULATE. In questo caso il numero delle osservazioni è DISPARI quindi la mediana sarà N+1/2= 345k+1 /2 L’UNITà CENTRALE sarà 172, 589. Questa unità fa parte del carattere numero componenti
  1. La mediana è associata al carattere numero 3 perché in quel numero di componenti si trova esattamente l’unità centrale. La moda (che è rappresentata dal carattere con la più alta frequenza) la troviamo nella colonna famiglia al carattere 2 COMPONENTI DELLA FAMIGLIA.
  • QUANTILI→ sono medie di posizione che ripartiscono una sequenza ordinata delle osservazioni individuali in un certo numero di parti uguali. Spesso vengono utilizzati per le preparazioni fisiche e test. I più utilizzati sono 3: i QUARTILI→ suddividono le unità in 4 gruppi di numerosità uguale N/4 ; I DECILI→ vengono divisi in 10 gruppi di numerosità N/10; PERCETILI → vengono divisi in 100 gruppi di numerosità N/100.

➢ VARIABILITà ED ETEROGENEITà (ricordiamoci che le medie a volte possono essere elementi non abbastanza soddisfacenti, se la variabilità è estrema, il valore di sintesi è poco indicativo). Gli indicatori di variabilità, che spesso affiancano i valori medi, descrivono l’attitudine di una variabile ad assumere valori differenti nelle U.STAT. osservate. Un indicatore di variabilità sarà pari a zero se, e solo se, tutte le unità osservate presentano lo stesso grado di grandezza del carattere mentre assume valori crescenti al cresce della variabilità stessa. ESEMPIO→ osserviamo il nr di figli in un insieme di 10 donne riscontrando che ognuna ha solo 1 figlio: variabilità= ZERO perché tutte le unità possiedono lo stesso valore del carattere figlio=1 ; al contrario, più il nr di figli si presenta con modalità diverse nell’insieme di donne ( chi 5, chi 2, chi 4) più la variabilità aumenterebbe notevolmente. LA MEDIA PUNTI DI UN ALLENATORE SUBENTRATO LA IV° DI CAMPIONATO: analizziamo mese per mese, primo mese 2 pt, secondo mese 6 pt, terzo mese 5 pt etc, se facessimo la media su questi 3 periodi la media punti su base mensile non ci darebbe l’andamento della sq MENTRE un indice di variabilità si.

  • INDICATORI DI VARIABILITà ASSOLUTI→ sono quelli che dipendono dalla media del carattere e dal diverso ordine medio di grandezza del carattere stesso; misurano la diversità tra quantili o tra due particolari termini della distribuzione oppure la dispersione dei valori osservati attorno ad un valore medio. Sono difficilmente confrontabili in distribuzioni diverse. → se volessimo confrontare le variabili delle altezze in 2 collettivi uguali ma di differente metrica, h giocatore di serie A Ita (cm) vs giocatore premier league (pollici) avremo misure di variabilità NON CONFRONTABILI. →se invece volessimo confrontare la variabilità di un collettivo di adulti vs un collettivo di bambini SAREBBE TROPPO DIFFERENTE l’odine medio delle altezze per poter andare a fare un confronto che abbia un significato. Bisogna sempre stare attenti a come e a cosa si mette in relazione e come si confronta il tutto.
  • GLI INTERVALLI DI VARIABILITà→ possiamo vedere 2 formule:
  • RANGE o intervallo di variazione è la misura della differenza tra la modalità più grande di un carattere e la modalità più piccola (abbiamo una serie di misurazioni e la differenza tra il più alto e il più basso ci dà intervallo di variazione). E’ un indice che ci permette di dare una prima valutazione numerica della variabilità di un carattere quantitativo. (è poco attendibile soprattutto se i 2 valori estremi sono molto lontani dalla media reale o da altre osservazioni e potrebbe essere forviante).
  • DIFFERENZA INTERQUARTILE è la misura della differenza tra il I° e il III° quartile (quartile ricordiamo essere ciò che funge alla valutazione del primo 25% dei valori, mentre il III° ne racchiude il 75%). Esaminando nel dettaglio le medie dei vari intervalli in cui si distribuiscono le Freq ci dà un valore più utile per capire meglio la variabilità di quel fenomeno. I 3 grandi valori di variabilità ASSOLUTA sono la VARIANZA, la DEVIANZA e lo SCARTO QUADRATICO MEDIO. →La VARIANZA : dato un carattere quantitativo X si può calcolare una misura sintetica e intuitiva della sua variabilità da un semplice confronto dei valori osservati nelle singole unità stat e i valori teorici nell’ipotesi di non variabilità ( tutti i valori osservati sono uguali e tutti sono uguali alla media aritmetica). La sintesi più

usata di tutte le differenze è la VARIANZA cioè il rapporto tra la somma dei quadrati degli scarti della media aritmetica / il nr di unità. Quanto più si discostano i singoli valori osservati dalla media che rappresenterebbe la non variabilità, più abbiamo un valore della varianza elevato ( questo è sinonimo di variabilità dell’osservazione). → La DEVIANZA: è quando utilizzo solo il numeratore della varianza. Entrambe sono espresse nell U.M. del carattere al quadrato. → lo SCARTO QUADRATICO MEDIO: la radice quadrata della devianza (altrimenti detta anche devianza standard). Grazie all’utilizzo di questi 3 valori posso calcolare quanto ogni singola U.STAT. si discosta dalla media aritmetica. Le formule definitorie (II° colonna) si utilizzano in caso di protocolli elementari. Se abbiamo soltanto delle osservazioni individuali queste formule, in mancanza di frequenza assoluta, sono le piu semplici da usare per fare i relativi calcoli. In caso abbiamo invece a che fare con frequenze ed osservazioni di diverso tipo può essere utile la formula calcolatoria (III° colonna). PER I 2 ESERCIZI ANDARE ALLA LEZIONE 5 , DAL MINUTO 19’ C.CA IN AVANTI. ESERCIZIO 1→ Utilizziamo la formula definitoria: la devianza è la sommatoria delle differenze tra il valore di ogni singola U.STAT rispetto alla sua media STAT; la MEDIA è 50,5 ( in questo caso è la sommatoria di ogni singolo valore MENO la propria media aritmetica AL QUADRATO. PER CALCOLARE LA DEVIANZA; calcolo il valore di ogni singola X ( ogni valore di h ) MENO la media ELEVATO AL QUADRATO. Se voglio farlo velocemente lungo tutta la mia colonna, blocco con $ la MEDIA e trascino. PER CALCOLARE LA VARIANZA; calcolo la DEVIANZA/ NR DEI NEONATI TOTALI (10) PER CALCOLARE LO SCARTO QUADRATICO MEDIO; RADICE QUADRATA della VARIANZA. PER TROVARE QUESTI VALORI SU EXCEL: DEVIANZA: somma automatica→ DEV.Q VARIANZA: somma automatica→ VAR.P SQM: somma automatica→ DEV.ST.POP.VALORI

Quindi in termini relativi, cioè confrontabili, il gruppo neonati è maggiormente variabile nel peso rispetto a quello degli adulti, se in termini assoluti non c’è confronto, questo C DI VARIAZ permette di confrontare 2 collettivi che con altri indici non sarebbero confrontabili. → LA CONCENTRAZIONE: è una particolare misura di variabilità che può essere calcolata solo per caratteri quantitativi che godono di 2 proprietà: CUMULABILITà E TRASFERIBILITà, ossia si possono sommare e trasferire tra le diverse unità oggetto delle nostre analisi. Il concetto di concentrazione riguarda il modo in cui l’ammontare tot di un carattere si ripartisce fra le nostre N U.STAT. Tanto più tale ammontare è addensato in poche unità, tanto più si dice che il carattere è concentrato. La concentrazione sarà massima nel caso in cui un'unica unità possiede tutto l’ammontare di quel carattere (nell’esempio delle 5 persone, citato sopra, che si distribuiscono 25 0 € troviamo l’assoluta concentrazione nell’unica persona che ha i 250€ mentre gli altri non hanno nulla): Dobbiamo trovare un indice che ci dia un'unica concentrazione: L’INDICE DI GINI. Questo indice ci dirà

  • concentrazione nulla→ indice = a zero
  • concentrazione massima→ indice= a 1
  • concentrazione diverse si porranno sui range tra 0 e 1. Al fine di misurare la concentrazione costruiamo 2 colonne contenente due valori: Pj e Qj dove P indica la frazione dell’unità che possiede il carattere inferiore o uguale al livello Xj ossia P=j/n (mettiamo di avere 5 unità P1= 1/5; P2= 2/5; P3= 3/5; P4=4/5; P5= 5/5) mentre Q indica la frazione dell’ammontare totale del carattere che compete ad ogni U.STAT: Q1 sarà dato da 20/100; Q2 sarà 40/100 etc. ESERCIZO LEZIONE 7 CHE VIENE SVOLTO ALLA LEZIONE 8 ESERCIZIO 2→ da svolgere su propri appunti cartacei seguendo la spiegazione del prof ( minuto 20’c.ca). (LEZIONE 8) Esercizio lezione 7 svolto ↓

→L’unità statistica di riferimento sono gli studenti dell’Università →il carattere osservato è il tifo calcistico che si esprime in 5 modalità Interisti Romanisti etc →la tabella rappresenta un protocollo elementare →la media aritmetica è data dalla sommatoria del nr dei tifosi/ nr delle sq ( 1,020/5= 204) questo ci dice che 4 elementi su 5 hanno meno della media quindi si nota abbastanza concentrazione →la mediana (ordino i valori osservati in ordine crescente) 100,120,150,200,450. →il numero delle unità osservate è dispari quindi avrò una specifica formula per calcolare le unità centrali, N+1/2; 5+1=6; 6/2= 3. La MEDIANA (o l’unità centrale) sarà dunque la III° unità, composta da 150 tifosi milanisti (se ci avesse chiesto quale fosse la MODA avremmo evidenziato Juventus in quanto viene espressa dal più alto numero) →SQM (che è un indicatore che misura la dispersione dei valori osservati attorno ad un valore medio) e trovo con radice quadrata della VARIANZA sarà: →il coefficiente di variazione (indicatore relativo, non ha U.M. ed è dato dal rapporto (/) dello sqm e la media aritmetica (127,53/204= 0,63) →indice di Gini , applico le formule (vedi es precedente),ricordando che Gini varia da ZERO= equa distribuzione ( per es tutte le sq con 204 tifosi a testa ) UNO= tutti i 1020 tifosi appartenuti ad 1 sola squadra. 3,38 mi indica che 4 valori su 5 sono inferiori alla media. Il 3,38 sta a significare che nella distribuzione proposta si verifica il 38% della max concentrazione possibile. Questi indici ci fanno capire come un tal fenomeno ha un certo grado di concentrazione e ci permette di fare delle comparazioni anche tra valori diversi, con diverse metriche. INIDICE DI VARIAZIONE RELATIVA (coefficiente di variazione) + INIDCE DI GINI (per misurare la concentrazione). ➢ INDICE DI (correlazione) DI PEARSON E’un indice che esprime un eventuale relazione di linearità tra 2 variabili. Le coppie dei valori possono essere rappresentate attraverso un grafico di dispersione: Facciamo passare una retta tra i punti del grafico che corrispondono ad un legame funzionale di tipo lineare, occorre individuare la retta che spiega meglio la relazione tra i 2 caratteri. Se tra X;Y ci fosse una relazione di dipendenza perfetta, tutti i punti si troverebbero allineati sulla retta e non intorno ad essa (nel ns caso sono abbastanza vicini MA NON TUTTI allineati perfettamente), più vi è dispersione più non c’è grado di correlazione. Il modello di dipendenza lineare è Y=A+BX (A è l’ordinata all’origine, B è il coefficiente angolare della retta).

Con excel ho la possibilità di usare delle formule specifiche che mi permettono di non incappare in errori, le trovo nelle FUNZIONI STAT. → trovo grado di correlazione (mette in correlazione matrice (colonna) X con matrice Y (meno di 2 secondi con la funzione del pc). Questo indice è molto importante per capire come 2 variabili sono legate e per capire come gli andamenti di determinate variabili sul campo determinano l’andamento in graduatoria di una squadra. ➢ RAPPORTI STATISTICI I rapporti stat non sono altro che confronti tra grandezze legate da una relazione logica di cui almeno una di natura statistica (ovvero un fenomeno collettivo, che va ad indagare una collettività). I rapporti stat permettono di comparare nel tempo e nello spazio, a prescindere dalla dimensione o dalla natura del fenomeno indagato, 2 comportamenti che variano o nel tempo o nello spazio. Il rapporto stat è costituito da un numero puro adimensionale che permette un certo tipo di comparazione; ad es potremmo confrontare in un dato anno e con rif ad una determinata facoltà il nr di studenti che si laureano rispetto al numero degli iscritti, questo ci permette di capire il rapporto laureati/iscritti. Esistono diversi tipi di rapporti stat in base al legame tra i termini posti al numeratore e al denominatore, i più usati sono → rapporto di composizione, coesistenza, derivazione (frequenza, durata e ripetizione). →Rapporto di composizione: detto anche di parte al tutto perchè mette in relazione l’intensità di 2 fenomeni uno dei quali può considerarsi una parte dell’altro. Quanti maschi sono nati rispetto al totale? Al numeratore inserisco il numero dei nati M, al denominatore la somma tot dei nati. Abbiamo un rapporto di compensazione del 52% che ci dice che nel 2003 sono nati 52% di M rispetto al totale. Nel momento in qui abbiamo questo tipo di rapporto abbiamo sempre un valore che varia da 0 a 1, il numeratore sarà sempre inferiore rispetto al denominatore →Rapporto di coesistenza: ogni rapporto corrispondente di 2 modalità, di 2 gruppi, compresi in un certo insieme. In rif all’esempio sopra citato il rapporto tra M e F risulta totM/totF= 1,06 *100= 106 ciò significa che ogni 100 nati F ci saranno 106 nati M. →Rapporti di frequenza: sono rapporti tra freq assoluta, o intensità, di un fenomeno e l’intensità di un altro fenomeno omogeneo o non omogeneo con il primo. Serve a mettere in relazione elementi che non hanno omogeneità. Un tipico caso è calcolare quanti abitanti per mq ha una nazione. Abitanti/estensione geografica=99,08 ci dice che la Francia ha 99 abitanti ogni kmq. →Rapporto di derivazione: si ottiene dividendo l’ammontare di un aggregato per l’ammontare di un altro aggregato che sul piano logico o temporale ne costituisce l’antecedente o meglio il presupposto fenomenico. Esempio: il presupposto per nati/matrimoni/morti è che ci sia una popolazione. Il dato al

denominatore costituisce questo presupposto fenomenico delle grandezza posta al numeratore ( i nati, sulla base della popolazione, i matrimoni, sulla base della popolazione, i morti, sulla base della popolazione). Il classico esempio è il grado di natalità che è il rapporto tra il numero dei nati(vivi) nell’ anno e l’ammontare medio della popolazione residente dello stesso anno. →Rapporto di durata: esprime in un dato periodo di tempo ( anno, mese, settimana), la permanenza media di un elemento in un sistema. Per calcolarlo si considera il rapporto tra un dato stat (il nr degli elementi presenti all’inizio e alla fine del periodo di tempo prestabilito) e uno dinamico ( le entrate e le uscite nello stesso arco di tempo). Il rapporto di durata è definito come il quoziente fra il fondo in una data unità di tempo e il flusso dei rinnovi. Lo possiamo esprimere come la durata media di permanenza nel fondo. ESEMPIO ↓

  • i flussi di entrata/uscita non sono regolari ma possiamo calcolare il ns indice perche sappiamo la consistenza all’inizio dell’intervallo ( 50clienti- c0) , la consistenza alla fine dell’intervallo( 70clienti-c1), il flusso di entrata dell’intervallo (in entrata100-E) flusso di uscita dell’intervallo (uscita80-U) = la consistenza media sarà (50+70/2= 60 ) MENTRE il movimento medio sarà (100+80/2= 90) = il rapporto di durata sarà dato da consistenza media/movimento medio ( 60/90=0,6) che MOLTIPLICATO * 4 ore ci dà 2he 40 di permanenza all’interno del negozio. Questo serve per capire come in un determinato lasso di tempo, i movimenti entrata/uscita, determinano questi rapporti di durata. →rapporto di ripetizione: (l’inverso del rapporto di durata) che non è altro che il reciproco del rapporto di durata e indica il nr di volte che il fondo è stato completamente rinnovato nell’unità di tempo o il nr medio di rinnovi o ricambi nell’unità di tempo per ogni unità di fondo. ESEMPIO ↓ Rapporto di durata= consistenza media/ il movimento medio (810/7,380= 0,11) Rapporto di ripetizione (l’inverso del rapporto di durata) = ricoverati anno/degenti (7,380/810=9) un valore che esprime quante volte durante l’anno un posto letto è stato ricoperto all’interno dell’H. →numeri indici: rapporti stat che per semplificazione di calcolo esprimiamo in %, che pongono a confronto le intensità di uno stesso fenomeno in 2 tempi o luoghi diversi.

indice con base 2004 del 2005 sarà uguale all’indice 101,55 che è l’indice a base fissa 2001 dell’anno 2005/ 103,96 che è l’indice a base fissa 2001 del tempo corrente 2004 ( 101,55/103,96= 0,9768 in % pari al 97,68)). Basta mettere al numeratore e al denominatore i 2 indici per spostare la base. Ne consegue che tra il 2004 e il 2005 si è verificato un decremento del nr di immatricolati pari a circa il 2,23%. ➢ LA PROBABILITà E LE RAPPRESENTAZIONI GRAFICHE Probabilità termine strettamente correlato con il concetto di casualità, nella ns quotidianità vi sono spesso eventi con esito incerto (causale) il cui risultato è influenzato da circostanze a noi ignote come: domani pioverà? Chi vincerà il campionato di calcio? Ù. Di questi elementi si può misurarne il grado di avverabilità. La probabilità può essere intesa come la misura del gradi di avverabilità di un evento ( nel calcio, la sq favorita spesso risulta essere quella che ha meno probabilità di vittoria→ in questo caso la misura del grado di avverabilità dell’evento si verifica nel 50% dei casi). 5 definizioni fondamentali in quella che è la teoria del calcolo della probabilità: →prova aleatoria: un’ operazione ad esito incerto (lancio della monetina o del dado) →esperimento aleatorio: una serie di prove il cui esito non è prevedibile con esattezza (il lancio consecutivo di una moneta, lanciare 3 volte consecutive il dado) →spazio degli eventi: (S) insieme di tutti i possibili esiti di un esperimento aleatorio. Insieme esaustivo= uno degli esiti necessariamente avviene e insieme disgiuntivo= il verificarsi di un esito impedisce il verificarsi di qualunque altro esito ( il lancio della moneta mi darà 4 esiti mentre il lancio del dato me ne darà 36). →evento aleatorio: (E) insieme di tutti i possibili eventi ed è un sottoinsieme dello spazio S ( per il dato, l’evento aleatorio sarà caratterizzato per i nr dispari con E 1.3.5, che è sottoinsieme di S che sarà 1.2.3.4.5.6. →evento elementare: sottoinsieme di S costituito da un solo elemento (esce il nr 2). Le operazioni tra eventi: Evento unione: si verifica quando esce E o F oppure entrambi. L’evento unione sarà determinato da 1,3,5,6. Evento intersezione: (simbolo ꓵ) si verifica quando accadono contemporaneamente E ed F. l’evento unione sarà il 5 essendo l’unico nr che appartiene ad entrambi. Evento negazione: è quando non si realizza l’evento E. Evento disgiunto: è un evento incompatibile, che non può accadere. E ed F non possono accadere contemporaneamente ( es, dall’estrazione di un urna con sole palline rosse è impossibile che esca una pallina nera). Probabilità di un evento: è il rapporto tra il nr di casi favorevoli al verificarsi dell’evento stesso e il nr dei casi possibili purché siano tutti ugualmente avverabili. la probabilità che lanciando un dado esca un nr pari è del 50% perché il nr favorevole all’evento che esca il nr pari è 3 (2,4,6) : il nr dei casi possibili è 6 (1,2,3,4,5,6) ; 3/6=0,50. Esiste inoltre una def FREQUENTISTICA→ che si basa sulla legge empirica del caso secondo la quale ripetendo un gran nr di prove, la frequenza relativa con cui si manifesta un dato evento tende a stabilizzarsi intorno ad un cerno valore che è proprio la probabilità che ha l’evento di avverarsi. Se il nr di casi tende all’infinito è maggiore la probabilità che avvenga l’evento e ci si avvicina alla probabilità secondo quella che

è la definizione classica. (es, lancio di una moneta, vinco se viene testa: magari nei primi 10 casi esce 8 volte testa, vinco 8 volte ed è evidente che più il nr di probabilità aumenta più si vedrà che testa esce per il 50% delle volte; se facciamo 1000 lanci è evidente che si assesteranno a circa 500testa e 500croce, più il nr di prove tende all’infinito più coinciderà con la probabilità dell’evento stesso. Se su 10,000 lanci avessimo 7,500croce vs 2,500testa potremmo pensare che la moneta è truccata perché la legge empirica del caso ci dice che non è possibile.

  • PROBABILITà EVENTO UNIONE: L’evento unione è dato dalla somma dei 2 singoli eventi MENO evento intersezione. La probabilità che esca quadri è data da 13/52 in quanto 13 sono le carte di quadri presenti in un mazzo mentre 52 sono il nr tot delle carte. Per l’asso avremo 4/52 in quanto abbiamo 4 assi in un mazzo. L’ asso di quadri sarà l’evento intersezione perché è l’unico evento che contemporaneamente soddisfa il verificarsi dell’evento E ed F 1/52. ( 13/52+4/52-1/52= 16/52= 0,308) Quindi la probabilità, su un mazzo di 52 carte, di estrarre o una carta di quadri o un asso, sarà pari al 30,8%.
  • PROBABILITà EVENTO DIFFERENZA: La probabilità sarà data da P(E) MENO P dell’intersezione tra i 2 aventi: esce una carta di quadri sarà sempre 13/52; l evento intersezione ( quindi che la carta non sia un asso) sarà 1/52. (13/52-1/52= 12/52= 0,231) quindi ho il 23% di P che esca quadri ma che non sia asso.
  • PROBABILITà EVENTO INTERSEZIONE:

➢ LA FIGURA DELL’OSSERVATORE:

L’osservatore può essere definito come colui che svolge, per conto delle Società, attività concernenti l’osservazione, l’analisi, la valutazione, l’archiviazione e lo scouting di giocatori e squadre. La qualifica che si ottiene attraverso corsi specifici federali, viene riconosciuta ai fini del tesseramento presso le Soc che richiedono la presenza di questo ruolo specifico. Scouting lo possiamo tradurre con esplorare/ perlustrare, to scout about→ andare in cerca di. Non confondiamo, però, la figura dell’osservatore con colui che scopre fenomeni indiscussi in quando certi talenti eccelsi non hanno bisogno di essere ricercati (Maradona, Ronaldo etc). Il primo codificatore del ruolo di scout è stato Lucadello, 1940c.ca, baseball, Usa, sistema americano legato al draft (sistema di scelta degli atleti da parte delle franchigie). Lucadello adottava la terminologia delle 4P: POOR (scarso)→ colui che guarda la gara, non visiona, non osserva e non segue nessun metodo o obiettivo preciso (il 5% di coloro che si etichettavano come osservatori) PICKER (cestinatore)→ colui che mette sempre in evidenza i difetti enfatizzandoli, trascurando le forze e le potenzialità dell’atleta osservato (5%). PERFORMANCE ( da prestazione)→ giudica l’atleta solo dalla prestazione anche quanto lo ha osservato in più occasioni (85%) PROJECTOR (proiettore)→ colui che è in grado individuare la potenzialità dell’atleta osservato e proiettare il suo obiettivo nell’arco di 2/3 stagioni (5%). La figura dell’osservatore, dunque, non è colui che fotografa una prestazione bensì colui che riesce ad individuale qualità che possono evidenziare potenzialità importanti ( soprattutto se osservato in età di crescita). 2 ESEMPI IN AMBITO CALCISTICO: Geoff Twentyman, fine anni ’60, ex giocatore del Liverpool, caposcout della Soc. Attraverso il suo metodo di osservazione è riuscito a portare risultati straordinari alla sq a cui ha legato la propria attività per 20 anni. Il suo metodo consisteva nel concentrarsi su un territorio molto limitato (Scozia) dove poteva identificare i migliori talenti della fascia 17/23 anni. Dopo 1/3 anni di esperienza nella sq riserva, Twentyman capiva se per il giocatore in questione ci potesse essere o meno futuro in alto ambito professionistico per il Liverpool. Metodo Cruiff, anni ’80 c.ca, adottato tutt’ora da molte scuole giovanili (Svizzera, Olanda, giovanile Ita TIPSS) dove il giocatore viene valutato secondo 4 parametri: In Ita viene aggiunto l’elemento Struttura ( h, fisicità). Il giocatore deve rientrare in determinati parametri, avere determinati punteggi, per esser valutabile come atleta titolare Nazionale, potenziale titolare in capo a poco tempo, giocatore interessante, giocatore di non interesse della nazionale (metodo adottata dall’Ajax). Oggi possiamo parlare di 5 livelli di osservazione, 5 figure di osservazione: Osservatore di prima sq→ un osservatore di tipo tecnico (margine di tempo limitato, visione delle 3/ partite precedenti max) Osservatore del settore giovanile→ un osservatore di tipo tecnico con diversi parametri rispetto alle prime sq (ampio margine di tempo, anche anno intero) Osservatore degli avversari→ osservatore di tipo tattico, solitamente è un Mr che va ad analizzare la partita per conto del Mr in prima dal punto di vista tattico e non tecnico. Video analista→ osservatore di tipo tattico

Direttore sportivo dei prestiti→ il direttore sportivo di Soc molto grandi che si occupa di andare ad osservare costantemente, settimanalmente, i propri giocatori in prestito nelle serie inferiori o nella stessa serie. L’osservatore degli avversari è colui che per conto dell’allenatore deve studiare i movimenti della sq. In varie situazioni, solitamente in fase di possesso e di non possesso, come imposta il gioco, da dove parte, quali sono le soluzioni di attacco, la posizione degli avversari sui calci piazzati a favore e contro, i punti forza e di debolezza. il fine dell’osservazione è capire le dinamiche della sq avversaria avendo al max un intervallo di 3 partite dallo scontro diretto. L’osservatore ha qualifica di allenatore, spesso uomo di fiducia del Mr. La ricerca delle caratteristiche del giocatore sono decisamente cambiate rispetto al passato, oggi si cerca un portiere che imposta il gioco come un centrocampista centrale, un difensore centrale che corre veloce come un esterno, un difensore esterno che palleggia come un centrocampista interno, un centrocampista bravo nel gioco aereo come un difensore centrale e che magari segna (4/5 gol a campionato) ed un attaccante che difende come un difensore e che va in doppio decimale di gol e di assist. L’osservatore lavora su 2 principi di valutazione, la prestazione e il valore assoluto/potenziale del giocatore. Se volessimo schematizzare in una formula statistica il valore di un calciatore adotteremmo il valore del giocatore X è la sommatoria delle sue prestazioni. Per fare il mestiere dell’osservatore è importantissimo avere la capacità di essere tecnologizzati, bisogna essere in grado di archiviare le info, saper fruire delle tecnologie di ultima generazione, con excel si può catalogare tutto ciò di cui si ha bisogno. Oggi l’area scouting di una Soc. assume un’importanza strategica e deve avere al suo interno un’area di intelligence perché oltre alle osservazioni acquisibili con l’osservazione del calciatore, vi sono informazioni diverse come storico infortuni, situazione contrattuale, l’agente, le dinamiche del mercato, gli equilibri societari ed individuazione di contatti di riferimento. (l’Udinese fu la prima in Ita a darsi un metodo e a tecnologizzare il proprio processo decisionale, adattando una sala tv dove 4/5 persone guardavano partite provenienti da campionati di tutto il mondo per 12h al giorno. Così facendo potevano arrivare prima all’informazione rispetto ai concorrenti. Visionavano 1500 partite all’anno). Grazie all’avvento delle piattaforme video come ad es Wyscout, 2008, Chiavari, è possibile monitorare tutti i campionati del mondo ed è utilizzata da tutte le Soc. che operano ad alti livelli. Queste piattaforme hanno cambiato la figura dell’osservatore ed è cambiato il budget che investe la Soc. in quanto si può andare a vedere il giocatore di persona solo nel caso in cui vi fosse la necessità di avere qualche elemento in più rispetto ad una mera visione soltanto video (avere la conferma di ciò che è stato analizzato a video). L’osservatore di oggi può lavorare in settimana grazie a questo nuovo tipo di modus e tutte le Soc. possono partire alla pari. ANALIZZIAMO UNA POSSIBILE SCHEDA: Attraverso dei report statistici vengono analizzati determinati parametri, valori. I giocatori vengono valutati attraverso un indice, il portiere ad esempio viene valutato a seconda delle parate, dei riti respinti, delle intercettazioni, delle uscite, dei falli, dei passaggi, dei lanci. Il difensore invece attraverso palloni rubati, dribbling, contrasti aerei, duelli in attacco/difesa, passaggi in area, passaggi chiave, falli e tiri in porta. Ogni aspetto di un singolo giocatore viene analizzato e catalogato e questi dati stat sono un supporto all’osservatore insieme al suo “occhiometro”. Un bravo osservatore/analista è colui che sa osservare e dalla