Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Indagine statistica sul divario di genere, Tesi di laurea di Statistica

Indagine statistica sul divario di genere

Tipologia: Tesi di laurea

2020/2021

Caricato il 13/06/2023

nicole-manza-1
nicole-manza-1 🇮🇹

1 documento

Anteprima parziale del testo

Scarica Indagine statistica sul divario di genere e più Tesi di laurea in PDF di Statistica solo su Docsity! UNIVERSITÀ CATTOLICA DEL SACRO CUORE Facoltà di Scienze Matematiche Fisiche e Naturali Corso di laurea in Matematica Gender Bias: un’indagine statistica sul divario di genere Laureanda: Nicole Manza Numero di matricola: 4811143 Relatrice: Professoressa Giulia Giantesio Anno Accademico 2020−2021 Introduzione Nel corso del ventunesimo secolo abbiamo assistito a moltissimi cambia- menti sociali, lente mutazioni e sviluppi generazionali che, a livello globale, hanno piano piano portato la popolazione mondiale ad adattarsi ad un modello sociale sempre più nuovo e avanguardista. Tantissimi sono gli aspetti tuttora in mutamento nella rete sociale, uno di questi è la questione di genere. Nel corso della storia la figura della donna ha subito profonde variazioni che l’hanno vista lentamente evolversi. Per secoli e secoli le donne hanno vissuto nell’ombra di un uomo (un marito, un padre, un fratello) e possedevano come unica caratteristica quella di essere madri e curatrici della casa. Sembrava che quello fosse l’unico posto delle quali fossero degne, eppure erano in grado di ricoprire ruoli ben più di rilievo. Con l’avanzare dei secoli si è sviluppata all’in- terno della comunità femminile una sempre maggior intraprendenza e volontà di riscatto che ha portato ad ottenere grandi traguardi nel corso della storia. Ad oggi possiamo affermare che sono ancora tante le discriminazioni di cui sono vittime le donne. 1 2 Sono infatti moltissimi gli stereotipi e le ingiustizie di genere presenti nella no- stra società e, nonostante varino di nazione in nazione, e dipendano dalla cultura e dalle usanze autoctone, restano di base aleggianti in molteplici ambiti. Nel corso di questo elaborato ci occuperemo di vagliare il gender bias presente all’interno della società moderna il quale porta alla formazione di un divario di genere. Questo fenomeno, se così si può definire, si manifesta in tante sfaccettature di- verse verso le donne: dalla privazione di alcuni diritti fondamentali, come la possibilità di divorziare senza il consenso del marito e di votare, alla disparità salariale. Quest’ultimo è un fattore decisamente emblematico alla base della questione di genere e noi ci occuperemo di studiarlo statisticamente. Si stima infatti che, in Italia, gli stipendi medi delle donne siano inferiori rispetto a quelli maschili pur ricoprendo ruoli di uguale rilevanza. Uno stereotipo che alimenta il gap di genere nel mondo del lavoro è quello che sostiene che le donne non siano portate per la matematica. Infatti sono ancora forse poche le giovani che si avvicinano al mondo delle scienze poiché poco stimolate dalla società in cui vivono. Proprio su questo verterà questa tesi dove l’obbiettivo è quello di andare ad analizzare il divario di genere all’interno di diversi ambiti. Ci serviremo dunque di strumenti statistici per valutare la sottorappresentanza femminile in diversi contesti e ne trarremo poi conclusioni quanto alla società in cui viviamo. Il seguente elaborato è suddiviso in tre macro-parti: all’interno della prima ci occuperemo di analizzare il divario di genere tramite la statistica descrittiva. In questa sezione sono forniti numeri, grafici e tabelle che permettono di avere una idea concreta del gender gap all’interno di più ambiti, quali la scuola, il lavoro e 3 le posizioni apicali. Il secondo capitolo è invece dedicato alla spiegazione di un modello statistico utilizzato per stimare l’andamento di un fenomeno tramite i dati raccolti: tale metodo è detto regressione e può essere lineare semplice o multipla a seconda del numero delle variabili indipendenti. Nel terzo capitolo vi è infine un esempio di applicazione del metodo preceden- temente spiegato volto a studiare il divario di genere riferito alle competenze finanziarie e matematiche all’interno di un campione di studenti quindicenni. I dati sfruttati per i modelli di regressione sono stati raccolti all’interno del programma PISA (Programme for International Student Assessment), un’indagine internazionale promossa dall’OEDC (in italiano OCSE Organizzazione per la Coo- perazione e lo Sviluppo Economico) che periodicamente testa alcune competenze specifiche degli studenti di differenti paesi. 6 CAPITOLO 1: Alcuni dati sul divario di genere Titoli di studio M 25-34 F 25-34 M 55-64 F 55-64 Tot 25-34 Tot 55-64 Laurea e post-Laurea 13% 19% 9% 6% 16% 8% Diploma superiore 44% 46% 20% 14% 45% 17% Licenza media 39% 31% 29% 22% 35% 25% Licenza elementare, nessun titolo 4% 4% 42% 58% 4% 50% Tabella 1.1: Tassi di scolarità per genere ed età. Fonte: Istat, Forze di lavoro- Media 2004 [1]. Come si evince dalla tabella 1.1, le donne hanno sorpassato gli uomini nel tasso di scolarizzazione alle scuole superiori e all’università. I numeri global- mente sono aumentati, ma ancor di più quelli riferiti alle studentesse; si stima infatti che nel 1950-1951 le studentesse iscritte alla scuola superiore erano solo il 7%, nel 2003-2004 sono aumentate notevolmente al 93%. Nel corso degli anni abbiamo assistito ad una redistribuzione del numero degli studenti e delle studentesse a conseguire differenti titoli di studio: Figura 1.1: Tassi di scolarità per genere Fonte: ISTAT Compendio Statistico Italiano 2004-2005[1]. Si constata immediatamente, dando un’occhiata a questi grafici, che sono in crescita i tassi delle donne a conseguire un titolo sempre più alto e, la situazione, ha subito un’inversione di marcia negli ultimi anni: se infatti fino all’inizio degli anni 2000 erano in maggioranza gli uomini ad investire di più nell’insegnamento, 1.1. Un’analisi sul divario di genere dell’Università di Macerata 7 ora sono le donne ad avere la meglio. Si può quindi concludere che, ad oggi, nel territorio nazionale siano le donne ad ottenere maggiori successi scolastici. 1.1.2 Differenze di genere nell’accesso al mercato del lavoro Occupandoci del mercato occupazionale possiamo affermare che non vi è una corrispondenza tra i successi nello studio e quelli sul lavoro per le donne. Si stima infatti che il tasso di occupazione delle diplomate (entro tre anni dal conseguimento del titolo) è del 42% contro il 53% della controparte maschile mentre per le laureate sale al 70% contro il 79% maschile. Il tasso di disoccupazione quindi è maggiore per le donne ma, per ambo i generi, aumenta man mano che scendiamo dal nord al sud Italia con risultati talvolta allarmanti. Aumenta di anno in anno il numero delle persone che scelgono di migrare verso il settentrione per cercare nuove opportunità. In ogni caso, si constata che maggiore è il titolo di studio conseguito e minore è la probabilità di non trovare un impiego. Nessun titolo* Licenza media Diploma superiore Laurea e post Tot. Uomini 8,6% 7,2% 5,6% 4% 6,4% Donne 12,9% 13,9% 9,4% 7,1% 10,5% Totale 10% 9,5% 7,3% 5,5% 8% Tabella 1.2: Tassi di disoccupazione rilevati nel 2004. Fonte:Istat, Compendio statistico italiano 2005 [1]. *sono compresi anche gli individui che hanno conseguito la licenza elementare. Si può quindi evincere dalla tabella 1.2 che la disoccupazione colpisca mag- giormente le donne, qualsiasi sia il titolo di studio. Allo stesso tempo però il divario nei tassi tra gli individui (per ambo i sessi) che non possiedono nessun titolo e quelli laureati, è assai ampio. Proprio per questo motivo sono sempre di 8 CAPITOLO 1: Alcuni dati sul divario di genere più le studentesse che scelgono di proseguire gli studi. La situazione italiana, comparata ad una panoramica europea, è tra le peg- giori quanto alla mancanza di impiego femminile. Un elenco degli stati facenti parte dell’UE con annessi i rispettivi tassi di disoc- cupazione per uomini e donne è mostrato in figura 1.2. Figura 1.2: Tassi di disoccupazione per ogni stato. Fonte: Eurostat Yearbook 2005[1]. Anche tramite questo grafico ci accorgiamo del divario di genere nei tassi di disoccupazione in più stati. Come l’Italia, anche Grecia, Spagna e Polonia si trovano in una situazione critica. Sono ben pochi gli Stati che presentano invece una situazione invertita: l’Estonia ad esempio mostra un gap a favore delle donne. 1.1. Un’analisi sul divario di genere dell’Università di Macerata 11 Attualmente la presenza di deputate all’interno del Parlamento Europeo è notevolmente aumentato e le donne ora ricoprono il 40% delle posizioni totali. La situazione italiana riguardante il divario di genere, negli anni ha vissuto un andamento altalenante dovuto all’introduzione di alcuni leggi. Con la legisla- tura XII nel 1994 è stato introdotto il sistema maggioritario-proporzionale con alternanza uomo-donna che prevedeva appunto una distribuzione più equa de- gli incarichi tra uomini e donne nella Camera dei Deputati. Nonostante questa iniziativa il numero delle donne, stimato nel 2004, al Governo in Italia resta ancora troppo modesto e risulta essere poco più del 30% sul totale che, seppur sia uno dei risultati più alti ottenuto nel territorio nazionale, resta un numero ancora decisamente troppo basso. Confrontando l’andamento degli stati dell’Unione Europea sulla composizione del parterre all’interno della Camera dei Deputati, possiamo farci un’idea della rappresentanza femminile in questo frangente. Figura 1.5: Presidenti donna e membri del Senato della Repubblica. Fonte:European Commission, Database on women and man in decision-making- 2006 [1]. 12 CAPITOLO 1: Alcuni dati sul divario di genere Anche qui vediamo svettare i pesi nordici, seguiti dalla Spagna e dal Belgio; l’Italia invece ottiene una posizione inferiore a quella della media europea. La situazione è incredibilmente simile per quanto riguarda la carica di senatori. Anche qui l’Italia si posiziona sotto la media europea, mentre alcuni paesi come Cipro e la Turchia vedono la completa assenza di donne all’interno del Senato della Repubblica. Nel 2004 in Europa ci sono tre donne Presidenti (Finlandia, Lettonia, Irlanda) e una donna Primo Ministro (Germania). In sostanza quindi abbiamo appurato quanto radicato sia il divario di genere in Europa e, in particolare, in Italia. Quest’ultima infatti si distingue, tristemente, per la scarsissima rappresentanza femminile in ambito politico, decisionale, ma anche finanziario e bancario. Anche in questi ultimi due contesti la presenza di donne è assai ridotta e rilegata a ruoli secondari rispetto a quelli ricoperti da uomini. Mentre i paesi nordici mostrano di aver abbattuto il gender gap, in tanti, troppi, altri stati resta un problema sociale ancora decisamente invalidante che deve trovare una soluzione. 1.2 Un’indagine ISTAT per studiare la parità tra i sessi Ci occupiamo ora invece di un’indagine ISTAT condotta nel 2017 [3] che fornisce un quadro molto dettagliato sulla la parità di genere in diversi ambi- ti ed è volta all’annullamento delle disuguaglianze. Risulta infatti essere tra i prioritari obbiettivi che le Nazioni Unite si sono prefissate di raggiungere entro la fine di questo decennio nell’ Agenda 2030. All’interno di quest’ultima sono definiti molteplici traguardi che le Nazioni Unite si impegneranno a conseguire; 1.2. Un’indagine ISTAT per studiare la parità tra i sessi 13 tra questi, oltre appunto allo smorzamento del divario di genere, c’è anche il raggiungimento dello sviluppo sostenibile. Cerchiamo quindi di analizzare il processo di empowerment socio-economico femminile nel nostro Paese e le sue criticità, in modo di avere chiari anche gli aspetti su cui è necessaria un’attenzione maggiore con il fine di realizzare effi- cienti politiche di genere. Come è stato appurato precedentemente, sono le donne ad ottenere maggio- ri successi scolastici, in quanto scelgono di investire di più nell’insegnamento. Allo stesso tempo però le lauree conquistate dalle donne sono raramente con- seguite nell’ambito tecnico-scientifico; sono infatti in maggioranza schiacciante gli uomini a seguire questi corsi di laurea. Il gap delle ragazze laureate in tali discipline, in Italia, risulta essere tra i più bassi d’Europa ma, nonostante ciò, i tassi di disoccupazione femminili sono ancora molto, troppo, elevati. A prescindere dal tipo di laurea, come verificato in precedenza, risultano essere sempre maggiori le percentuali delle donne senza impiego rispetto agli uomini. La causa si deve ricercare in motivazioni sociali e culturali: essendo infatti le donne ad occuparsi maggiormente della casa e dei figli, il tempo da dedicare al lavoro è sempre meno e, per questo, molte donne scelgono di mettere da parte la carriera per dedicarsi alla famiglia. Per le donne italiane laureate, il tasso di disoccupazione rilevato nel 2017 è il linea con la media europea, mentre per quelle diplomate, lo svantaggio occupa- zionale femminile è molto più accentuato. Si stima che, terminato il percorso di studi, la porzione delle giovani diplomate ad aver ottenuto un lavoro è solo del 38,7% mentre per i ragazzi si raggiunge la quota del 50,8%. Tali risultati sono assai diversi da quelli riportati dallo studio precedente; questo 16 CAPITOLO 1: Alcuni dati sul divario di genere 1.2.2 La differenziazione tra gli impieghi Fermiamoci ora ad analizzare le mansioni che svolgono frequentemente le donne. Se durante il periodo di crisi esse ricoprivano ruoli di bassa qualifica, come ba- danti e collaboratrici domestiche, con l’avvento del periodo di ripresa, abbiamo assistito ad un nuovo volto del lavoro femminile con una grande adesione al mondo dell’insegnamento, alle attività commerciali e alle professioni tecniche. Alcune donne si sono invece buttate nell’imprenditorialità: oggi si stima che le imprenditrici in Italia siano quasi 700 mila ma restano solo il 26% degli im- prenditori totali Italia. Un terzo del totale è formato da donne che gestiscono una propria impresa con a carico dei dipendenti, mentre il resto è composto lavoratrici in proprio. Tali imprese si trovano prettamente nel settore dei servizi e i cosiddetti ’altri servizi’ tra cui ristoranti, commercio e alloggio. Tendenzialmente, grazie al grado di istruzione maggiore rispetto alla contropar- te maschile, le nuove imprenditrici, oltre ad essere più giovani, sono anche più istruite. Questo è dovuto anche al fatto che il mondo del lavoro a cui accedono richiede sempre più spesso un dato titolo di studio. Vogliamo concentrarci ora sulle ragioni che portano, di base, le donne a in- traprendere meno frequentemente la carriera lavorativa. Come citato precedentemente, la responsabilità del lavoro famigliare è sbilancia- ta verso le donne: nel 2008-2009 la percentuale del carico domestico femminile era del 71,9% e, sebbene nel 2013-2014 sia diminuito al 67%, resta ancora una prerogativa quasi esclusivamente femminile che porta inevitabilmente le donne a dedicare meno tempo alla carriera lavorativa. Guardando alla totalità delle mansioni ricoperte da donne, si stima che il totale 1.2. Un’indagine ISTAT per studiare la parità tra i sessi 17 ammonti a 60 ora alla settimana tra lavoro retribuito e/o famigliare, molto più che per gli uomini. Possiamo anche affermare che con l’aumentare dell’età, e quindi tendenzialmen- te anche degli impegni famigliari, il tasso di occupazione femminile diminuisce, mentre all’aumentare del titolo di studio cresce il numero delle donne che, no- nostante abbia famiglia, sceglie di non abbandonare la carriera. Dobbiamo anche parlare di un’altra questione cruciale, la qualità del lavoro. Tramite diverse ricerche è stato appurato che anche questo fattore, in riferimen- to all’occupazione femminile, ha dei grossi limiti. Sono infatti in maggioranza donne, rispetto che gli uomini, ad avere contratti a tempo determinato, è anche molto più ampia l’incidenza delle dipendenti con una paga bassa ed è quasi tripla la quantità di occupate rispetto agli uomini ad avere un part-time invo- lontario. Occupiamoci ora dei ruoli apicali occupati da figure femminili. Come abbiamo anche in precedenza analizzato, la presenza di donne all’interno degli organi politici nazionali ed Europei sta gradualmente aumentando ma a livello regionale la situazione resta decisamente critica: nel 2015 nel totale dei Consigli regionali italiani le donne sono soltanto il 18%. Inoltre le donne ad investire la carica di sindaco sono solamente 1081 in Italia, pari al 13,5% del totale. Oltre a ciò è stato anche reso noto che le donne ottengano con ancor meno frequenza la dirigenza delle istituzioni, ad esempio sono solo il 7,2% i vertici femminili universitari, negli organi istituzionali si trova il più alto valore del- l’ambito che si aggira attorno al 21,2%. Continua a crescere rapidamente, invece, la presenza delle donne nei consigli di amministrazione delle società quotate in 18 CAPITOLO 1: Alcuni dati sul divario di genere borsa, il merito è anche degli interventi normativi appositamente pensati. Nella tabella 1.3 sono elencate le porzioni dei ruoli apicali occupati da donne, non solo quelle appena citate ma anche altre di rilievo. Ruoli apicali Percentuale femminile Parlamento italiano 30,7% Parlamento Europeo 40% Consigli regionali 18% Sindache 13,5% Presidi Universitarie 7,2% Capo attività in borsa 31,6% Autorità nella privacy 75% Autorità garante della concorrenza e del mercato 25% Consiglio superiore della magistratura 26% Corte costituzionale 21% Ambasciatrici 10,2% Tabella 1.3: Rappresentanza femminile nelle posizioni apicali. Fonte: ISTAT 2017[3]. Andiamo ora a sviscerare la questione del divario retributivo. Tirando le somme di tutto ciò che abbiamo detto finora, il gap negli stipendi è dovuto a molteplici fattori tra cui la maggior adesione femminile ai lavori part-time, i quali prevedono una paga inferiore, la minor presenza di donne in posizioni apicali, che preclude loro anche uno stipendio decisamente più cospicuo. In Italia, nel 2015, solo il 43,3% delle donne percepiva reddito da lavoro contro al 62% maschile. Se poi guardiamo al numero di laureate le percentuali salgono rispettivamente a 78,6% e 81,5%, andando ad ammortizzare il divario. Nel 2008 è stato condotto uno studio che ha permesso di concludere che il reddi- to delle donne era del 28% inferiore rispetto a quello maschile, fortunatamente poi questo gap è andato a smorzarsi nel 2014 dove è sceso al 24%. Anche in questo caso il divario diminuisce con l’aumentare del titolo di studio: le donne con un basso titolo di studio guadagnano il 40% in meno rispetto agli Capitolo 2 Regressione lineare Iniziamo facendo uno studio della regressione lineare semplice che sarà prope- deutico alla regressione multipla; quest’ultima è infatti un’estensione del caso lineare a quello in cui vengono utilizzate due o più variabili indipendenti. La differenza tra questi risiede infatti nel numero delle variabili indipendenti, chia- mate anche esplicative: nel caso lineare semplice ne esiste una sola, nel caso multiplo ne esistono invece due o più. In entrambi i casi abbiamo invece una sola variabile risposta, ovvero quella dipendente. 2.1 Regressione lineare semplice Il fine ultimo della regressione è quello di formalizzare dati campionati da una popolazione idealmente infinita ed estrarne quante più informazioni possi- bili. Elemento fondamentale nella analisi dei dati raccolti è il diagramma di dispersione. 21 22 CAPITOLO 2: Regressione lineare Sull’asse delle ascisse vengono inseriti i dati raccolti, quindi le variabili esplica- tive, e sull’asse delle ordinate vengono invece rappresentate le variabili risposta. Figura 2.1: Esempio di un diagramma di dispersione. Questo diagramma risulta molto utile in quanto, visivamente, rende l’idea di come è la distribuzione dei dati che vogliamo studiare. Tramite la regressione, tentiamo di ottenere una funzione che, passando vicino ai punti trovati nel grafico, si adatti al meglio all’andamento dei valori campionati; è dunque nostro obbiettivo prevederne il comportamento nei punti non noti. Capita spesso che sia molto complicato trovare una mappa che rappresenti adeguatamente la situazione a cui dobbiamo approcciarci. Essa può presentare molteplici oscillazioni e non costituire un modello affidabile su cui basare la nostra analisi; è quindi notevolmente più agevole, in certi casi, utilizzare una retta, detta retta di regressione, la quale, seppur non passando per tutti i punti rappresentati nel piano, vada a minimizzare al massimo la distanza da ciascuno di essi. Iniziamo a definire l’equazione della retta di regressione che, banalmente, sarà del tipo: y = βx + α (2.1) 2.1. Regressione lineare semplice 23 Qui il parametro α rappresenta l’intercetta (la quantità di y quando x è 0) e β è il coefficiente angolare della retta di regressione, che indica quanto varia in media y all’aumento di una unità di x. Se i valori campionati fossero solo due, oppure se fossero perfettamente allineati, il polinomio interpolante risulterebbe essere esattamente una retta. Purtroppo o per fortuna però, difficilmente questo accade e, di conseguenza bisogna tener conto di eventuali approssimazioni. Definiamo l’equazione della retta di regressione: ŷi = βxi + α (2.2) dove i termini ŷi rappresentano i valori previsti tramite lo stimatore stesso, mentre gli xi sono quelli osservati sperimentalmente. Si può ora definire l’errore: ei = yi − ŷi (2.3) Esso rappresenta dunque l’errore commesso su ciascuna osservazione. 2.1.1 Metodo dei minimi quadrati Una delle tecniche per minimizzare l’errore ottenuto nella (2.3) è utilizzare il metodo dei minimi quadrati: Sq = n∑ k=1 e2 i = n∑ k=1 (yi − ŷi)2 = n∑ k=1 (yi − βxi − α)2 (2.4) Il termine Sq rappresenta lo scarto quadratico e la retta ottimale è quindi quella che minimizza quest’ultimo, ovvero che minimizza il quadrato dell’errore ei rendendo altrettanto minima la distanza sopracitata. La scelta di utilizzare la 26 CAPITOLO 2: Regressione lineare Ci basta ora ricordare come sono definite la cov(x, y) e la var(x): cov(x, y) = E[YX] − E[Y]E[X] var(x) = E[X2] − E[X]2 Possiamo dunque concludere  α = y − βx β = cov(x,y) var(x) (2.7) Ciò significa che, per minimizzare l’errore è necessario che i coefficienti α e β siano in questa forma precisa. Vogliamo ora comprendere cosa accade al variare dei parametri appena trovati ma, prima, rinominiamoli:  α̂ = y − β̂x β̂ = cov(x,y) var(x) (2.8) Il cappello sulle due variabili sta a significare che i valori sono frutto della stima mediante il metodo dei minimi quadrati. Andiamo ora ad analizzare cosa accade al variare del segno del parametro β, cioè l’inclinazione della retta di regressione: • se β>0 allora tra x e y intercorre una relazione di proporzionalità diretta, quindi a crescere delle ascisse, riscontriamo una crescita delle ordinate; • se β<0 possiamo parlare invece di una relazione inversa, ovvero, al crescere delle x assisteremo al decrescere delle y; 2.1. Regressione lineare semplice 27 • se, infine, β=0 si può affermare che non vi è relazione tra x e y. Riassumendo dunque, il metodo dei minimi quadrati è indispensabile nel campo della regressione lineare, in quanto è il modo, in genere, più comodo (non l’unico) per definire una retta che approssimi al meglio l’andamento dei dati campionati. Ci è quindi possibile comprendere il comportamento una variabile in funzione dell’altra. 2.1.2 Coefficiente di determinazione Il nostro scopo è quello di ottenere un modo per minimizzare la distanza della (2.3) tra il valore delle ordinate atteso e quello effettivo. Minore è questo errore, maggiore è la bontà del nostro modello. Esiste anche un parametro che ci consente di determinare l’efficacia dello stima- tore preso in analisi; questo è il coefficiente di determinazione R2 che rappresenta l’indice della bontà di adattamento. Esso si esprime tramite il rapporto tra la devianza del modello (la somma dei quadrati degli scarti dalla media) e la devianza totale della y: R2 := σ2 modello σ2 y = n∑ k=1 (ŷi − y)2 n∑ k=1 (yi − y)2 (2.9) Prima di parlare della sua utilità, cerchiamo di capire il significato dei termini che compongono questa scrittura. La devianza essenzialmente rappresenta la varianza non divisa per il numero dei dati. 28 CAPITOLO 2: Regressione lineare Definiamo devianza residua la quantità: σ2 residuo := n∑ k=1 e2 i = n∑ k=1 (yi − ŷi)2, (2.10) che prende la sua denominazione dal fatto che deriva dai residui di regressione. Introduciamo ora, invece, la devianza spiegata che deve il nome al modello, in quanto devianza dei valori stimati da quest’ultimo; rappresenta la parte di variabilità della y descritta dal modello di regressione e si indica come: σ2 modello := n∑ k=1 (ŷi − y)2 (2.11) I due termini della (2.10) e (2.11) danno origine alla devianza della variabile y: σ2 y := σ2 modello + σ2 residuo Il significato di questa scrittura si può vedere anche graficamente Figura 2.2: Rappresentazione grafica della devianza di y. Fatta questa breve digressione, riusciamo meglio a capire il significato della formula (2.9) che introduce R2, coefficiente di determinazione. 2.2. Regressione lineare multipla 31 Possiamo dunque rivedere il sistema di equazioni della (2.14) nel seguente modo Y = βX + ε. (2.16) 2.2.1 Metodo dei minimi quadrati Come nel caso lineare, questo metodo ci risulta indispensabile nella determi- nazione dei coefficienti di regressione. Anche in questa occasione cercheremo di minimizzare i β0, β1, ...βp ottenendo i b0, b1, ...bp. Iniziamo scrivendo Sq: Sq = n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)2 (2.17) Esattamente come nel caso lineare, per trovare il minimo di questa quantità procediamo facendone le derivate parziali e ponendole poi uguali a zero.  −2 n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)(−1) = 0 −2 n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)(−xi1) = 0 ... −2 n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)(−xip) = 0 b0n + b1 n∑ i=1 xi1 + ... + bp n∑ i=1 xip = n∑ i=1 yi b0 n∑ i=1 xi1 + b1 n∑ i=1 x2 i1 + ... + bp n∑ i=1 xi1xip = n∑ i=1 xi1yi ... b0 n∑ i=1 xip + b1 n∑ i=1 xi1xip + ... + bp n∑ i=1 x2 ip = n∑ i=1 xipyi (2.18) 32 CAPITOLO 2: Regressione lineare Considerando ora la matrice X dei valori osservati delle variabili esplicative, come nella (2.15), e la sua trasposta X’: X =  1 x11 x12 . . . x1p 1 x21 x22 . . . x2p ... ... ... . . . ... 1 xn1 xn2 . . . xnp  , X’ =  1 1 1 . . . 1 x11 x21 x31 . . . xn1 ... ... ... . . . ... x1p x2p x3p . . . xnp  possiamo scrivere il prodotto tra le due X’X =  n n∑ i=1 xi1 . . . n∑ i=1 xip n∑ i=1 xi1 n∑ i=1 x2 i1 . . . n∑ i=1 xi1xip ... ... . . . ... n∑ i=1 xip n∑ i=1 xi1xip . . . n∑ i=1 x2 ip  Introduciamo ora il vettore dei valori osservati della variabile risposta y y =  y1 y2 y3 ... yn  2.2. Regressione lineare multipla 33 Moltiplichiamolo ora per la matrice X’ e otteniamo il seguente vettore X’y =  n∑ i=1 yi n∑ i=1 xi1yi ... n∑ i=1 xipyi  Si può dunque scrivere il sistema precedente visto nella (2.18) in forma matri- ciale: X’Xb=X’y Moltiplicando poi ambo i membri per (X’X)−1 si ottiene la stima dei minimi quadrati dei coefficienti di regressione: b = (X′X)−1X′y (2.19) Abbiamo così trovato la forma dei coefficienti di regressione che minimizza il termine Sq. A questo punto possiamo scrivere l’equazione del modello ove sono stati minimizzati i coefficienti di regressione: ŷ = b0 + b1x1 + ... + bpxp (2.20) Questa, dal punto di vista geometrico, è l’equazione di un iperpiano nello spazio (p + 1) − dimensionale. 36 CAPITOLO 2: Regressione lineare Questa è equivalente alla scrittura seguente y′y − y 2 = ŷ′ ŷ − y 2 + e′e (2.28) Il termine a sinistra dell’uguale, per come è formulato, risulta essere appunto la devianza totale di Y, mentre ŷ′ ŷ − y 2 rappresenta la devianza spiegata. L’ultimo addendo dell’equazione è il prodotto tra il vettore trasposto dei residui e il vettore stesso della (2.24) che quindi non è altro che n∑ i=1 (yi − ŷi)2. In conclusione riusciamo ad ottenere la scrittura iniziale della (2.22): n∑ i=1 (yi − y)2 = n∑ i=1 (ŷi − y)2 + n∑ i=1 (yi − ŷi)2 2.2.2 Coefficiente di determinazione Come abbiamo visto nella (2.12), cerchiamo ora di quantificare la bontà dello stimatore preso in esame,tramite il coefficiente di determinazione. R2 := σ2 modello σ2 y = n∑ i=1 (ŷi − y)2 n∑ i=1 (yi − y)2 = 1 − n∑ i=1 (yi − ŷi)2 n∑ i=1 (yi − yi)2 (2.29) Si esprime con questo termine il rapporto tra la variabile risposta e le va- riabili esplicative e può assumere valori tra 0 e 1. Più il valore è vicino ad 1 e maggiore sarà la precisione dello stimatore considerato; se invece prende il valore 0, ovvero ŷi = y, la conoscenza dei valori delle variabili esplicative non contribuisce in nessun modo alla previsione del valore della variabile ri- sposta e, conseguentemente, possiamo considerare pessimo uno stimatore con R2 = 0. Tanto maggiore è il valore di questo coefficiente quanto maggiore sarà l’adattamento del modello ai dati. 2.2. Regressione lineare multipla 37 2.2.3 Dall’iperpiano alla retta di regressione Come già detto, la differenza dal caso lineare a quello multiplo risiede nel fatto che, nel primo, vi è una sola variabile esplicativa e, nel secondo, due o più. In situazione di linearità abbiamo p = 1 e quindi la matrice X risulta essere: X =  1 x11 1 x21 ... 1 x1p  Il prodotto con la sua trasposta è: X’X =  1 1 . . . 1 x11 x21 . . . xn1   1 x11 1 x12 ... ... 1 x1n  =  n n∑ i=1 xi1 n∑ i=1 xi1 n∑ i=1 x2 i1  Si ha, inoltre: (X’X)−1 = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  n∑ i=1 x2 i1 − n∑ i=1 xi1 − n∑ i=1 xi1 n  Inserendo la scrittura appena ottenuta nella formula (2.19) vista in precedenza b = (X′X)−1X′y otteniamo: 38 CAPITOLO 2: Regressione lineare b = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  n∑ i=1 x2 i1 − n∑ i=1 xi1 − n∑ i=1 xi1 n   1 1 . . . 1 x11 x21 . . . xn1   y1 y2 ... yn  = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  n∑ i=1 x2 i1 − n∑ i=1 xi1 − n∑ i=1 xi1 n   n∑ i=1 yi n∑ i=1 xi1yi  = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  0 − n∑ i=1 xi1yi + n n∑ i=1 xi1yi  Arriviamo dunque alla forma finale di b: b = n∑ i=1 xi1yi(n − 1) n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2 (2.30) che rappresenta il coefficiente di regressione della retta. 2.2.4 Proprietà degli stimatori dei minimi quadrati Le variabili dipendenti viste nel sistema (2.14) possono assumere la prospet- tiva di variabili casuali piuttosto che numeri e, conseguentemente, la scrittura della (2.19) diventa: B = (X′X)−1X′Y (2.31) All’interno della (2.31) Y e B sono dei vettori di variabili aleatorie e le componenti del primo sono indipendenti e omoschedatiche, ovvero con la stessa varianza, UNIVERSITÀ CATTOLICA DEL SACRO CUORE Facoltà di Scienze Matematiche Fisiche e Naturali Corso di laurea in Matematica Gender Bias: un’indagine statistica sul divario di genere Laureanda: Nicole Manza Numero di matricola: 4811143 Relatrice: Professoressa Giulia Giantesio Anno Accademico 2020−2021 Introduzione Nel corso del ventunesimo secolo abbiamo assistito a moltissimi cambia- menti sociali, lente mutazioni e sviluppi generazionali che, a livello globale, hanno piano piano portato la popolazione mondiale ad adattarsi ad un modello sociale sempre più nuovo e avanguardista. Tantissimi sono gli aspetti tuttora in mutamento nella rete sociale, uno di questi è la questione di genere. Nel corso della storia la figura della donna ha subito profonde variazioni che l’hanno vista lentamente evolversi. Per secoli e secoli le donne hanno vissuto nell’ombra di un uomo (un marito, un padre, un fratello) e possedevano come unica caratteristica quella di essere madri e curatrici della casa. Sembrava che quello fosse l’unico posto delle quali fossero degne, eppure erano in grado di ricoprire ruoli ben più di rilievo. Con l’avanzare dei secoli si è sviluppata all’in- terno della comunità femminile una sempre maggior intraprendenza e volontà di riscatto che ha portato ad ottenere grandi traguardi nel corso della storia. Ad oggi possiamo affermare che sono ancora tante le discriminazioni di cui sono vittime le donne. 1 2 Sono infatti moltissimi gli stereotipi e le ingiustizie di genere presenti nella no- stra società e, nonostante varino di nazione in nazione, e dipendano dalla cultura e dalle usanze autoctone, restano di base aleggianti in molteplici ambiti. Nel corso di questo elaborato ci occuperemo di vagliare il gender bias presente all’interno della società moderna il quale porta alla formazione di un divario di genere. Questo fenomeno, se così si può definire, si manifesta in tante sfaccettature di- verse verso le donne: dalla privazione di alcuni diritti fondamentali, come la possibilità di divorziare senza il consenso del marito e di votare, alla disparità salariale. Quest’ultimo è un fattore decisamente emblematico alla base della questione di genere e noi ci occuperemo di studiarlo statisticamente. Si stima infatti che, in Italia, gli stipendi medi delle donne siano inferiori rispetto a quelli maschili pur ricoprendo ruoli di uguale rilevanza. Uno stereotipo che alimenta il gap di genere nel mondo del lavoro è quello che sostiene che le donne non siano portate per la matematica. Infatti sono ancora forse poche le giovani che si avvicinano al mondo delle scienze poiché poco stimolate dalla società in cui vivono. Proprio su questo verterà questa tesi dove l’obbiettivo è quello di andare ad analizzare il divario di genere all’interno di diversi ambiti. Ci serviremo dunque di strumenti statistici per valutare la sottorappresentanza femminile in diversi contesti e ne trarremo poi conclusioni quanto alla società in cui viviamo. Il seguente elaborato è suddiviso in tre macro-parti: all’interno della prima ci occuperemo di analizzare il divario di genere tramite la statistica descrittiva. In questa sezione sono forniti numeri, grafici e tabelle che permettono di avere una idea concreta del gender gap all’interno di più ambiti, quali la scuola, il lavoro e 3 le posizioni apicali. Il secondo capitolo è invece dedicato alla spiegazione di un modello statistico utilizzato per stimare l’andamento di un fenomeno tramite i dati raccolti: tale metodo è detto regressione e può essere lineare semplice o multipla a seconda del numero delle variabili indipendenti. Nel terzo capitolo vi è infine un esempio di applicazione del metodo preceden- temente spiegato volto a studiare il divario di genere riferito alle competenze finanziarie e matematiche all’interno di un campione di studenti quindicenni. I dati sfruttati per i modelli di regressione sono stati raccolti all’interno del programma PISA (Programme for International Student Assessment), un’indagine internazionale promossa dall’OEDC (in italiano OCSE Organizzazione per la Coo- perazione e lo Sviluppo Economico) che periodicamente testa alcune competenze specifiche degli studenti di differenti paesi. 6 CAPITOLO 1: Alcuni dati sul divario di genere Titoli di studio M 25-34 F 25-34 M 55-64 F 55-64 Tot 25-34 Tot 55-64 Laurea e post-Laurea 13% 19% 9% 6% 16% 8% Diploma superiore 44% 46% 20% 14% 45% 17% Licenza media 39% 31% 29% 22% 35% 25% Licenza elementare, nessun titolo 4% 4% 42% 58% 4% 50% Tabella 1.1: Tassi di scolarità per genere ed età. Fonte: Istat, Forze di lavoro- Media 2004 [1]. Come si evince dalla tabella 1.1, le donne hanno sorpassato gli uomini nel tasso di scolarizzazione alle scuole superiori e all’università. I numeri global- mente sono aumentati, ma ancor di più quelli riferiti alle studentesse; si stima infatti che nel 1950-1951 le studentesse iscritte alla scuola superiore erano solo il 7%, nel 2003-2004 sono aumentate notevolmente al 93%. Nel corso degli anni abbiamo assistito ad una redistribuzione del numero degli studenti e delle studentesse a conseguire differenti titoli di studio: Figura 1.1: Tassi di scolarità per genere Fonte: ISTAT Compendio Statistico Italiano 2004-2005[1]. Si constata immediatamente, dando un’occhiata a questi grafici, che sono in crescita i tassi delle donne a conseguire un titolo sempre più alto e, la situazione, ha subito un’inversione di marcia negli ultimi anni: se infatti fino all’inizio degli anni 2000 erano in maggioranza gli uomini ad investire di più nell’insegnamento, 1.1. Un’analisi sul divario di genere dell’Università di Macerata 7 ora sono le donne ad avere la meglio. Si può quindi concludere che, ad oggi, nel territorio nazionale siano le donne ad ottenere maggiori successi scolastici. 1.1.2 Differenze di genere nell’accesso al mercato del lavoro Occupandoci del mercato occupazionale possiamo affermare che non vi è una corrispondenza tra i successi nello studio e quelli sul lavoro per le donne. Si stima infatti che il tasso di occupazione delle diplomate (entro tre anni dal conseguimento del titolo) è del 42% contro il 53% della controparte maschile mentre per le laureate sale al 70% contro il 79% maschile. Il tasso di disoccupazione quindi è maggiore per le donne ma, per ambo i generi, aumenta man mano che scendiamo dal nord al sud Italia con risultati talvolta allarmanti. Aumenta di anno in anno il numero delle persone che scelgono di migrare verso il settentrione per cercare nuove opportunità. In ogni caso, si constata che maggiore è il titolo di studio conseguito e minore è la probabilità di non trovare un impiego. Nessun titolo* Licenza media Diploma superiore Laurea e post Tot. Uomini 8,6% 7,2% 5,6% 4% 6,4% Donne 12,9% 13,9% 9,4% 7,1% 10,5% Totale 10% 9,5% 7,3% 5,5% 8% Tabella 1.2: Tassi di disoccupazione rilevati nel 2004. Fonte:Istat, Compendio statistico italiano 2005 [1]. *sono compresi anche gli individui che hanno conseguito la licenza elementare. Si può quindi evincere dalla tabella 1.2 che la disoccupazione colpisca mag- giormente le donne, qualsiasi sia il titolo di studio. Allo stesso tempo però il divario nei tassi tra gli individui (per ambo i sessi) che non possiedono nessun titolo e quelli laureati, è assai ampio. Proprio per questo motivo sono sempre di 8 CAPITOLO 1: Alcuni dati sul divario di genere più le studentesse che scelgono di proseguire gli studi. La situazione italiana, comparata ad una panoramica europea, è tra le peg- giori quanto alla mancanza di impiego femminile. Un elenco degli stati facenti parte dell’UE con annessi i rispettivi tassi di disoc- cupazione per uomini e donne è mostrato in figura 1.2. Figura 1.2: Tassi di disoccupazione per ogni stato. Fonte: Eurostat Yearbook 2005[1]. Anche tramite questo grafico ci accorgiamo del divario di genere nei tassi di disoccupazione in più stati. Come l’Italia, anche Grecia, Spagna e Polonia si trovano in una situazione critica. Sono ben pochi gli Stati che presentano invece una situazione invertita: l’Estonia ad esempio mostra un gap a favore delle donne. 1.1. Un’analisi sul divario di genere dell’Università di Macerata 11 Attualmente la presenza di deputate all’interno del Parlamento Europeo è notevolmente aumentato e le donne ora ricoprono il 40% delle posizioni totali. La situazione italiana riguardante il divario di genere, negli anni ha vissuto un andamento altalenante dovuto all’introduzione di alcuni leggi. Con la legisla- tura XII nel 1994 è stato introdotto il sistema maggioritario-proporzionale con alternanza uomo-donna che prevedeva appunto una distribuzione più equa de- gli incarichi tra uomini e donne nella Camera dei Deputati. Nonostante questa iniziativa il numero delle donne, stimato nel 2004, al Governo in Italia resta ancora troppo modesto e risulta essere poco più del 30% sul totale che, seppur sia uno dei risultati più alti ottenuto nel territorio nazionale, resta un numero ancora decisamente troppo basso. Confrontando l’andamento degli stati dell’Unione Europea sulla composizione del parterre all’interno della Camera dei Deputati, possiamo farci un’idea della rappresentanza femminile in questo frangente. Figura 1.5: Presidenti donna e membri del Senato della Repubblica. Fonte:European Commission, Database on women and man in decision-making- 2006 [1]. 12 CAPITOLO 1: Alcuni dati sul divario di genere Anche qui vediamo svettare i pesi nordici, seguiti dalla Spagna e dal Belgio; l’Italia invece ottiene una posizione inferiore a quella della media europea. La situazione è incredibilmente simile per quanto riguarda la carica di senatori. Anche qui l’Italia si posiziona sotto la media europea, mentre alcuni paesi come Cipro e la Turchia vedono la completa assenza di donne all’interno del Senato della Repubblica. Nel 2004 in Europa ci sono tre donne Presidenti (Finlandia, Lettonia, Irlanda) e una donna Primo Ministro (Germania). In sostanza quindi abbiamo appurato quanto radicato sia il divario di genere in Europa e, in particolare, in Italia. Quest’ultima infatti si distingue, tristemente, per la scarsissima rappresentanza femminile in ambito politico, decisionale, ma anche finanziario e bancario. Anche in questi ultimi due contesti la presenza di donne è assai ridotta e rilegata a ruoli secondari rispetto a quelli ricoperti da uomini. Mentre i paesi nordici mostrano di aver abbattuto il gender gap, in tanti, troppi, altri stati resta un problema sociale ancora decisamente invalidante che deve trovare una soluzione. 1.2 Un’indagine ISTAT per studiare la parità tra i sessi Ci occupiamo ora invece di un’indagine ISTAT condotta nel 2017 [3] che fornisce un quadro molto dettagliato sulla la parità di genere in diversi ambi- ti ed è volta all’annullamento delle disuguaglianze. Risulta infatti essere tra i prioritari obbiettivi che le Nazioni Unite si sono prefissate di raggiungere entro la fine di questo decennio nell’ Agenda 2030. All’interno di quest’ultima sono definiti molteplici traguardi che le Nazioni Unite si impegneranno a conseguire; 1.2. Un’indagine ISTAT per studiare la parità tra i sessi 13 tra questi, oltre appunto allo smorzamento del divario di genere, c’è anche il raggiungimento dello sviluppo sostenibile. Cerchiamo quindi di analizzare il processo di empowerment socio-economico femminile nel nostro Paese e le sue criticità, in modo di avere chiari anche gli aspetti su cui è necessaria un’attenzione maggiore con il fine di realizzare effi- cienti politiche di genere. Come è stato appurato precedentemente, sono le donne ad ottenere maggio- ri successi scolastici, in quanto scelgono di investire di più nell’insegnamento. Allo stesso tempo però le lauree conquistate dalle donne sono raramente con- seguite nell’ambito tecnico-scientifico; sono infatti in maggioranza schiacciante gli uomini a seguire questi corsi di laurea. Il gap delle ragazze laureate in tali discipline, in Italia, risulta essere tra i più bassi d’Europa ma, nonostante ciò, i tassi di disoccupazione femminili sono ancora molto, troppo, elevati. A prescindere dal tipo di laurea, come verificato in precedenza, risultano essere sempre maggiori le percentuali delle donne senza impiego rispetto agli uomini. La causa si deve ricercare in motivazioni sociali e culturali: essendo infatti le donne ad occuparsi maggiormente della casa e dei figli, il tempo da dedicare al lavoro è sempre meno e, per questo, molte donne scelgono di mettere da parte la carriera per dedicarsi alla famiglia. Per le donne italiane laureate, il tasso di disoccupazione rilevato nel 2017 è il linea con la media europea, mentre per quelle diplomate, lo svantaggio occupa- zionale femminile è molto più accentuato. Si stima che, terminato il percorso di studi, la porzione delle giovani diplomate ad aver ottenuto un lavoro è solo del 38,7% mentre per i ragazzi si raggiunge la quota del 50,8%. Tali risultati sono assai diversi da quelli riportati dallo studio precedente; questo 16 CAPITOLO 1: Alcuni dati sul divario di genere 1.2.2 La differenziazione tra gli impieghi Fermiamoci ora ad analizzare le mansioni che svolgono frequentemente le donne. Se durante il periodo di crisi esse ricoprivano ruoli di bassa qualifica, come ba- danti e collaboratrici domestiche, con l’avvento del periodo di ripresa, abbiamo assistito ad un nuovo volto del lavoro femminile con una grande adesione al mondo dell’insegnamento, alle attività commerciali e alle professioni tecniche. Alcune donne si sono invece buttate nell’imprenditorialità: oggi si stima che le imprenditrici in Italia siano quasi 700 mila ma restano solo il 26% degli im- prenditori totali Italia. Un terzo del totale è formato da donne che gestiscono una propria impresa con a carico dei dipendenti, mentre il resto è composto lavoratrici in proprio. Tali imprese si trovano prettamente nel settore dei servizi e i cosiddetti ’altri servizi’ tra cui ristoranti, commercio e alloggio. Tendenzialmente, grazie al grado di istruzione maggiore rispetto alla contropar- te maschile, le nuove imprenditrici, oltre ad essere più giovani, sono anche più istruite. Questo è dovuto anche al fatto che il mondo del lavoro a cui accedono richiede sempre più spesso un dato titolo di studio. Vogliamo concentrarci ora sulle ragioni che portano, di base, le donne a in- traprendere meno frequentemente la carriera lavorativa. Come citato precedentemente, la responsabilità del lavoro famigliare è sbilancia- ta verso le donne: nel 2008-2009 la percentuale del carico domestico femminile era del 71,9% e, sebbene nel 2013-2014 sia diminuito al 67%, resta ancora una prerogativa quasi esclusivamente femminile che porta inevitabilmente le donne a dedicare meno tempo alla carriera lavorativa. Guardando alla totalità delle mansioni ricoperte da donne, si stima che il totale 1.2. Un’indagine ISTAT per studiare la parità tra i sessi 17 ammonti a 60 ora alla settimana tra lavoro retribuito e/o famigliare, molto più che per gli uomini. Possiamo anche affermare che con l’aumentare dell’età, e quindi tendenzialmen- te anche degli impegni famigliari, il tasso di occupazione femminile diminuisce, mentre all’aumentare del titolo di studio cresce il numero delle donne che, no- nostante abbia famiglia, sceglie di non abbandonare la carriera. Dobbiamo anche parlare di un’altra questione cruciale, la qualità del lavoro. Tramite diverse ricerche è stato appurato che anche questo fattore, in riferimen- to all’occupazione femminile, ha dei grossi limiti. Sono infatti in maggioranza donne, rispetto che gli uomini, ad avere contratti a tempo determinato, è anche molto più ampia l’incidenza delle dipendenti con una paga bassa ed è quasi tripla la quantità di occupate rispetto agli uomini ad avere un part-time invo- lontario. Occupiamoci ora dei ruoli apicali occupati da figure femminili. Come abbiamo anche in precedenza analizzato, la presenza di donne all’interno degli organi politici nazionali ed Europei sta gradualmente aumentando ma a livello regionale la situazione resta decisamente critica: nel 2015 nel totale dei Consigli regionali italiani le donne sono soltanto il 18%. Inoltre le donne ad investire la carica di sindaco sono solamente 1081 in Italia, pari al 13,5% del totale. Oltre a ciò è stato anche reso noto che le donne ottengano con ancor meno frequenza la dirigenza delle istituzioni, ad esempio sono solo il 7,2% i vertici femminili universitari, negli organi istituzionali si trova il più alto valore del- l’ambito che si aggira attorno al 21,2%. Continua a crescere rapidamente, invece, la presenza delle donne nei consigli di amministrazione delle società quotate in 18 CAPITOLO 1: Alcuni dati sul divario di genere borsa, il merito è anche degli interventi normativi appositamente pensati. Nella tabella 1.3 sono elencate le porzioni dei ruoli apicali occupati da donne, non solo quelle appena citate ma anche altre di rilievo. Ruoli apicali Percentuale femminile Parlamento italiano 30,7% Parlamento Europeo 40% Consigli regionali 18% Sindache 13,5% Presidi Universitarie 7,2% Capo attività in borsa 31,6% Autorità nella privacy 75% Autorità garante della concorrenza e del mercato 25% Consiglio superiore della magistratura 26% Corte costituzionale 21% Ambasciatrici 10,2% Tabella 1.3: Rappresentanza femminile nelle posizioni apicali. Fonte: ISTAT 2017[3]. Andiamo ora a sviscerare la questione del divario retributivo. Tirando le somme di tutto ciò che abbiamo detto finora, il gap negli stipendi è dovuto a molteplici fattori tra cui la maggior adesione femminile ai lavori part-time, i quali prevedono una paga inferiore, la minor presenza di donne in posizioni apicali, che preclude loro anche uno stipendio decisamente più cospicuo. In Italia, nel 2015, solo il 43,3% delle donne percepiva reddito da lavoro contro al 62% maschile. Se poi guardiamo al numero di laureate le percentuali salgono rispettivamente a 78,6% e 81,5%, andando ad ammortizzare il divario. Nel 2008 è stato condotto uno studio che ha permesso di concludere che il reddi- to delle donne era del 28% inferiore rispetto a quello maschile, fortunatamente poi questo gap è andato a smorzarsi nel 2014 dove è sceso al 24%. Anche in questo caso il divario diminuisce con l’aumentare del titolo di studio: le donne con un basso titolo di studio guadagnano il 40% in meno rispetto agli Capitolo 2 Regressione lineare Iniziamo facendo uno studio della regressione lineare semplice che sarà prope- deutico alla regressione multipla; quest’ultima è infatti un’estensione del caso lineare a quello in cui vengono utilizzate due o più variabili indipendenti. La differenza tra questi risiede infatti nel numero delle variabili indipendenti, chia- mate anche esplicative: nel caso lineare semplice ne esiste una sola, nel caso multiplo ne esistono invece due o più. In entrambi i casi abbiamo invece una sola variabile risposta, ovvero quella dipendente. 2.1 Regressione lineare semplice Il fine ultimo della regressione è quello di formalizzare dati campionati da una popolazione idealmente infinita ed estrarne quante più informazioni possi- bili. Elemento fondamentale nella analisi dei dati raccolti è il diagramma di dispersione. 21 22 CAPITOLO 2: Regressione lineare Sull’asse delle ascisse vengono inseriti i dati raccolti, quindi le variabili esplica- tive, e sull’asse delle ordinate vengono invece rappresentate le variabili risposta. Figura 2.1: Esempio di un diagramma di dispersione. Questo diagramma risulta molto utile in quanto, visivamente, rende l’idea di come è la distribuzione dei dati che vogliamo studiare. Tramite la regressione, tentiamo di ottenere una funzione che, passando vicino ai punti trovati nel grafico, si adatti al meglio all’andamento dei valori campionati; è dunque nostro obbiettivo prevederne il comportamento nei punti non noti. Capita spesso che sia molto complicato trovare una mappa che rappresenti adeguatamente la situazione a cui dobbiamo approcciarci. Essa può presentare molteplici oscillazioni e non costituire un modello affidabile su cui basare la nostra analisi; è quindi notevolmente più agevole, in certi casi, utilizzare una retta, detta retta di regressione, la quale, seppur non passando per tutti i punti rappresentati nel piano, vada a minimizzare al massimo la distanza da ciascuno di essi. Iniziamo a definire l’equazione della retta di regressione che, banalmente, sarà del tipo: y = βx + α (2.1) 2.1. Regressione lineare semplice 23 Qui il parametro α rappresenta l’intercetta (la quantità di y quando x è 0) e β è il coefficiente angolare della retta di regressione, che indica quanto varia in media y all’aumento di una unità di x. Se i valori campionati fossero solo due, oppure se fossero perfettamente allineati, il polinomio interpolante risulterebbe essere esattamente una retta. Purtroppo o per fortuna però, difficilmente questo accade e, di conseguenza bisogna tener conto di eventuali approssimazioni. Definiamo l’equazione della retta di regressione: ŷi = βxi + α (2.2) dove i termini ŷi rappresentano i valori previsti tramite lo stimatore stesso, mentre gli xi sono quelli osservati sperimentalmente. Si può ora definire l’errore: ei = yi − ŷi (2.3) Esso rappresenta dunque l’errore commesso su ciascuna osservazione. 2.1.1 Metodo dei minimi quadrati Una delle tecniche per minimizzare l’errore ottenuto nella (2.3) è utilizzare il metodo dei minimi quadrati: Sq = n∑ k=1 e2 i = n∑ k=1 (yi − ŷi)2 = n∑ k=1 (yi − βxi − α)2 (2.4) Il termine Sq rappresenta lo scarto quadratico e la retta ottimale è quindi quella che minimizza quest’ultimo, ovvero che minimizza il quadrato dell’errore ei rendendo altrettanto minima la distanza sopracitata. La scelta di utilizzare la 26 CAPITOLO 2: Regressione lineare Ci basta ora ricordare come sono definite la cov(x, y) e la var(x): cov(x, y) = E[YX] − E[Y]E[X] var(x) = E[X2] − E[X]2 Possiamo dunque concludere  α = y − βx β = cov(x,y) var(x) (2.7) Ciò significa che, per minimizzare l’errore è necessario che i coefficienti α e β siano in questa forma precisa. Vogliamo ora comprendere cosa accade al variare dei parametri appena trovati ma, prima, rinominiamoli:  α̂ = y − β̂x β̂ = cov(x,y) var(x) (2.8) Il cappello sulle due variabili sta a significare che i valori sono frutto della stima mediante il metodo dei minimi quadrati. Andiamo ora ad analizzare cosa accade al variare del segno del parametro β, cioè l’inclinazione della retta di regressione: • se β>0 allora tra x e y intercorre una relazione di proporzionalità diretta, quindi a crescere delle ascisse, riscontriamo una crescita delle ordinate; • se β<0 possiamo parlare invece di una relazione inversa, ovvero, al crescere delle x assisteremo al decrescere delle y; 2.1. Regressione lineare semplice 27 • se, infine, β=0 si può affermare che non vi è relazione tra x e y. Riassumendo dunque, il metodo dei minimi quadrati è indispensabile nel campo della regressione lineare, in quanto è il modo, in genere, più comodo (non l’unico) per definire una retta che approssimi al meglio l’andamento dei dati campionati. Ci è quindi possibile comprendere il comportamento una variabile in funzione dell’altra. 2.1.2 Coefficiente di determinazione Il nostro scopo è quello di ottenere un modo per minimizzare la distanza della (2.3) tra il valore delle ordinate atteso e quello effettivo. Minore è questo errore, maggiore è la bontà del nostro modello. Esiste anche un parametro che ci consente di determinare l’efficacia dello stima- tore preso in analisi; questo è il coefficiente di determinazione R2 che rappresenta l’indice della bontà di adattamento. Esso si esprime tramite il rapporto tra la devianza del modello (la somma dei quadrati degli scarti dalla media) e la devianza totale della y: R2 := σ2 modello σ2 y = n∑ k=1 (ŷi − y)2 n∑ k=1 (yi − y)2 (2.9) Prima di parlare della sua utilità, cerchiamo di capire il significato dei termini che compongono questa scrittura. La devianza essenzialmente rappresenta la varianza non divisa per il numero dei dati. 28 CAPITOLO 2: Regressione lineare Definiamo devianza residua la quantità: σ2 residuo := n∑ k=1 e2 i = n∑ k=1 (yi − ŷi)2, (2.10) che prende la sua denominazione dal fatto che deriva dai residui di regressione. Introduciamo ora, invece, la devianza spiegata che deve il nome al modello, in quanto devianza dei valori stimati da quest’ultimo; rappresenta la parte di variabilità della y descritta dal modello di regressione e si indica come: σ2 modello := n∑ k=1 (ŷi − y)2 (2.11) I due termini della (2.10) e (2.11) danno origine alla devianza della variabile y: σ2 y := σ2 modello + σ2 residuo Il significato di questa scrittura si può vedere anche graficamente Figura 2.2: Rappresentazione grafica della devianza di y. Fatta questa breve digressione, riusciamo meglio a capire il significato della formula (2.9) che introduce R2, coefficiente di determinazione. 2.2. Regressione lineare multipla 31 Possiamo dunque rivedere il sistema di equazioni della (2.14) nel seguente modo Y = βX + ε. (2.16) 2.2.1 Metodo dei minimi quadrati Come nel caso lineare, questo metodo ci risulta indispensabile nella determi- nazione dei coefficienti di regressione. Anche in questa occasione cercheremo di minimizzare i β0, β1, ...βp ottenendo i b0, b1, ...bp. Iniziamo scrivendo Sq: Sq = n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)2 (2.17) Esattamente come nel caso lineare, per trovare il minimo di questa quantità procediamo facendone le derivate parziali e ponendole poi uguali a zero.  −2 n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)(−1) = 0 −2 n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)(−xi1) = 0 ... −2 n∑ i=1 (yi − b0 − b1xi1 − b2xi2 − ... − bpxip)(−xip) = 0 b0n + b1 n∑ i=1 xi1 + ... + bp n∑ i=1 xip = n∑ i=1 yi b0 n∑ i=1 xi1 + b1 n∑ i=1 x2 i1 + ... + bp n∑ i=1 xi1xip = n∑ i=1 xi1yi ... b0 n∑ i=1 xip + b1 n∑ i=1 xi1xip + ... + bp n∑ i=1 x2 ip = n∑ i=1 xipyi (2.18) 32 CAPITOLO 2: Regressione lineare Considerando ora la matrice X dei valori osservati delle variabili esplicative, come nella (2.15), e la sua trasposta X’: X =  1 x11 x12 . . . x1p 1 x21 x22 . . . x2p ... ... ... . . . ... 1 xn1 xn2 . . . xnp  , X’ =  1 1 1 . . . 1 x11 x21 x31 . . . xn1 ... ... ... . . . ... x1p x2p x3p . . . xnp  possiamo scrivere il prodotto tra le due X’X =  n n∑ i=1 xi1 . . . n∑ i=1 xip n∑ i=1 xi1 n∑ i=1 x2 i1 . . . n∑ i=1 xi1xip ... ... . . . ... n∑ i=1 xip n∑ i=1 xi1xip . . . n∑ i=1 x2 ip  Introduciamo ora il vettore dei valori osservati della variabile risposta y y =  y1 y2 y3 ... yn  2.2. Regressione lineare multipla 33 Moltiplichiamolo ora per la matrice X’ e otteniamo il seguente vettore X’y =  n∑ i=1 yi n∑ i=1 xi1yi ... n∑ i=1 xipyi  Si può dunque scrivere il sistema precedente visto nella (2.18) in forma matri- ciale: X’Xb=X’y Moltiplicando poi ambo i membri per (X’X)−1 si ottiene la stima dei minimi quadrati dei coefficienti di regressione: b = (X′X)−1X′y (2.19) Abbiamo così trovato la forma dei coefficienti di regressione che minimizza il termine Sq. A questo punto possiamo scrivere l’equazione del modello ove sono stati minimizzati i coefficienti di regressione: ŷ = b0 + b1x1 + ... + bpxp (2.20) Questa, dal punto di vista geometrico, è l’equazione di un iperpiano nello spazio (p + 1) − dimensionale. 36 CAPITOLO 2: Regressione lineare Questa è equivalente alla scrittura seguente y′y − y 2 = ŷ′ ŷ − y 2 + e′e (2.28) Il termine a sinistra dell’uguale, per come è formulato, risulta essere appunto la devianza totale di Y, mentre ŷ′ ŷ − y 2 rappresenta la devianza spiegata. L’ultimo addendo dell’equazione è il prodotto tra il vettore trasposto dei residui e il vettore stesso della (2.24) che quindi non è altro che n∑ i=1 (yi − ŷi)2. In conclusione riusciamo ad ottenere la scrittura iniziale della (2.22): n∑ i=1 (yi − y)2 = n∑ i=1 (ŷi − y)2 + n∑ i=1 (yi − ŷi)2 2.2.2 Coefficiente di determinazione Come abbiamo visto nella (2.12), cerchiamo ora di quantificare la bontà dello stimatore preso in esame,tramite il coefficiente di determinazione. R2 := σ2 modello σ2 y = n∑ i=1 (ŷi − y)2 n∑ i=1 (yi − y)2 = 1 − n∑ i=1 (yi − ŷi)2 n∑ i=1 (yi − yi)2 (2.29) Si esprime con questo termine il rapporto tra la variabile risposta e le va- riabili esplicative e può assumere valori tra 0 e 1. Più il valore è vicino ad 1 e maggiore sarà la precisione dello stimatore considerato; se invece prende il valore 0, ovvero ŷi = y, la conoscenza dei valori delle variabili esplicative non contribuisce in nessun modo alla previsione del valore della variabile ri- sposta e, conseguentemente, possiamo considerare pessimo uno stimatore con R2 = 0. Tanto maggiore è il valore di questo coefficiente quanto maggiore sarà l’adattamento del modello ai dati. 2.2. Regressione lineare multipla 37 2.2.3 Dall’iperpiano alla retta di regressione Come già detto, la differenza dal caso lineare a quello multiplo risiede nel fatto che, nel primo, vi è una sola variabile esplicativa e, nel secondo, due o più. In situazione di linearità abbiamo p = 1 e quindi la matrice X risulta essere: X =  1 x11 1 x21 ... 1 x1p  Il prodotto con la sua trasposta è: X’X =  1 1 . . . 1 x11 x21 . . . xn1   1 x11 1 x12 ... ... 1 x1n  =  n n∑ i=1 xi1 n∑ i=1 xi1 n∑ i=1 x2 i1  Si ha, inoltre: (X’X)−1 = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  n∑ i=1 x2 i1 − n∑ i=1 xi1 − n∑ i=1 xi1 n  Inserendo la scrittura appena ottenuta nella formula (2.19) vista in precedenza b = (X′X)−1X′y otteniamo: 38 CAPITOLO 2: Regressione lineare b = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  n∑ i=1 x2 i1 − n∑ i=1 xi1 − n∑ i=1 xi1 n   1 1 . . . 1 x11 x21 . . . xn1   y1 y2 ... yn  = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  n∑ i=1 x2 i1 − n∑ i=1 xi1 − n∑ i=1 xi1 n   n∑ i=1 yi n∑ i=1 xi1yi  = 1 n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2  0 − n∑ i=1 xi1yi + n n∑ i=1 xi1yi  Arriviamo dunque alla forma finale di b: b = n∑ i=1 xi1yi(n − 1) n n∑ i=1 x2 i1 − ( n∑ i=1 xi1)2 (2.30) che rappresenta il coefficiente di regressione della retta. 2.2.4 Proprietà degli stimatori dei minimi quadrati Le variabili dipendenti viste nel sistema (2.14) possono assumere la prospet- tiva di variabili casuali piuttosto che numeri e, conseguentemente, la scrittura della (2.19) diventa: B = (X′X)−1X′Y (2.31) All’interno della (2.31) Y e B sono dei vettori di variabili aleatorie e le componenti del primo sono indipendenti e omoschedatiche, ovvero con la stessa varianza, 2.2. Regressione lineare multipla 41 Possiamo dunque ora scrivere Dr = e′e = ε′MMε = ε′Mε = tr(ε′Mε = tr(Mεε′), da cui E(Dr) = tr[ME(ε′ε)] = σ2tr(M) = σ2tr[I−X(X′X)−1X′] = σ2[tr(I)−tr(X(X′X)−1X′)]. Poiché per la proprietà della traccia si ha tr[X(X′X)−1X′] = tr[X′X(X′X)−1] = tr[I(p+1)x(p+1)] = p + 1, risulta infine E(Dr) = σ2[n − (p + 1)] e da qui si ricava la (2.33). Capitolo 3 Financial literacy, matematica e divario di genere Vogliamo ora applicare quanto visto finora sulla regressione multipla in un caso specifico. La nostra intenzione finale è quella di analizzare il divario di genere presente in un ambito particolare della struttura scolastica [6]. Ci si è infatti resi conto che, negli ultimi decenni, in un contesto socio-economico sempre più complesso e articolato, è sempre maggiormente necessario che i ragazzi nelle scuole coltivino le competenze finanziarie in quanto, per il loro futuro nel mondo del lavoro, sono assai richieste. Con il passare degli anni e con lo sviluppo dei settori che si occupano della fi- nanza, ci si è accorti che le competenze possedute dai giovani studenti in campo finanziario ed economico non sono adeguate e addirittura a volte sono comple- tamente assenti. Tali conoscenza pare che siano ancor più carenti nella parte femminile della popolazione. 43 46 CAPITOLO 3: Financial literacy, matematica e divario di genere milioni di studenti di quella data età. Durante tale indagine sono state valutate molteplici competenze dei giovani stu- denti che portano poi alla formazione di un giudizio sulla loro alfabetizzazione finanziaria, la quale viene considerata come la “la conoscenza e la comprensione dei concetti e dei rischi finanziari unite alle competenze, alla motivazione e alla fiducia in se stessi per utilizzare tale conoscenza e comprensione al fine di prendere decisioni efficaci in un insieme di contesti finanziari, per migliorare il benessere finanziario delle singole persone e della società e consentire la partecipazione alla vita economica”. Per competenza si intende la capacità da parte di ciascuno studente di com- prendere e fare suoi dei concetti di natura finanziaria con il fine di riuscirli ad applicare nel mondo reale in modo da partecipare attivamente alla vita econo- mica. L’indagine condotta ha portato alla luce grandi lacune quanto all’alfabetizza- zione finanziaria per gli studenti italiani rispetto a quelli degli altri stati. Raccogliendo i dati dal database del PISA sono stati elaborati e inseriti nel- la tabella 3.1 dove, appunto, sono elencati i rendimenti degli studenti di 17 nazioni. 3.1. Le competenze finanziarie degli studenti quindicenni 47 Stati Media Errore Media internazionale (OEDC) 491,88 0,98 Australia 526,05 2,10 Belgio 541,10 3,54 Colombia 378,66 4,70 Rep. Ceca 513,19 3,24 Estonia 529,06 3,00 Francia 486,26 3,44 Israele 476,46 6,11 Italia 466,33 2,12 Lituania 500,60 3,28 Nuova Zelanda 519,98 3,71 Polonia 510,13 3,69 Slovacchia 470,45 4,86 Slovenia 484,10 3,18 Spagna 484,25 3,16 USA 491,60 4,86 Croazia 480,30 3,80 Russia 486,27 3,66 Tabella 3.1: Nazioni esaminate, punteggio ottenuti dagli studenti e errore relativo. Da questa tabella si evince il divario tra gli studenti quindicenni italiani e quelli delle altre nazioni quanto alle competenze finanziarie. Andando avanti e approfondendo l’analisi si può anche notare che, tra gli stu- denti di sesso maschile e femminile, si evince un ulteriore divario in favore dei primi. Andiamo a vedere nel dettaglio all’interno tabella 3.2 che segue i risultati conseguiti dalle studentesse e dagli studenti nel test riguardante appunto le competenze finanziarie. Nella seconda colonna possiamo osservare i risultati ottenuti dalle quindicenni con annesso l’errore riferito a questa misurazione. Nella quarta colonna sono invece riportati i risultati degli studenti di sesso maschile e, infine, nell’ultima sono rappresentate le differenze tra i punteggi dei ragazzi e quello delle ragazze. 48 CAPITOLO 3: Financial literacy, matematica e divario di genere Stati Media F Errore F Media M Errore M Diff. M/F Media internazionale (OEDC) 491,96 1,21 491,84 1,39 0 Australia 527,68 2,38 524,42 3,32 -3 Belgio 535,70 4,81 546,76 4,71 11 Colombia 378,81 5,83 378,52 6,25 0 Rep. Ceca 509,88 4,30 516,10 4,54 6 Estonia 530,77 4,06 527,48 4,52 -3 Francia 489,09 4,52 483,41 4,73 -6 Israele 479,72 5,61 473,66 9,05 -6 Italia 462,30 2,22 470,21 3,15 8 Lituania 506,17 4,32 495,30 4,78 -11 Nuova Zelanda 518,70 4,65 521,26 6,52 3 Polonia 508,48 4,18 511,84 4,73 3 Slovacchia 472,08 6,16 486,90 5,81 -3 Slovenia 487,97 5,11 480,41 5,02 -8 Spagna 481,00 4,28 487,18 4,30 6 USA 491,10 5,97 492,13 6,26 1 Croazia 477,55 4,30 482,94 5,81 5 Russia 485,56 4,23 487,02 4,48 1 Tabella 3.2: Nazioni esaminate, punteggio ottenuti dalle studentesse(F) con errore e punteggio degli studenti(M) con errore e differenza tra i punteggi tra gli studenti di sesso diverso. Seppur la differenza della media internazionale risulti essere nulla, che è in- dicatore di omogeneità a livello globale, allarmanti risultano essere i gender gap di alcuni nazioni come, ad esempio, dell’Italia. Nella nostra nazione notiamo dunque che, oltre ad essere basso il livello di alfabetizzazione finanziaria, è an- che presente una differenza tra maschi e femmine statisticamente significativa. Tale dato simboleggia un divario tanto ampio che necessita di essere colmato quanto prima altrimenti si rischia di andare ad appesantire ancor di più il disli- vello numerico tra uomini e donne nel mondo della finanza e dell’economia. Appurata la presenza del gender gap, occupiamoci ora di individuare in che percentuali gli studenti hanno raggiunto ciascun livello. La nostra intenzione 3.1. Le competenze finanziarie degli studenti quindicenni 51 La retta di regressione ci risulta essere: y = −0, 2684x + 491, 09 Figura 3.1: Retta di regressione dove y è il punteggio medio ottenuto nel test di finanza e x il sesso dello studente. Tramite una specifica funzione di Excel siamo riusciti inoltre a trovare il va- lore di R2 che risulta essere negativo e molto vicino allo zero. Questo significa che lo stimatore della regressione lineare non è ottimale per approssimare i dati campionati. Ci potevamo aspettare questo risultato in quanto correliamo solo rispetto al genere e i dati si trovano dunque solo in una striscia di piano: una retta non si adatta bene. All’aumentare delle variabili indipendenti invece possiamo affidarci alla regres- sione multipla. Oltre al sesso, indicato dalla x1, utilizziamo anche la variabile che indica lo status socio-economico dello studente x2 e la generazione di immi- grazione x3. Per la prima si utilizza un indice che varia da -3 a +3, mentre per la seconda vi 52 CAPITOLO 3: Financial literacy, matematica e divario di genere è una suddivisione in prima, seconda generazione di immigrazione e nativi. Cominciamo fornendo i punteggi ottenuti dagli studenti per ciascuna di que- ste categorie e lo status socio-economico successivamente creiamo un modello di regressione multipla in base ad ogni circostanza prevista. Stavolta i paesi analizzati sono meno rispetto a prima per carenza di dati raccolti. Stati Native F 2° gen F Nativi M 2° gen M Media internazionale (OEDC) 497 476 498 480 Australia 526 568 524 560 Belgio 547 478 560 464 Estonia 536 481 533 498 Francia 502 424 502 435 Israele 483 476 477 490 Italia 465 461 476 440 Nuova Zelanda 531 479 530 512 Slovenia 493 450 489 428 USA 503 466 502 493 Croazia 478 472 490 436 Tabella 3.4: Nazioni esaminate, punteggio ottenuto in finanza dagli studenti(M) e studentesse(F) in base alla loro generazione di immigrazione. Stati Status socio-eco F Status socio-ecco M Media internazionale (OEDC) -0,08 -0,06 Australia 0,26 0,23 Belgio 0,13 0,26 Estonia 0,08 0,08 Francia -0,05 -0,01 Israele 0,17 0,24 Italia -0,05 -0,01 Nuova Zelanda 0,06 0,10 Slovenia 0,08 0,08 USA 0,19 0,12 Croazia -0,37 -0,37 Tabella 3.5: Indice status socio-economico in funzione del sesso. Il punteggio varia in un intervallo da -3 a +3. 3.1. Le competenze finanziarie degli studenti quindicenni 53 Questi dati correlati con il sesso di ciascuno studente danno vita ad una funzione di regressione pari a ŷ = 371, 273 + 1, 0338x1 + 40, 925x2 + 0, 264x3. Qui i valori rappresentano x1 il sesso dello studente, x2 l’indice dello status famigliare e x3 invece la seconda generazione di immigrazione. In questo caso il coefficiente di correlazione R2 risulta essere 0,346, è migliore rispetto al caso lineare semplice ma comunque basso ed è indice di una non ottimale adattabilità del modello ai dati campionati. Se proviamo ora a correlare il sesso e lo status socio-economico con i punteggi ottenuti dagli studenti nativi otteniamo un’altra equazione: ŷ = 25, 168 + 1, 815x1 + 3, 285x2 + 0, 935x3. Anche qui le xi rappresentano in ordine il sesso, lo status socio-economico e i punteggi ottenuti dagli studenti nativi. Il coefficiente R2 in questo caso è molto alto e raggiunge il valore di 0,96; questo significa che riusciamo a stimare con una grande affidabilità il punteggio per la generazione dei nativi in correlazione al sesso e all’indice socio-economico. Abbiamo anche provato a correlare singolarmente il punteggio medio di ciascu- no studente con il genere, lo status e il punteggio ottenuto dalla generazione nativa e abbiamo ottenuto le rette di regressione mostrate in Figura 3.2, 3.3, 3.4. 56 CAPITOLO 3: Financial literacy, matematica e divario di genere Analizzando la situazione italiana dalla tabella 3.6 ci accorgiamo che stavolta il punteggio è in linea con la media europea, segno che la formazione matema- tica nelle scuole è di un buon livello. Concentriamoci ora, come prima, sui punteggi per genere e vediamo se, anche in questo caso esiste un gender gap. Stati Media F Errore F Media M Errore M Diff. M/F Australia 488,30 2,46 494,32 2,41 6 Belgio 502,05 2,69 514,13 2,90 12 Rep. Ceca 497,67 3,17 501,19 2,95 4 Estonia 519,19 2,02 527,64 2,23 8 Francia 492,18 2,77 498,54 2,68 6 Israele 467,39 3,54 458,19 5,20 -9 Italia 478,55 3,13 494,09 3,34 16 Lituania 492,79 2,46 499,56 2,25 7 Nuova Zelanda 490,02 2,27 498,89 2,48 9 Slovenia 508,59 1,83 509,19 1,88 1 Spagna 478,14 1,48 484,57 2,06 6 USA 473,85 3,30 482,46 3,90 9 Croazia 459,92 3,36 468,54 3,04 9 Russia 485,46 3,10 490,15 3,22 5 Tabella 3.7: Nazioni esaminate, punteggio ottenuti in matematica dalle studentesse(F) con errore e punteggio degli studenti(M) con errore e differenza tra i punteggi tra gli studenti di sesso diverso. Vediamo dalla tabella 3.7 che questa volta il divario di genere nei punteggi è assai alto nella quasi totalità dei paesi esaminati risulta infatti raro vedere le ragazze ottenere un punteggio maggiore rispetto ai loro colleghi maschi: solo in Israele il gender gap è in favore delle donne e sono pochi i paesi in cui il divario tende ad annullasi (Slovenia e Polonia). 3.2. Le competenze matematiche dei quindicenni 57 3.2.1 Applicazione della regressione A questo punto, come fatto per i punteggi ottenuti nei test sulle competenze finanziarie, occupiamoci di ricavare la retta di regressione. Anche stavolta la variabile indipendente sarà il sesso e quella dipendente il punteggio ottenuto. Con entrambi i metodi utilizzati (spiegati nel capitolo 2) l’equazione della retta risulta essere y = −6, 657x + 489, 83 Figura 3.5: Retta di regressione che rappresenta il punteggio medio y nel test di matematica e sesso x. Anche questa volta il coefficiente di correlazione R2 è prossimo allo zero quindi, come abbiamo detto in precedenza, si può concludere che la regressione non sia un buono metodo nel caso di una sola variabile indipendente che può assumere solo due valori. Vediamo di unire i dati trovati con un modello di regressione multipla corre- lando anche la generazione di immigrazione e lo status socio-economico come 58 CAPITOLO 3: Financial literacy, matematica e divario di genere fatto in precedenza. Sfruttando i dati delle tabelle 3.8 e 3.9 con il sesso e consi- Stati Native F 2° gen F Nativi M 2° gen M Media internazionale (OEDC) 491,05 463,28 497,29 477,84 Australia 485,56 505,58 491,11 519,70 Belgio 513,29 461,67 528,36 474,89 Rep. Ceca 500,55 464,99 503,63 482,50 Estonia 521,98 497,66 532,65 503,81 Francia 500,20 455,50 507,77 463,83 Israele 470,71 483,03 472,83 471,28 Italia 483,56 454,56 499,37 470,60 Lituania 494,12 465,40 501,34 482,42 Nuova Zelanda 490,07 501,52 498,44 520,37 Slovenia 515,31 479,46 516,87 465,52 Spagna 485,30 452,37 491,61 468,44 USA 475,71 480,80 486,48 490,29 Croazia 461,83 446,19 470,71 460,72 Russia 486,17 499,43 491,14 500,63 Tabella 3.8: Nazioni esaminate, punteggi in matematica ottenuti dagli studenti(M) e studentesse(F)in base alla generazione di immigrazione. derando la seconda generazione di immigrazione, otteniamo dalla regressione multipla la seguente equazione : ŷ = 282, 72 − 2, 21x1 − 30, 02x2 − 0, 44x3, dove, come prima, le xi rappresentano in ordine il genere, lo status e il punteggio ottenuto dagli studenti della seconda generazione di immigrazione. In questo caso il coefficiente di correlazione appare ancora basso, 0,183 ma comunque più alto rispetto al caso lineare semplice. Se invece correliamo sesso, indice socio-economico e punteggi degli studenti nativi, otteniamo: ŷ = 32, 47 + 0, 88x1 + 2, 78x2 + 0, 92x3. Conclusioni Nella tesi abbiamo analizzato il divario di genere sia attraverso la statistica descrittiva, sia attraverso il metodo di regressione, metodo assai utilizzato in letteratura ma, capita spesso che non sia il più adatto. Guardando al coefficiente di correlazione R2 infatti, essendo in alcune casistiche da noi analizzate estre- mamente basso, possiamo dire che il modello lineare non è il più adatto per rappresentare questi dati; se infatti la nostra intenzione è quella di studiare la media ottenuta dagli studenti in correlazione al sesso degli stessi, è opportuno utilizzare altri tipi di analisi. La tesi mostra l’importanza di mettere in luce l’esistente divario di genere in molteplici campi, infatti lo stereotipo che le ragazze siano meno portate per la matematica rispetto ai ragazzi, ha profonde conseguenze sul mondo del lavoro. In questo modo infatti molte donne faticano ad accedere al mondo dell’econo- mia, della finanza e più in generale al mondo scientifico. A causa di un continuo scoraggiamento indotto sin dall’età infantile [2], molte bambine faticano ad entrare in contatto con il mondo della matematica e dei numeri ma sentono il peso degli stereotipi che provengono dai genitori, dagli 61 62 Conclusioni insegnanti, dai libri di testo e, più in generale, dalle norme sociali e culturali loro trasmesse. Qui i pregiudizi di genere vanno a radicarsi nella mente delle bambine le quali poi, crescendo, prendono scelte scolastiche spesso adattate alla visione degli stessi stereotipi, come se questa fosse la scelta che la società ha preso per loro. Precludendosi lo studio di materie scientifiche, le donne perdono anche l’op- portunità di intraprendere una carriera lavorativa con un salario maggiore. I dati del PISA parlano chiaro: le quindicenni italiane, in media, sono meno portate rispetto ai loro coetanei dell’altro sesso nelle materie scientifiche e mo- strano risultati inferiori nella competenza finanziaria. Il motivo di questo gap è da ricercarsi esclusivamente nella diverso approccio che le ragazzine hanno nei confronti dei numeri, non ci sono differenze a livello intellettivo. Diversi studi hanno dimostrato che il cervello degli uomini e delle donne non hanno differenze e non c’è un sesso più intelligente rispetto all’altro. Altro fattore che ci permette di dire che non esistono differenze biologiche che portano le donne ad ottenere risultati più scarsi in matematica, è il fatto che i punteggi bassi nei test dell’OECD sono stati ottenuti sia dai ragazzi che dalle ragazze, gli andamenti variano di nazione in nazione. Nei paesi Scandinavi, ad esempio, il divario di genere è praticamente annullato. Proprio per questo motivo le motivazioni del divario di genere nelle facoltà prettamente matematiche sono da ricercare nelle tradizioni culturali e sociali che portano le bambine a provare una sempre maggiore sfiducia in sé per quan- to riguarda la loro propensione allo studio di tali discipline. In soldoni, non è vero che le donne non sono brave in matematica! Sono sostanzialmente i continui condizionamenti sociali a indurre nelle bam- bine l’idea che la matematica sia un qualcosa al quale non possono aspirare e, Conclusioni 63 conseguentemente, si sviluppa una tendenza ad allontanarsi da quel mondo. Risulta quindi necessario uno sradicamento di tali stereotipi ed una maggior sensibilizzazione al tema. Tali esiti esigono più di una attenta analisi. Risulta obbligatorio interrogarsi su quali siano le cause del profondo gap in ma- tematica e nelle discipline scientifiche ed è ora necessario cercare di contrastarle per favorire l’accesso delle donne a corsi di studio con migliori sbocchi occupa- zionali. Per finire, risulta anche necessario individuare quali siano i motivi della di- scriminazione e quali politiche e pratiche mettere in atto per contrastarla per consentire alle donne pari opportunità. Ringrazio infine me stessa per avercela fatta, per non aver mai mollato nono- stante le insicurezze che riempivano i miei pensieri. Voglio condividere questo momento speciale con tutte queste persone che mi hanno sempre sostenuta e hanno creduto in me quando io non riuscivo a farlo. Grazie di cuore! Bibliografia [1] Davino C., "Analisi fonti statistiche nello studio della sottorappresentanza delle donne nelle cariche pubbliche elettive", Università degli studi di Macerata, 2004. [2] Di Tommaso M.L. e Piazzalunga D., "Matematica, dove si fanno i conti delle differenze di genere", lavoce.info, 2019. [3] Alleva G., "Indagine conoscitiva sulle politiche in materia di parità tra donne e uomini", I Commissione "Affari costituzionali" della Camera dei Deputati, ISTAT 2017. [4] Database OECD PISA. https://www.oecd.org/pisa/pisaproducts/pisa2012database- downloadabledata.htm, 2012, 2018. [5] Levine D.M.,Zahat K.A. e Stephan D.F., "Statistica", Pearson, 2010. [6] Longobardi S. e Pagliuca M.M., "Un’analisi esplorativa delle differenze di genere nell’alfabetizzazione finanziaria degli studenti Italiani", Statistica Società, 3, 39-43 2015. 67 [7] Piccolo G., "Statistica", Il mulino, 1998.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved