Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Soddisfazione servizio on-line: priorità e regressione coefficienti, Appunti di Statistica

Un metodo per analizzare la soddisfazione verso un servizio on-line utilizzando una mappa delle priorità e una regressione di coefficienti. Il documento include una spiegazione del processo di analisi, un esempio di dati e il risultato finale. Il documento intende aiutare a identificare aree di miglioramento e priorità di intervento per il servizio.

Tipologia: Appunti

2019/2020

Caricato il 21/08/2020

Lucy_27
Lucy_27 🇮🇹

4.8

(5)

12 documenti

1 / 18

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
APPROFONDIMENTO TECNICHE STATISTICHE
1.6 Analisi dei dati
Nella sua configurazione, il questionario consente l’effettuazione di analisi descrittive, bivariate e
multivariate. In proposito, è orientamento condiviso in letteratura il trattamento della scala Likert impiegata
per valutare la soddisfazione degli intervistati sia a livello complessivo, sia sui singoli aspetti del servizio
come una scala a intervallo, quindi con proprietà definibili come “quasi cardinali”. Ciò consente il
trattamento delle variabili che impiegano le suddette scale anche mediante le tecniche statistiche utilizzabili
per le variabili di tipo cardinale.
In secondo luogo, è utile ribadire che la logica sottesa dal modello di rilevazione prevede che la
soddisfazione sia considerata come un costrutto intangibile osservabile da due prospettive differenziate:
1. una prima di tipo non attribute-based, in virtù della quale si riconosce all’intervistato, grazie alla
propria elaborazione cognitiva e affettiva, la capacità di esprimere una valutazione complessiva sulla
soddisfazione overall nei confronti del servizio; sono infatti presenti, all’inizio e alla fine del
questionario, due domande mirate a tale scopo;
2. una seconda di tipo multi attribute based, che considera invece la soddisfazione come una variabile
multidimensionale formata da diversi elementi costitutivi individuati dai diversi aspetti del servizio,
che nel questionario si traducono in altrettante domande1.
Dal momento che il questionario deriva da una precedente mappatura del servizio in esame, l’indagine tiene
conto di tutti gli elementi del servizio con qualche impatto sul livello di soddisfazione dei fruitori. In questo
modo la formazione dell’insieme di indicatori di soddisfazione che si utilizza nell’indagine viene sottratta a
valutazioni discrezionali e riduce fortemente il rischio che possano essere esclusi dalla rilevazione aspetti
significativi del servizio.
Così progettato, il questionario permette di effettuare analisi statistiche basate sulla ricerca di associazioni e
relazioni fra variabili, che sono poi quelle di interesse prevalente per questo tipo di indagine. Il dato di fatto è
che risulta possibile avvalersi di uno spettro di tecniche statistiche utilizzabili separatamente ovvero in
combinazione per attingere ai rispettivi contributi informativi.
Come si è avuto modo di anticipare nel paragrafo relativo alla fase 4, è bene prevedere un codebook per ogni
dataset, dove vengono conservate le informazioni relative alla codifica della variabili. Nella maggioranza dei
casi, anche il nome delle variabili (domanda nel questionario) è sostituito da un codice alfanumerico. Per le
domande di soddisfazione, questo codice è formato da una lettera (corrispondente alla dimensione a cui la
domanda appartiene) e da un numero (che descrive la posizione della domanda in quella dimensione). Anche
tale associazione (codice-nome della variabile) deve essere conservata nel codebook.
L’organizzazione del dataset secondo la logica appena indicata ha lo scopo di consentire l’analisi dei dati
avvalendosi dei più comuni software per il trattamento dei dati e l’analisi statistica (tra cui ad esempio Excel,
Minitab, Spss). Di seguito si riporta l’esempio di un dataset costruito con Excel e del relativo codebook.
1 Gli indicatori di soddisfazione sono raggruppati in 7 dimensioni, in base al criterio dell’omogeneità semantica. Tuttavia, il
questionario non contiene domande mirate a rilevare il giudizio di soddisfazione sulla dimensione. Le dimensioni costituiscono un
aggregato concettuale che risponde a finalità di analisi, piuttosto che di rilevazione, in quanto hanno il solo scopo di consentire
elaborazioni aggregate delle risposte.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Anteprima parziale del testo

Scarica Soddisfazione servizio on-line: priorità e regressione coefficienti e più Appunti in PDF di Statistica solo su Docsity!

APPROFONDIMENTO TECNICHE STATISTICHE

1.6 Analisi dei dati

Nella sua configurazione, il questionario consente l’effettuazione di analisi descrittive, bivariate e multivariate. In proposito, è orientamento condiviso in letteratura il trattamento della scala Likert impiegata per valutare la soddisfazione degli intervistati sia a livello complessivo, sia sui singoli aspetti del servizio come una scala a intervallo, quindi con proprietà definibili come “quasi cardinali”. Ciò consente il trattamento delle variabili che impiegano le suddette scale anche mediante le tecniche statistiche utilizzabili per le variabili di tipo cardinale. In secondo luogo, è utile ribadire che la logica sottesa dal modello di rilevazione prevede che la soddisfazione sia considerata come un costrutto intangibile osservabile da due prospettive differenziate:

  1. una prima di tipo non attribute-based , in virtù della quale si riconosce all’intervistato, grazie alla propria elaborazione cognitiva e affettiva, la capacità di esprimere una valutazione complessiva sulla soddisfazione overall nei confronti del servizio; sono infatti presenti, all’inizio e alla fine del questionario, due domande mirate a tale scopo;
  2. una seconda di tipo multi attribute based , che considera invece la soddisfazione come una variabile multidimensionale formata da diversi elementi costitutivi individuati dai diversi aspetti del servizio, che nel questionario si traducono in altrettante domande^1. Dal momento che il questionario deriva da una precedente mappatura del servizio in esame, l’indagine tiene conto di tutti gli elementi del servizio con qualche impatto sul livello di soddisfazione dei fruitori. In questo modo la formazione dell’insieme di indicatori di soddisfazione che si utilizza nell’indagine viene sottratta a valutazioni discrezionali e riduce fortemente il rischio che possano essere esclusi dalla rilevazione aspetti significativi del servizio. Così progettato, il questionario permette di effettuare analisi statistiche basate sulla ricerca di associazioni e relazioni fra variabili, che sono poi quelle di interesse prevalente per questo tipo di indagine. Il dato di fatto è che risulta possibile avvalersi di uno spettro di tecniche statistiche utilizzabili separatamente ovvero in combinazione per attingere ai rispettivi contributi informativi. Come si è avuto modo di anticipare nel paragrafo relativo alla fase 4, è bene prevedere un codebook per ogni dataset, dove vengono conservate le informazioni relative alla codifica della variabili. Nella maggioranza dei casi, anche il nome delle variabili (domanda nel questionario) è sostituito da un codice alfanumerico. Per le domande di soddisfazione, questo codice è formato da una lettera (corrispondente alla dimensione a cui la domanda appartiene) e da un numero (che descrive la posizione della domanda in quella dimensione). Anche tale associazione (codice-nome della variabile) deve essere conservata nel codebook. L’organizzazione del dataset secondo la logica appena indicata ha lo scopo di consentire l’analisi dei dati avvalendosi dei più comuni software per il trattamento dei dati e l’analisi statistica (tra cui ad esempio Excel, Minitab, Spss). Di seguito si riporta l’esempio di un dataset costruito con Excel e del relativo codebook.

(^1) Gli indicatori di soddisfazione sono raggruppati in 7 dimensioni, in base al criterio dell’omogeneità semantica. Tuttavia, il questionario non contiene domande mirate a rilevare il giudizio di soddisfazione sulla dimensione. Le dimensioni costituiscono un aggregato concettuale che risponde a finalità di analisi, piuttosto che di rilevazione, in quanto hanno il solo scopo di consentire elaborazioni aggregate delle risposte.

Figura 1: Esempio di dataset in Excel

Figura 2: Esempio di code-book in Excel

Una volta strutturato il dataset, i dati sono pronti per essere elaborati e successivamente interpretati. Le tecniche statistiche, più o meno complesse, utilizzabili per effettuare l’analisi dei dati raccolti sono svariate. La scelta della tecnica statistica da utilizzare deve tenere conto di una serie di fattori quali l’obiettivo dell’analisi e la natura del dato, ossia la tipologia della variabile osservata^2. Solitamente, è bene partire con un’ analisi uni-variata dei dati che si occupa di osservare la distribuzione dei caratteri presi singolarmente. Successivamente, può essere interessante passare a un’ analisi bi-variata e multivariata per la ricerca di relazioni fra coppie o gruppi di variabili.

(^2) I caratteri statistici possono essere qualitativi – sconnessi (come sesso, religione, luogo di nascita), ordinati (come i giudizi di

soddisfazione), quantitativi – discreti (come età e numero di figli) o continui (come peso e altezza). I dati raccolti a seguito dell’applicazione del modello di customer satisfaction on-line sono soprattutto di tipo qualitativo ordinato.

Totale 10 1 100% Tabella 2: Distribuzione di frequenza del carattere soddisfazione

I giudizi di soddisfazione indagati tramite il modello sono misurati con una scala a 6 livelli quindi 6 sono le modalità che il carattere può assumere. La scelta della scala pari permette di accorpare classi di giudizio contigue. Seguendo questa logica i giudizi 1 e 2 possono uniti in un unico livello di soddisfazione negativa, 3 e 4 in uno di media soddisfazione e 5 e 6 in uno di alta soddisfazione. Associando a ogni nuova classe un emoticon , come nella tabella successiva, è possibile visualizzare immediatamente il giudizio degli utenti.

Classi Emoticon Giudizio di soddisfazione

1 -2 Giudizio negativo

3- 4 Giudizio sufficiente

5- 6 Giudizio positivo

Tabella 3: Accorpamento dei giudizi in classi ed attribuzione dell'emoticon

La distribuzione di un carattere può essere rappresentata anche tramite strumenti grafici di facile lettura. Per i caratteri qualitativi ordinati o quantitativi discreti si può utilizzare il diagramma a barre, ossia un grafico costituito da tante barre (le colonne) quante sono le modalità che il carattere assume (o le categorie in cui il carattere è stato successivamente diviso). L’altezza di ogni barra è pari alla frequenza (assoluta, relativa o percentuale) della modalità. Un esempio di diagramma a barre sulla base dei dati precedenti è il seguente.

0%

10%

20%

30%

40%

50%

60%

1 2 3 4 5 6

Frequenze

percentuali

Giudizi di soddisfazione

Diagramma a barre

Grafico 1: Diagramma a barre rappresentativo della distribuzione presa ad esempio

Dalla rappresentazione grafica è agevole osservare che il 10% degli utenti ha dato un giudizio di soddisfazione pari a 1 e il 20% pari a 2. Ne segue che il 30% degli intervistati ha espresso un giudizio negativo in merito al servizio. Accorpando le classi con la logica in tabella 3 potremo disegnare il grafico seguente.

0%

10%

20%

30%

40%

50%

60%

1 2 3

Frequenze

percentuali

Diagramma a barre

Grafico 2: Diagramma a barre con classi accorpate e rinominate con gli emoticon

Per la rappresentazione di caratteri non ordinati, invece, sono molto utili i grafici a torta. Questo grafico non è altro che una circonferenza divisa in spicchi che rappresentano le diverse modalità che la variabile assume. L’ampiezza di ogni spicchio è proporzionale alla frequenza con cui ogni modalità viene osservata. Questo tipo di grafico è adatto per distribuzioni con un numero di modalità non troppo elevato, al fine di potenziarne la facilità di lettura e interpretazione. Un esempio di grafico a torta per il carattere è di seguito riportato.

impiegato 58%

operaio 5%

dirigente/libero professionista 7%

imprenditore/lavorato re autonomo 9%

studente2%

casalinga 5%

insegnante 2% (^) Altro 12%

Professione

Grafico 3: Rappresentazione grafica del carattere professione

Nel caso di un carattere quantitativo con molte categorie o quantitativo continuo, lo strumento grafico adatto per la rappresentazione della distribuzione è l’istogramma. L’istogramma è costituito da tanti rettangoli tra loro contigui quante sono le classi in cui il carattere è diviso. La base delle colonne è pari all’ampiezza della classe (ossia la differenza tra l’estremo superiore e inferiore della classe). Le classi possono essere di ampiezza uguale o diversa. L’altezza delle colonne è pari alla frequenza assoluta della classe se le classi sono di pari ampiezza, e alla densità, ossia la frequenza diviso l’ampiezza della classe, nel caso contrario. Un esempio di istogramma è riportato nella figura sottostante.

primo quartile (Q1) e il 75-esimo percentile o terzo quartile (Q3), che insieme alla mediana dividono la distribuzione in quattro parti uguali. In particolare tra il primo e il terzo quartile si trova il 50% delle osservazioni.

Altri indici sintetici della distribuzione sono gli indici di variabilità che indicano quanto variano le osservazioni all’interno di uno stesso campione. Tra i numerosi indici di variabilità di un carattere (varianza, deviazione standard, coefficiente di variazione) gli intervalli di variabilità sono utilizzabili anche nel caso di caratteri qualitativi ordinati come i giudizi di soddisfazione. Questi indici confrontano due valori caratteristici della distribuzione. Il range, per esempio, è pari alla differenza tra il valore più grande e il valore più piccolo dell’insieme dei valori osservati e ordinati in senso crescente.

Il cosiddetto riassunto a cinque numeri della distribuzione – l’osservazione più piccola osservata, il primo quartile, la mediana, il terzo quartile e l’osservazione più grande – è uno strumento base per l’elaborazione di altre rappresentazioni grafiche come il box-plot. Gli elementi principali che caratterizzano il box-plot sono:

  • un rettangolo la cui altezza va dal primo al terzo quartile,
  • una linea orizzontale nella scatola che rappresenta la mediana,
  • due segmenti che partono dal rettangolo i cui estremi rappresentano il valore minimo e il valore massimo della distribuzione. L’altezza della scatola rappresenta la distanza interquartile. Questa quantità è un’informazione circa la variabilità delle osservazioni. La posizione della mediana rispetto alla base inferiore (Q1) e superiore (Q3) del rettangolo fornisce informazioni circa la simmetria o asimmetria della distribuzione. Questo grafico è interamente riassuntivo della distribuzione. Il confronto tra più box-plot permette un confronto sinottico tra le distribuzioni dei caratteri in esame. Affinché il confronto sia appropriato è necessario che i box plot relativi a caratteri diversi (ma misurati nella stessa unità di misura) o a campioni o sottocampioni diversi, vengono rappresentati sul medesimo grafico. In tal modo si evitano distorsioni dovute alla differenza di scala rappresentativa. Nel grafico sottostante sono riportati due box-plot relativi, rispettivamente, alla soddisfazione iniziale e finale. Dall’esempio si può immediatamente notare che la distribuzione della prima soddisfazione risulta più concentrata. Essa, infatti, presenta una scatola più schiacciata. Inoltre la prima distribuzione presenta una linea orizzontale (mediana) più vicina al terzo quartile che al primo. Questa informazione è sinonimo di asimmetria della distribuzione che, invece, non si riscontra nel caso della seconda distribuzione in cui la mediana è posta circa al centro della scatola.

Iniziale Finale

6 5 4 3 2 1 0

Data

Boxplot di Soddisfazione iniziale e finale

Grafico 4: Rappresentazione grafica tramite box-plot della soddisfazione complessiva iniziale e finale

1.6.2 Analisi bivariata

In fase di analisi dei dati è spesso significativo intraprendere lo studio delle relazioni tra due variabili. In letteratura l’analisi congiunta di due caratteri è nota come analisi bivariata. In questa sede useremo il termine di analisi bivariata in senso lato facendo rientrare in questa categoria di strumenti anche tecniche non strettamente statistiche di rappresentazione grafica del contributo integrato di due tipologie di informazioni (per esempio la cosiddetta mappa delle priorità). Nell’ambito di un’indagine, potrebbe essere interessante, per esempio, analizzare coppie di variabili come la soddisfazione complessiva e il genere (maschio o femmina). Operativamente, per coppie di variabili va inteso l’insieme costituito da due colonne del dataset. Si consideri un dataset formato dalle variabili soddisfazione complessiva e genere (vedi tabella seguente) misurate su un campione di 20 persone, 12 uomini (codificati con il numero 1) e 8 donne (codificate con il numero 2):

Individuo Soddisfazione Genere 1 3 1 2 4 2 3 3 2 4 1 2 5 4 1 6 2 1 7 2 1 8 4 2 9 5 2 10 6 2 11 3 1 12 4 1 13 3 1 14 1 1 15 4 2 16 2 2 17 2 1 18 4 1 19 5 1 20 6 1 Tabella 4: Esempio di distribuzione unitaria doppia

L’informazione contenuta nella distribuzione sopra riportata è sintetizzabile in una tabella di contingenza o a doppia entrata. In una tabella a doppia entrata le righe della tabella corrispondono alle modalità della variabile riga; viceversa le colonne sono le modalità della variabile riportata in colonna. I valori all’interno della tabella sono l’insieme delle frequenze congiunte n (^) ij ossia il numero di individui (frequenza assoluta) che presentano congiuntamente la modalità i-esima del primo carattere e j-esima del secondo carattere. I “totali” di riga e di colonna sono contenuti rispettivamente nell’ultima riga e nell’ultima colonna della tabella e corrispondono alle distribuzioni marginali (ossia le distribuzioni semplici) delle due singole variabili^4. Nel caso specifico, la tabella a doppia entrata sarà pertanto composta da sei righe (perché la soddisfazione è misurata con una scala a sei punti) e due colonne (una per ogni genere):

(^4) La frequenza nella cella di una tabella a doppia entrata può essere espressa anche come frequenza relativa se si dividono le frequenze assolute per il numero totale di individui.

Una volta completata l’indagine, si dispone quindi dei dati per calcolare tre grandezze medie: il giudizio di soddisfazione complessiva (misurato in testa e in coda al questionario); il giudizio di soddisfazione sulle singole componenti del servizio; il giudizio di importanza attribuito alle singole dimensioni del servizio medesimo. Ai fini della presente analisi, porremo l’accento sui giudizi medi di soddisfazione relativi ai singoli indicatori e ai giudizi medi di importanza delle singole dimensioni. La logica di fondo cui si fa riferimento è che l’importanza della dimensione per come percepita dai cittadini debba rappresentare il driver per l’individuazione delle priorità di intervento: i giudizi di importanza servono pertanto a facilitare il processo decisionale. Immaginiamo che due indicatori siano giudicati egualmente soddisfacenti; va da sé che dovendo predisporre un’azione migliorativa sulla qualità del servizio, almeno in prima battuta ad essere tenuto in maggiore considerazione dovrà essere quello che appartiene alla dimensione cui i cittadini assegnano una valenza maggiore. Per definire un primo quadro interpretativo, i giudizi di soddisfazione riferiti ai singoli indicatori di qualità del servizio e i giudizi di importanza attribuiti alle dimensioni possono essere trattati nel modo spiegato di seguito. Un indicatore di soddisfazione va considerato come “prioritario” quando ha un livello di importanza alto ed uno scarso livello di soddisfazione. L’individuazione di indicatori con queste caratteristiche consente al manager di evidenziare le principali aree di miglioramento indirizzando gli interventi verso gli aspetti del servizio ritenuti più importanti e allo stesso tempo meno soddisfacenti dai cittadini. Questo concetto può essere rappresentato sia in forma grafica, sia tabellare. Nel primo caso si ottiene una rappresentazione sinottica del posizionamento dei diversi indicatori di soddisfazione all’interno di una mappa – cosiddetta “mappa delle priorità” – rappresentata da un piano a due dimensioni e quattro quadranti (vedi figura sotto). Le dimensioni, ossia gli assi della mappa, sono rispettivamente costituiti:

  • sull’asse delle ascisse (orizzontale) dal livello di soddisfazione medio (riferito al singolo indicatore di volta in volta considerato), per come rilevato impiegando la scala di misura con intervallo 1-6;
  • sull’asse delle ordinate (verticale) dall’importanza media della dimensione cui ogni singolo indicatore appartiene, anch’essa misurata secondo una scala con intervallo 1-6.

I.1^ A. R.4 R.2 R.3 R. U.1D.

S.

1

2

3

4

5

6

1 2 3 4 5 6

Importanze

Soddisfazione

Mappa delle priorità

II quadrante^ I^ quadrante

III quadrante IV quadrante

Figura 4: Esempio di mappa delle priorità

Costruendo le coordinate per ogni singolo indicatore (giudizio medio di soddisfazione e giudizio medio di importanza della dimensione di appartenenza) è possibile riempire lo spazio con una nuvola di punti: ogni punto individua la posizione di un indicatore rispetto agli assi. Nell’intento di facilitarne ulteriormente la lettura e favorire la presa di decisioni, la mappa viene suddivisa in quattro quadranti. Tra i possibili criteri di cut-off dei quadranti si è scelto di utilizzare rispettivamente il valore medio della soddisfazione complessiva finale (quindi quella corrispondente alla domanda di soddisfazione posta a valle del questionario) e la media dei giudizi di importanza di tutte le dimensioni considerate. Il primo divide la mappa verticalmente, il secondo orizzontalmente. Da notare che la superficie

dei singoli quadranti si modifica in funzione dei valori di soddisfazione e importanza e solo in un caso particolare – quello in cui i valori riscontrati di soddisfazione e importanza occupino la posizione centrale dei due assi – sono identiche. Naturalmente, in base ai criteri in esame, ciascuno dei quadranti viene ad assumere un significato preciso, che assume un valore di supporto nel processo decisionale.I quadranti della matrice che vengono così a formarsi esprimono altrettante azioni in ottica di miglioramento, in particolare:

  1. Quadrante 1 (Area del monitoraggio): elementi del servizio da controllare nel tempo, per verificare che le aspettative degli utenti non crescano.
  2. Quadrante 2 (Area delle criticità): elementi del servizio maggiormente suscettibili di miglioramento, su cui intervenire con priorità più elevata;
  3. Quadrante 3 (Area della competitività): componenti che qualificano il valore del servizio e devono essere mantenuti.
  4. Quadrante 4 (Area delle illusioni): è possibile che su queste componenti del servizio si stia profondendo un impegno inutile nell’assicurare agli utenti standard elevati di qualità; si potrebbe considerare di dirottare risorse nell’accrescere il livello di soddisfazione di altri aspetti;

Giudizio di soddisfazione sul singolo indicatore Importanza del singolo indicatore Basso^ Alto

Alta

Area delle criticità Priorità alta (2)

Area della competitività Priorità media (3)

Bassa

Area del monitoraggio Priorità media (1)

Area della illusioni Priorità alta (4) Tabella 7: Il significato dei quadranti nella mappa delle priorità

Parallelamente, si può procedere anche ad una rappresentazione analitica delle informazioni secondo la logica della tabella riportata sotto. Nelle righe della tabella vengono riportati i singoli indicatori di soddisfazione, nelle colonne i valori seguenti:

  1. il giudizio medio di soddisfazione per singolo indicatore (S)
  2. il giudizio medio di importanza cui il singolo indicatore appartiene (I)
  3. il quoziente tra importanza e soddisfazione (I/S).

Domanda del questionario

Soddisfazione media

Importanza media

Quozienti

R.4 4,55 5,46 1,
U.2 4,41 5,07 1,
U.4 4,66 5,07 1,
I.1 5,15 5,48 1,
R.2 5,15 5,46 1,
A.1 5,22 5,45 1,
R.3 5,25 5,46 1,
U.1 5 5,07 1,
S.1 5,06 5,13 1,
PA.1 5,5 5,55 1,
D.1 5,01 5 0,
R.1 5,53 5,46 0,

Tabella 8: Quozienti I/S (Importanza/Soddisfazione)

  1. L’amministrazione potrebbe anche avocarsi la responsabilità di sospendere – persino ignorare – le azioni di intervento su indicatori di criticità elevata. Si pensi ad esempio ad elementi quali la velocità di accesso al servizio o i tempi di erogazione dello stesso: tipicamente su questi temi le aspettative degli utenti risultano sistematicamente elevate e si registra una certa propensione a giudicare insoddisfacente, quasi a prescindere, la qualità del servizio. In realtà i giudizi scontano spesso una qualche asimmetria informativa, in quanto i cittadini esprimono un giudizio per così dire “astratto”, formatosi senza conoscere i meccanismi di funzionamento dell’organizzazione, le cui performance non sempre sono ottimizzabili. A questo occorre anche aggiungere i vincoli di risorse e fattibilità, che spesso rendono impraticabile, anche volendolo, il miglioramento di efficienza nel processo di erogazione del servizio. Ciò suggerisce che si possa adottare una prospettiva “strategica” nei programmi di miglioramento, che tenga conto della prospettiva interna in aggiunta a quella derivante dalle indagini di soddisfazione. Si creano così le condizioni per simulare diversi scenari di intervento, con la conseguenza di una maggiore flessibilità nella individuazione di percorsi di miglioramento coerenti con le politiche di indirizzo delle singole amministrazioni.
  2. Un’ultima notazione: potrebbe anche verificarsi il caso in cui la realtà osservata non presenti criticità di rilievo, dato il consenso unanime riscosso dal servizio oggetto di indagine. La metodologia proposta offre la possibilità di effettuare valutazioni di cambiamento anche in tale contesto: in alternativa alla decisione di mantenimento, potrebbero essere ipotizzati degli scenari di “downsizing” della qualità del servizio – senza naturalmente compromettere la performance complessiva – attraverso la riconfigurazione del processo di erogazione, per esempio mediante ri- allocazione delle risorse verso ambiti con fabbisogni più impellenti. Si ripropone quindi la necessità di gestire sinergicamente la conoscenza prodotta su base quantitativa attraverso l’indagine con quella di tipo qualitativo in capo al decisore, impiegando il sistema di analisi come supporto alle decisioni, piuttosto che come “produttore” di decisioni intrinsecamente valide.

1.6.4 Analisi multivariata

Uno degli obiettivi delle indagini di customer satisfaction è la valutazione dell’associazione tra la soddisfazione complessiva e ogni singolo indicatore di soddisfazione. Tuttavia in questo modo si procede a una scomposizione del problema in coppie di variabili e non si ha una visione d’insieme del fenomeno. Esistono in statistica tecniche di analisi più avanzate che permettono di studiare il fenomeno di interesse nella sua interezza, portando alla luce il sistema di relazioni fra variabili: in altre parole si dispone degli strumenti per comprendere come si forma la soddisfazione complessiva nei confronti del servizio a partire dai singoli indicatori di qualità che lo caratterizzano. Tali tecniche sono note come tecniche multivariate di analisi dei dati. Tra gli scopi dell’analisi multivariata, infatti, c’è quello di comprendere la presenza e l’entità degli effetti di interazione tra le variabili. Anche in questo caso la scelta della tecnica da adottare dipende dall’obiettivo che si intende raggiungere e dalla natura del dato. Per studiare ad esempio la dipendenza di un fenomeno da un insieme di variabili si può fare ricorso alla regressione multipla^5. Tramite il modello di regressione multipla si individuano le variabili – nel nostro caso gli indicatori di soddisfazione – che hanno un impatto diretto sul fenomeno di interesse, ossia la soddisfazione complessiva. Tuttavia, un limite dell’analisi di regressione è che la variabile di interesse (la soddisfazione complessiva) può essere influenzata dai fattori che dovrebbero formarla (gli indicatori puntuali di qualità) sia in via diretta che indiretta; inoltre è anche possibile che a loro volta tali fattori interagiscono tra loro. Per ovviare a questo limite metodologico e portare alla luce queste relazioni sono disponibili alcuni modelli statistici noti come sistemi esperti probabilistici (PES - Probabilistic Expert Systems ) o reti bayesiane (BN). Presentando la regressione multipla e i sistemi esperti probabilistici nei prossimi paragrafi si intende offrire una iniziale rappresentazione delle possibili alternative piuttosto che dare un quadro esaustivo delle tecniche di statistica multivariata. Altri modelli possono essere utilizzati. Tali modelli rispondono a obiettivi molteplici e consentono di ottenere informazioni differenziate che aumentano il know-how del management. Scegliere il modello che risponde in modo coerente agli obiettivi prefissati e la sua corretta applicazione può

(^5) Il metodo è utilizzabile per variabili continue. Nonostante ciò nella prassi il modello è usato anche per descrivere la soddisfazione

complessiva in funzione di una combinazione di indicatori di soddisfazione opportunamente selezionati.

essere complicato per chi non ha competenze specialistiche in questo ambito. Viceversa, l’interpretazione del risultato di un modello statistico è più facile per chi conosce il fenomeno da vicino. Per questo motivo, i modelli statistici in generale e i sistemi esperti in particolare, danno risultati apprezzabili quando sono applicati sotto la supervisione congiunta di statistici ed esperti del problema in oggetto.

Regressione lineare multipla Con il modello di regressione multipla si intende spiegare un fenomeno – variabile dipendente osservata – tramite le informazioni derivanti da un insieme di variabili dette esplicative, anche esse osservate. Nel modello di regressione multipla la variabile dipendente (codificata spesso con Y) è funzione di una combinazione lineare di variabili esplicative indicate con X 1 , X 2 ,... , Xn opportunamente selezionate. L’espressione analitica del modello è la seguente:

Y = α+ β 1 X 1 + β 2 X 2 +...+ β nXn + ε

I coefficienti β misurano la variazione della variabile dipendente al variare di un’unità della variabile esplicativa ad essi associata ferme restando le altre variabili indipendenti. Il coefficiente di ogni variabile, quindi, è interpretabile come una misura della relazione fra la variabile dipendente e ciascuna indipendente.

Il parametro α indica l’intercetta del modello mentre εi è un termine di errore.

La selezione delle variabili da inserire nel modello avviene con una serie di procedure statistiche che verificano, mediante opportuni test statistici, la significatività dei coefficienti delle variabili nel modello. Dal momento che un valore del coefficiente pari a zero annullerebbe la relazione funzionale tra la variabile esplicativa e quella dipendente, per validare la significatività dei coefficienti si verifica l’ipotesi (detta nulla) “il valore del coefficiente è uguale a zero” contro l’ipotesi alternativa “il valore è diverso da zero”. Per decidere quale delle due ipotesi è vera, si osserva un opportuno valore (di probabilità), detto p ( p value ). Se questo è superiore al livello di significatività rispetto al quale è stato costruito il test allora si accetta l’ipotesi nulla e si dice che il coefficiente non è significativo, altrimenti si accetta l’ipotesi alternativa. In questo secondo caso è come approvare che il coefficiente è significativamente diverso da zero e quindi la variabile ad esso associata viene inclusa nel modello. Il livello di significatività del test (α) è solitamente

fissato pari a 0,.

Il modello di regressione può essere costruito, ossia le variabili esplicative che ne fanno parte possono essere scelte, ad esempio, tramite una procedura per passi detta stepwise. La direzione della procedura può essere forward o backward. Nel caso forward si parte stimando un modello che contiene una sola variabile esplicativa e si aggiungono una alla volte le variabili che presentano un coefficiente significativo; nel caso backward si parte da un modello che contiene tutte le variabili esplicative e, di volta in volta, si eliminano dal modello le variabili che presentano un coefficiente non significativo. La procedura stepwise invece alterna in modo più opportuno passi forward e passi backward. Venendo alla realtà di nostro interesse, attraverso il modello si intende spiegare la soddisfazione complessiva

  • ossia variabile dipendente del modello – tramite gli indicatori di soddisfazione, che svolgono il ruolo di variabili indipendenti (esplicative). Verosimilmente, non tutte le variabili esplicative risulteranno significative nello spiegare la soddisfazione complessiva. La scrematura si esegue sulla base dei risultati dell’output della regressione. La prima informazione dell’output è l’equazione di regressione con tutte le variabili esplicative corrispondenti agli indicatori del questionario, cui si associa la stima dei rispettivi coefficienti che indicano la misura dell’impatto sulla soddisfazione del singolo indicatore. L’output restituisce anche una tabella che riporta per ogni coefficiente (intercetta compresa) informazioni circa la significatività del coefficiente^6. Di particolare interesse è il valore p: i valori p superiori a 0,05 suggeriscono che quella variabile è da eliminare dal modello. Un esempio di equazione di regressione e della tabella con i valori p associati ai diversi coefficienti è riportato di seguito: Equazione di regressione calcolata a partire dai dati (giudizi di soddisfazione complessiva verso il servizio e verso i singoli indicatori di qualità) raccolti a seguito di un’indagine di customer satisfaction: Soddisfazione complessiva = 0,681 + 0,213 A.1 + 0,0998 I.1 + 0,098 R.1 - 0,176 R.2 + 0,200 R.3 + 0, R.4 + 0,0643 D.1 + 0,280 U.1 - 0,0176 U.2 + 0,002 PA.1+ 0,0478 S. Nella tabella seguente codici e valori associati a ciascun indicatore sono dettagliati per facilità di comprensione.

(^6) Tale output è ottenuto adottando una procedura stepwise backward con il software Minitab. A parità di procedura di selezione l’utilizzo di altri software porterebbe alle medesime conclusioni.

significatività): facilità di accesso al servizio on-line (A.1); tempo di connessione per la compilazione della domanda (R.3); facilità di comprensione di criteri per definire la graduatoria (R.4); possibilità di contattare facilmente il personale dell’amministrazione (U.1). Pertanto, esso sta ad indicare che le variabili esplicative predicono efficacemente la variabile dipendente. In fase di interpretazione di tale valore è opportuno leggere anche l’ R 2 -adj (ossia aggiustato) che è il valore con un fattore di penalità per il numero di variabili esplicative. Nell’esempio il valore dell’ R^2 -adj raggiunge il valore di 81,7%. Un valore del coefficiente troppo basso suggerisce che il modello di regressione manca di alcune variabili esplicative; viceversa, un valore troppo elevato (maggiore di 0,9) può essere sintomo di correlazione fra le variabili esplicative, come se queste fossero somiglianti l’una all’altra e dunque incapaci di rappresentare in modo appropriato le diverse sfaccettature della realtà osservata. Da notare che il modello di regressione può essere anche usato in modo predittivo per stimare, in un certo tempo T, il valore futuro (non ancora osservato) della variabile indipendente sulla base dei valori assunti dalle variabili indipendenti al tempo T. Per questo motivo le variabili indipendenti sono anche dette predittori.

Modelli probabilistici esperti Uno dei possibili obiettivi dell’analisi dei dati può essere la comprensione del percorso logico attraverso il quale si genera la soddisfazione dei cittadini in riferimento a un servizio erogato. In pratica si può essere interessati a costruire una “rete” di relazioni dirette e indirette fra la soddisfazione complessiva e gli indicatori di soddisfazione da cui essa è dipendente. Il modello di regressione lineare ammette solo l’individuazione delle variabili direttamente collegate all’effetto soddisfazione complessiva, ma non permette l’individuazione né degli elementi che la influenzano in via indiretta, né delle relazioni che intercorrono tra le variabili. È quindi utile indagare sulla struttura di dipendenza tramite altri strumenti statistici. Per modellare le relazioni tra le variabili si può far ricorso ai modelli grafici in generale e ai sistemi esperti probabilistici ( Probabilistic Expert System – PES o reti bayesiane) in particolare. Si tratta di modelli di statistica multivariata per lo studio delle relazioni di dipendenza tra le variabili. Pure se certamente complessi, tali modelli, se consapevolmente adottati, possono rappresentare un valido supporto alle decisioni manageriali^8. Inoltre, ammettendo una rappresentazione grafica delle relazioni tra le variabili, i sistemi esperti probabilistici sono in grado di facilitare la comunicazione e l’interazione fra decisori con diverso background culturale^9. La base della rappresentazione grafica di un PES è una rete (detta grafo), costituita dalle variabili (rappresentate da nodi) e dalle dipendenze fra di esse (rappresentate da frecce). La rappresentazione grafica dei modelli ricorda il diagramma causa-effetto (noto anche sotto il nome di diagramma di Ishikawa), nel quale un effetto – per esempio la soddisfazione complessiva – dipende da una serie di cause dirette e indirette (i singoli indicatori di soddisfazione). Mentre, però, il diagramma causa-effetto ha una natura qualitativa (solitamente, infatti, la sua costruzione deriva da un approccio di tipo brainstorming per l’analisi dei processi) nei PES, la dipendenza/indipendenza tra due variabili (ossia, graficamente, la presenza /assenza tra due nodi), viene studiata direttamente a partire dai dati tramite l’utilizzo di algoritmi computazionalmente efficienti implementati in diversi software per la costruzione di modelli grafici (MIM, Hugin, R). Si osservi che poiché la struttura di relazione viene stimata direttamente dai dati, ossia dalle osservazioni campionarie, se il campione non è statisticamente significativo (estratto casualmente e sufficientemente ampio) è imprudente generalizzare i risultati campionari all’intera popolazione. Questa considerazione è importante anche alla luce dei possibili utilizzi dello strumento. Una volta sistemato, il modello è a sua volta utilizzabile per simulare scenari secondo la logica “what if” e di conseguenza può essere impiegato come uno strumento di supporto alle decisioni. Applicato a un dataset relativo a un’indagine di customer satisfaction il modello consente di comprendere dove è più opportuno intervenire sul servizio nell’ottica di migliorarne la qualità. Un esempio di struttura di dipendenza appresa grazie all’applicazione del modello è il seguente.

(^8) Per approfondimenti si veda: “Probabilistic expert systems for managing information to improve services” di M.F. Renzi, P. Vicard, R. Guglielmetti & F. Musella (2009) in “ The TQM journal ”, vol. 21, Issue 4 - pp. 429-. (^9) Per approfondimenti sul tema dei modelli grafici e dei sistemi esperti probabilistici si veda: R. G. Cowell, A. P. Dawid, S. L. Lauritzen, and D. J. Spiegelhalter, (1999), Probabilistic Networks and Expert Systems. Springer, New York; S.L. Lauritzen, (1996), Graphical Models , Clarendon Press; R. E. Neapolitan, (2004), Learning Bayesian Networks , Upper Saddle River (NJ), Prentice Hall.

Figura 5: Esempio di rete costruita attraverso un sistema esperto probabilistico

La soddisfazione complessiva è influenzata da due cause dirette (accessibilità al servizio e adeguatezza del tempo di connessione) e da diverse cause indirette. A ciascuna variabile è associata una tabella di probabilità marginali che mostra la relativa distribuzione (espressa in percentuale) dei giudizi di soddisfazione accorpati, nell’esempio, in due classi (1, 2, 3 primo livello; 4, 5, 6 secondo livello).

Figura 6: Probabilità marginale associate ad ogni nodo della rete