Pobierz Operacjonalizacja i skalowanie w ilościowych badaniach społecznych i więcej Publikacje w PDF z Statyka tylko na Docsity! Tytuł artykułu Operacjonalizacja i skalowanie w ilościowych badaniach społecznych Dorota Węziak-Białowolska Zeszyty naukowe Instytut Statystyki i Demografii SGH Nr 16, rok 2011 Working papers Zeszyty naukowe Streszczenie Niniejszy tekst jest efektem prac badawczych mających na celu zebranie i uporządkowanie pojęć i metod związanych z początkowymi etapami przygotowania naukowego badania ilościowego. Jednocześnie stanowi punkt wyjścia do kolejnych zadań badawczych, które obejmą zebranie i uporządkowanie metod (1) zbierania danych niezbędnych do realizacji załoŜonych celów badawczych, (2) ich odpowiedniego przygotowania oraz (3) analizy. Tekst został w całości poświęcony zagadnieniom związanym z operacjonalizacją badanych pojęć oraz metodom ich skalowania. Ze względu na charakter opracowania (część większej pracy badawczej) tematyka została celowo zawęŜona do tych obszarów. Tekst został przygotowany w ten sposób, aby nie tylko prezentować podstawy teoretyczne przedstawionych zagadnień, ale równieŜ ilustrować je skrótowymi przykładami zastosowań w badaniach naukowych wraz ze wskazaniem, gdzie moŜna znaleźć pełen opis. Ponadto w sposób zamierzony nie prezentowano szczegółowo zagadnień metodologicznych omawianych w wielu podręcznikowych pozycjach polskojęzycznych. Tekst składa się z dwóch głównych części: operacjonalizacja oraz pomiar i skalowanie. W części poświęconej operacjonalizacji pokrótce przedstawiono etapy projektowania badania naukowego ze szczególnym naciskiem na etap budowy modelu konceptualnego oraz jego operacjonalizację. W części poświęconej zagadnieniom pomiaru i skalowania najpierw omówiono zagadnienia związane z definicjami pomiaru i skalowania, a następnie przedstawiono wybrane metody skalowania. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 4 budowy skal sumarycznych, natomiast przy skalowaniu czynnikowym największy nacisk połoŜono na zaakcentowanie moŜliwości tworzenia skal wielowymiarowych. Ponadto w ramach drugiego z podejść pokrótce scharakteryzowano podstawy teoretyczne, a następnie zaprezentowano przykłady zastosowań w dwóch obszarach: eksploracyjnym oraz konfirmacyjnym. 2. Operacjonalizacja KaŜdemu badaniu naukowemu1, juŜ na samym jego początku, powinien zostać postawiony cel. Taki cel powinien zostać wyraźnie sformułowany. MoŜe to być jeden cel, bądź teŜ celów takich moŜe być kilka. W przypadku sformułowania kilku celów mogą to być cele równowaŜne, bądź teŜ badacz wskazać moŜe cel główny oraz cele szczegółowe, których realizacja składa się na cel główny. W sytuacji gdy badane zagadnienie jest dosyć nowe (np. brak jest na jego temat literatury), zaś badanie słuŜy wyjaśnieniu jego istoty oraz związków między nim a światem zewnętrznym, celem badania moŜe być określenie charakteru zjawiska, jego struktury oraz metody jego pomiaru. W takiej sytuacji cel badania sformułować moŜna tak, jak zrobiła to Węziak-Białowolska: „za cel badania przyjęto zdefiniowanie modelu konceptualnego kapitału intelektualnego regionu, zaproponowanie jego modelu pomiarowego oraz w kontekście zaproponowanych rozwiązań wykazanie, Ŝe moŜe on stanowić dodatkowy wymiar w analizie porównawczej regionów Polski”2 Tak sformułowany cel jest celem głównym. W tym konkretnym przypadku jego realizacja obejmowała realizację szeregu celów cząstkowych. Ich sformułowanie oraz związki z celem głównym przedstawiono w tabeli 1. 1 Postulat ten dotyczy równieŜ badań nienaukowych – biznesowych 2 Węziak-Białowolska D., 2008, Model kapitału intelektualnego regionu – koncepcja pomiaru i jej zastosowanie w analizie porównawczej regionów, rozprawa doktorska, Kolegium Analiz Ekonomicznych, Szkoła Główna Handlowa, Warszawa, s. 7 Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 5 Tabela 1. Przykładowe cele szczegółowe i ich związek z celem głównym Cel szczegółowy Element celu głównego 1. Uporządkowanie pojęć, definicji i klasyfikacji związanych z koncepcją kapitału intelektualnego oraz w konsekwencji przedstawienie definicji kapitału intelektualnego regionu. „zdefiniowanie modelu konceptualnego kapitału intelektualnego regionu” 2. Sformułowanie modelu konceptualnego kapitału intelektualnego regionu. 3. Operacjonalizacja modelu konceptualnego kapitału intelektualnego regionu. „zaproponowanie jego modelu pomiarowego” 4. Pomiar poszczególnych elementów kapitału intelektualnego zgodnie z modelem konceptualnym oraz ocena ich trafności i rzetelności. 5. Weryfikacja związków załoŜonych w hipotezach badawczych „wykazanie, Ŝe moŜe on stanowić dodatkowy wymiar w analizie porównawczej regionów Polski” 6. Wykazanie, Ŝe wskaźnik kapitału intelektualnego moŜe słuŜyć do oceny kondycji gospodarki i poziomu rozwoju gospodarczego. Źródło: opracowanie własne na podstawie Węziak-Białowolska D., Model kapitału intelektualnego regionu. Koncepcja pomiaru i jej zastosowanie, Oficyna Wydawnicza SGH, Warszawa 2010 Sformułowanie celów cząstkowych wyznacza niejako kolejne etapy postępowania badawczego mającego na celu zaprojektowanie badania naukowego (rysunek 1). Postępowanie to obejmuje oprócz ustalenia celu bądź celów badawczych, sformułowanie hipotez badawczych oraz pytań badawczych, przedstawienie modelu konceptualnego, a następnie modelu operacyjnego, które to prowadzić powinny do zaprojektowania narzędzia pomiarowego (np. kwestionariusza ankietowego lub eksperymentu). Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 6 Rysunek 1. Etapy projektowania badania naukowego. Źródło: opracowanie własne Umiejscowienie na powyŜszym rysunku etapów hipotezy badawcze i pytania badawcze oraz model konceptualny nie jest stałe. To od badacza, celu badania i jego specyfiki zaleŜy, czy najpierw sformułuje się model konceptualny a potem hipotezy i pytania badawcze, czy teŜ odwrotnie3. Po określeniu celów badawczych konieczne jest sformułowanie hipotez badawczych, a więc pewnych przypuszczeń dotyczących badanych zagadnień, które będą weryfikowane w procesie badawczym. Przypuszczenia te powinny zostać sformułowane w języku dyscypliny, której dotyczy badanie. Warto podkreślić, Ŝe hipotezy badawcze mogą zostać potwierdzone lub odrzucone w toku procesu badawczego. Oba te rezultaty są równie waŜne i dostarczają wiedzy o badanym zagadnieniu. Przykładowo w odniesieniu do celów zestawionych w tabeli 1 sformułowano następujące hipotezy badawcze4: 3 Częstokroć to model konceptualny poprzedza etap hipotez i pytań badawczych, poniewaŜ hipotezy stanowią słowny opis wszystkich zaleŜności (ilustrowanych w postaci strzałek) występujących w modelu konceptualnym. 4 Węziak-Białowolska D., Model kapitału intelektualnego regionu. Koncepcja pomiaru i jej zastosowanie, Oficyna Wydawnicza SGH, Warszawa 2010, s. 16 Hipotezy badawcze i pytania badawcze Model konceptualny - zmienne i ich układ Cel badania Model operacyjny – operacjonalizacji zmiennych Narzędzie pomiarowe – np. pytania kwestionariusza ankietowego Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 9 Sformułowanie hipotez i pytań badawczych zmusza badacza do zdefiniowania wszystkich elementów badanego zjawiska oraz do zastanowienia się nad potencjalnymi związkami, które mogą między nimi wystąpić. Ponadto kaŜe równieŜ zastanowić się, jakie związki występują między badanym zjawiskiem (często z uwzględnieniem jego poszczególnych elementów) a światem zewnętrznym. Przedstawienie tych wszystkich elementów (pojęć i zjawisk związanych z badanym zjawiskiem, jak równieŜ ze światem zewnętrznym względem niego) oraz występujących między nimi związków określa się mianem budowy modelu konceptualnego. Model konceptualny jest modelem badawczym, według którego badacz analizować będzie badane zjawisko. Do jego sformułowania niezbędne jest zapoznanie się z literaturą na temat badanego zjawiska. Prześledzić naleŜy: (1) teorię badanego zjawiska, (2) pojęcia, które są z nim związane oraz (3) ich klasyfikację, (4) związki, jakie między tymi pojęciami mogą wystąpić oraz (5) związki, jakie mogą wystąpić między badanym pojęciem a światem zewnętrznym. Nie wszystkie z tych elementów muszą wystąpić w modelu konceptualnym. Decyzję o tym, co powinno zostać uwzględnione, podejmuje badacz na podstawie analizy celów badawczych, które sobie wytyczył. Jeśli pewne elementy potencjalnego modelu konceptualnego (np. związki między wybranymi zjawiskami, czy procesami) wydają się ciekawe, ale nie przewidziano ich analizy w celach badawczych, nie powinno się ich uwzględniać w modelu konceptualnym. Ich analiza, choć moŜe dostarczyć ciekawych informacji, nie będzie moŜliwa do wykorzystania. Oczywiście alternatywą jest zawsze rozszerzenie listy celów badawczych. W przypadku gdy analizowany problem ma charakter nowatorski, model konceptualny moŜe w całości opierać się na hipotezach badawczych sformułowanych przez badacza wyłącznie na podstawie wiedzy własnej i intuicji. Bez względu na to, jakie podstawy merytoryczne leŜały u podstaw konstrukcji modelu konceptualnego, waŜne jest, aby model ten ujmował problem w sposób całościowy i kompletny. Często do przedstawienia modelu konceptualnego korzysta się z formy graficznej i buduje się schemat ilustrujący wszystkie elementy badanego zjawiska oraz wskazuje się na powiązania między nimi. Przy ilustrowaniu powiązań waŜne jest nie tylko wskazanie tych, których występowania badacz się spodziewa, ale naleŜy równieŜ pokazać, jaki jest kierunek tych związków5. MoŜliwe jest przedstawienie kilku wariantów takich powiązań. Podkreślić naleŜy, Ŝe schemat taki powinien odzwierciedlać problem badawczy w sposób całościowy. 5 związki przyczynowo-skutkowe ilustruje się za pomocą strzałki z grotem skierowanym od przyczyny do skutku; natomiast związki korelacyjne (bez wskazania przyczyny i skutku) ilustruje się strzałkami o grotach na obu końcach; Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 10 Aby zilustrować mechanizm budowy modelu konceptualnego poniŜej przedstawiono przykład takiego postępowania na przykładzie pomiaru kapitału społecznego na podstawie Diagnozy Społecznej (tabela 3). Tabela 3. Przykład budowy modelu konceptualnego – kapitał społeczny na podstawie Diagnozy Społecznej. Etap budowy modelu konceptualnego Przykład 1. Definicja pojęcia na podstawie badań literatury Kapitał społeczny zdefiniowano jako zespół norm społecznych oraz wspólnie podzielanych wartości i zwyczajów kształtujących świat relacji społecznych i ekonomicznych, a wyraŜających się przede wszystkim w poziomie zaufania społecznego oraz zaufania do instytucji, a takŜe skali formalnych i nieformalnych międzyludzkich sieci powiązań odpowiedniej jakości. 2. Klasyfikacja pojęć występują- cych w definicji na podstawie badań literatury Kierując się pracami van Oorschota, Artsa i Gelissena [2006] wyróŜniono trzy wymiary kapitału społecznego: zaufanie, sieci oraz normy. W ramach dwóch z trzech wymiarów wyróŜniono po dwa podwymiary. Były to: (1) Zaufanie: (a) do instytucji, (b) do innych osób; (2) Sieci: (a) aktywność obywatelska, (b) kontakty towarzyskie; 3. Określenie powiązań między pojęciami „Kapitał społeczny to … wyraŜających się przede wszystkim w poziomie zaufania społecznego oraz zaufania do instytucji, a takŜe skali formalnych i nieformalnych międzyludzkich sieci powiązań odpowiedniej jakości.” Ze względu na nieobserwowalny bezpośrednio charakter kapitału społecznego oraz jego wymiarów przyjęto, Ŝe kapitał społeczny ujawnia się w swoich trzech wymiarach. Natomiast o istnieniu wymiarów kapitału społecznego świadczą ich symptomy. 4. Model konceptualny – forma graficzna Źródło: opracowanie własne na podstawie Węziak-Białowolska D., 2011, Kapitał społeczny w Polsce w świetle Diagnozy Społecznej – pomiar i wyniki, Studia Demograficzne (w druku). zaufanie zaufanie do instytucji zaufanie w stosunku do ludzi normy kapitał społeczny sieci kontakty towarzyskie aktywność obywatelska Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 11 Operacjonalizacja modelu konceptualnego Naturalną konsekwencją sformułowania modelu konceptualnego jest jego operacjonalizacja. Operacjonalizacja to proces słuŜący stworzeniu definicji operacyjnej zarówno dla pojęć, jak i związków między nimi. Jest to takie opisanie wszystkich elementów modelu konceptualnego (zarówno pojęć, jak i związków między nimi), aby: − ich rozumienie nie tylko przez badawcza, ale i inne osoby było takie samo; oznacza to, Ŝe wszystkie abstrakcyjne pojęcia powinny zostać wyraŜone jak najbardziej jednoznacznie oraz w formie zdarzeń, które moŜna zmierzyć, − umieć określić charakter zjawisk opisywanych przez pojęcia w modelu konceptualnym; oznacza to, Ŝe naleŜy podjąć decyzję, czy dane zjawisko moŜna obserwować i mierzyć wprost (np. płeć), czy teŜ jego charakter jest bardziej złoŜony (np. wielowymiarowy i/lub nieobserwowalny bezpośrednio), − umieć odpowiedzieć na pytanie: jak konkretnie mierzyć wszystkie elementy występujące, w modelu konceptualnym czyli: • w przypadku projektowania badania ankietowego – jakie pytanie kwestionariusza zastosować, czy wystarczy jedno pytanie, czy teŜ powinno być ich kilka, jeśli kilka, to jak je ze sobą powiązać, czy teŜ naleŜy je analizować niezaleŜnie, jakiego słownictwa w nim (nich) uŜyć, jakie formy odpowiedzi zastosować, • w przypadku korzystania z danych zastanych – które dane moŜna wykorzystać do pomiaru określonego pojęcia, jakie zmienne/pytania, czy wystarczy jedno pytanie, czy teŜ powinno być ich kilka, jeśli kilka, to jak je ze sobą powiązać, czy teŜ naleŜy je analizować niezaleŜnie, • określić metodę pomiaru związków występujących między pojęciami występującymi w modelu konceptualnym (np. współczynnik korelacji liniowej Pearsona, współczynnik zbieŜności V-Kramera itd.). Niedokładne przeprowadzenie operacjonalizacji lub co gorsza pominięcie jej, uniemoŜliwia całkowicie wyciąganie wiarygodnych wniosków co do relacji zachodzących między mierzonymi zmiennymi, a takŜe interpretację wyników analiz przeprowadzonych na danych. W celach ilustracyjnych w tabeli 4 przedstawiono operacjonalizację kapitału społecznego według modelu konceptualnego przedstawionego w tabeli 3. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 14 Przedstawiona w tabeli 4 operacjonalizacja kapitału społecznego został przeprowadzona w taki sposób, aby pomiar był moŜliwy do przeprowadzenia. Przeprowadzono ją po uprzednim wyborze źródła danych, stąd wybór zmiennych do mierzenia poszczególnych elementów modelu konceptualnego mógł być bardzo precyzyjny. Niemniej jednak operacjonalizację modelu konceptualnego moŜna przeprowadzić w formie bardziej ogólnej, jeszcze przed przeprowadzeniem badania ankietowego. Przykład taki przedstawiono w tabeli 5. Tabela 5. Operacjonalizacja modelu orientacji przedsiębiorstwa na wiedzę. Etap procesu badawczego Przykład Definicja na podstawie badań literatury Mazur, Rószkiewicz, StrzyŜewska7 zaproponowały model konceptualny wiąŜący wyniki ekonomiczne przedsiębiorstw ze stopniem zorientowania na wiedzę zarówno kadry menedŜerskiej jak i przedsiębiorstwa rozumianego jako organizacji. Zaproponowany model teoretyczny zakłada występowanie dwóch elementarnych dla całej koncepcji kategorii, tj. postawy wobec wiedzy, będącej cechą kadry kierowniczej oraz orientacji na wiedzę przedsiębiorstwa, rozumianej jako właściwość prowadzonej działalności ekonomicznej. Model konceptu- alny Operacjona -lizacja Zarówno postawa kadry kierowniczej wobec wiedzy jak i orientacja przedsiębiorstwa na wiedzę są konstruktami intelektualnymi, czyli kategoriami bezpośrednio nieobserwowalnymi, które mogą podlegać pomiarowi tylko za pośrednictwem innych zmiennych, tzw. wskaźników postawy lub orientacji. ZałoŜenia przyjęte w zdefiniowanym modelu teoretycznego wskazują, Ŝe mamy do czynienia z jedną zmienną latentną egzogeniczną, opisującą postawę kadry kierowniczej (F) oraz wektorem powiązanych z nią zmiennych mierzalnych, które stanowią deskryptory kadry kierowniczej (Xi). Ponadto w modelu występują endogeniczne zmienne latentne, opisujące aktywność przedsiębiorstwa w obszarach 7 Mazur J., Rószkiewicz M., StrzyŜewska M., 2005, Orientacja na wiedzę a wyniki ekonomiczne przedsiębiorstwa. Konceptualizacja badań, „Współczesne Zarządzanie”, nr 1/2005, p. 5-23. Orientacja na wiedzę kadry kierowniczej Orientacja przedsiębiorstwa na wiedzę Wyniki ekonomiczne przedsiębiorstwa Orientacja przedsiębiorstwa na wiedzę w obszarze pozyskiwania i upowszechniania danych Orientacja przedsiębiorstwa na wiedzę w obszarze tworzenia i upowszechniania wiedzy Orientacja przedsiębiorstwa na wiedzę w obszarze wykorzystania i transferu wiedzy poza przedsiębiorstwo Wskaźniki wyników ekonomicznych Wskaźniki orientacji na wiedzę kadry kierowniczej Wskaźniki działalności przedsiębiorstwa odnoszące się do pozyskiwania i upowszechniania danych, tworzenia i upowszechniania wiedzy oraz wykorzystywania i transferu wiedzy poza przedsiębiorstwo Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 15 orientacji na wiedzę (Vk) (przyjęto występowanie trzech obszarów, czyli k = 1, 2, 3) oraz zmienna opisująca orientację na wiedzę przedsiębiorstwa w ogóle (V). Zmienne te są powiązane bezpośrednio lub pośrednio ze zmiennymi mierzalnymi, które dotyczą konkretnych działań w obszarach orientacji na wiedzę przedsiębiorstwa (Yj). Ostatnią grupę zmiennych w zdefiniowanym modelu zaleŜności tworzą zmienne mierzalne odnoszące się do wyników ekonomicznych przedsiębiorstwa (Zp). Schemat modelu operacyjne- go The managers’ knowledge orientation Latent variable F Knowledge orientation of a company Latent variable V Economic performance of a company Latent variable Q Knowledge orientation of a company Latent variable Vk Economic performance of a company Latent variable Ql Observable variables indicators Xi Observable variables indicators Xi Observable variables indicators Xi Knowledge orientation of a company Latent variable Vk Knowledge orientation of a company Latent variable Vk Economic performance of a company Latent variable Ql Economic performance of a company Latent variable Ql Observable variables indicators Xi Observable variables indicators Xi O s rvable variables indicators Xi Observable variables indicators Xi Observable variables indicators Xi bservable v riables Indicators Yi Observable variables indicators Xi Observable variables indicators Xi bservable v riables indicators Zi Metoda analizy związku między pojęciami Rodzaje zmiennych i zaleŜności miedzy nimi wskazują, Ŝe zdefiniowany model ma własności modelu strukturalnego Źródło: Mazur J., Rószkiewicz M., StrzyŜewska M., 2005 oraz M. Rószkiewicz, D. Węziak, Model orientacji przedsiębiorstwa na wiedzę – próba operacjonalizacji, Prace i Materiały Wydziału Zarządzania Uniwersytetu Gdańskiego, Nr 5(2007), Wydział Zarządzania Uniwersytetu Gdańskiego, Fundacja Rozwoju Uniwersytetu Gdańskiego, Sopot 2007, s. 287-302 Operacjonalizacja modelu orientacji przedsiębiorstwa na wiedzę Mazur, Rószkiewicz i StrzyŜewskiej8 obejmowała następujące kroki. Najpierw na podstawie badań literatury opisana została koncepcja orientacji na wiedzę przedsiębiorstwa. Na tej podstawie sformułowano i przedstawiono w formie graficznej model konceptualny tej koncepcji. Obejmował on wszystkie pojęcia w niej występujące, jak równieŜ definiował występujące między nimi związki. Następnie przeprowadzono operacjonalizację tych pojęć. Przyjęto, Ŝe wszystkie mają charakter nieobserwowalny bezpośrednio. NaleŜało zatem określić, jakie są symptomy ich występowania, czyli jakie zjawiska świadczą o tym, Ŝe dane pojęcie występuje. To następnie pozwoliło określić, za pomocą jakich zmiennych powinny być one mierzone. Ponadto okazało się, Ŝe orientacja na wiedzę przedsiębiorstwa jest pojęciem złoŜonym – trójwymiarowym. Składają się na nie: (1) orientacja przedsiębiorstwa na wiedzę w obszarze pozyskiwania i upowszechniania danych, (2) orientacja przedsiębiorstwa na wiedzę w obszarze tworzenia wiedzy i jej upowszechniania, (3) orientacja przedsiębiorstwa na wiedzę 8 Mazur J., Rószkiewicz M., StrzyŜewska M., 2005, Orientacja na wiedzę a wyniki ekonomiczne przedsiębiorstwa. Konceptualizacja badań, „Współczesne Zarządzanie”, nr 1/2005, p. 5-23. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 16 w obszarze wdraŜania wiedzy i jej transferu poza przedsiębiorstwo. NaleŜało zatem przeprowadzić równieŜ proces operacjonalizacji kaŜdego z wymiarów orientacji przedsiębiorstwa na wiedzę. W stosunku do kaŜdego z nich trzeba było określić, jakie są symptomy ich występowania. W ten sposób zdecydowano, Ŝe symptomy te zostaną zmierzone w specjalnie zaprojektowanym badaniu ankietowym, którego poszczególne części zawierać będą zestawy pytań bądź stwierdzeń opisujących kaŜdy w wymiarów orientacji na wiedze przedsiębiorstwa oraz orientację na wiedzę kadry kierowniczej. Ponadto w modelu operacyjnym określono związki między pojęciami. Kierunek strzałek pokazuje, Ŝe załoŜono (a później weryfikowano), Ŝe postawa kadry kierowniczej w stosunku do wiedzy (orientacja kadry kierowniczej na wiedzę) wpływa na orientację na wiedzę całego przedsiębiorstwa, zaś orientacja na wiedzę przedsiębiorstwa wpływa na jego wyniki ekonomiczne. Warto podkreślić, Ŝe zarówno w modelu konceptualnym, jak i w modelu operacyjnym wpływ postawy kadry kierowniczej na wyniki ekonomiczne przedsiębiorstwa jest jedynie pośredni – przez orientację na wiedzę przedsiębiorstwa. Choć autorki badania zaproponowały tylko jeden model konceptualny, moŜliwe było zaproponowanie konceptualizacji alternatywnej. Przy okazji omawiania kwestii operacjonalizacji pojęć warto przedstawić obecną od niedawna w literaturze i praktyce koncepcję konceptu lub konstruktu postulowanego przez teorię (ang. concept-by-postulation) oraz konceptu lub konstruktu intuicyjnego (ang. concept- by-intuition)9. Koncepcja konceptu lub konstruktu intuicyjnego mówi, Ŝe konstrukt taki moŜe być postrzegany przez ludzkie zmysły, zaś jego znaczenie jest natychmiast jednoznacznie rozumiane zarówno przez badacza, jak i respondenta. Natomiast w przypadku konstruktu postulowanego przez teorię rozumienie nie jest oczywiste i jednoznaczne. Określenie znaczenia konstruktu postulowanego przez teorię wymaga tej właśnie teorii. Na jej podstawie wnioskuje się o znaczeniu konstruktu i tworzy się jego definicję operacyjną. Innymi słowy, o ile konstrukty intuicyjne nie wymagają dodatkowych objaśnień, to konstrukty postulowane przez teorię nie będą właściwie i jednoznacznie zmierzone bez definicji operacyjnej. Przykładowo, kapitał społeczny – zgodnie z konceptualizacją oraz operacjonalizacją przedstawioną powyŜej – nie tylko jest bezpośrednio nieobserwowalny, ale równieŜ ma wielowymiarową strukturę oraz niejednoznaczny charakter. Kwantyfikuje się go zatem korzystając ze zmiennych obserwowalnych będących wskaźnikami jego występowania, 9 Saris, W. E., Gallhofer, I. N., 2007, Design, Evaluation, and Analysis of Questionnaires for Survey Research. Hoboken, NJ: Wiley Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 19 Dodatkowo Frankfort-Nachmias i Nachmias twierdzą, Ŝe skala pomiarowa powinna charakteryzować się jednowymiarowością, tzn. Ŝe zbiór pozycji składających się na skalę powinien odzwierciedlać tylko jeden wymiar. Innymi słowy wszystkie pozycje, z których składa się narzędzie pomiarowe, mogą być umieszczone na kontinuum odnoszącym się do jednego i tylko jednego pojęcia18. Decyzję o tym, w jaki sposób wyskalować dane zjawisko lub pojęcie, badacz podejmuje na podstawie jego konceptualizacji i operacjonalizacji. To wtedy badacz decyduje, czy: − badane zjawisko lub pojęcie ma charakter obserwowalny bezpośrednio, czy teŜ nieobserwowalny bezpośrednio (ukryty, latentny), − badane zjawisko lub pojęcie ma charakter prosty, czy teŜ charakter złoŜony (wtedy mówi się, Ŝe składa się z wielu elementów składowych lub wymiarów). W przypadku pomiaru cech obserwowalnych bezpośrednio zwykle do pomiaru stosuje się pojedyncze pytania lub skale proste. W przypadku zjawisk nieobserwowalnych bezpośrednio naleŜy określić, jakie zjawiska, które moŜna zaobserwować, są symptomami lub wskaźnikami występowania zjawisk nieobserwowalnych. Ponadto trzeba określić równieŜ strukturę badanego zjawiska – czy jest to zjawisko jednowymiarowe, czy teŜ wielowymiarowe. Innymi słowy, trzeba określić, za pośrednictwem jakiego zestawu zmiennych wskaźnikowych, zwanych równieŜ wskaźnikami lub indykatorami, moŜna mierzyć zjawisko latentne. KaŜda taka zmienna wskaźnikowa skalowana moŜe być za pomocą pojedynczego pytania lub skali prostej lub teŜ za pomocą jednej (w przypadku jednowymiarowych zjawisk nieobserwowalnych) lub kilku skal złoŜonych19 (w przypadku wielowymiarowych zjawisk nieobserwowalnych). Jeśli zjawisko lub pojęcie latentne ma charakter prosty, równieŜ do jego pomiaru stosuje się pojedyncze pytania lub skale proste. Natomiast jeśli zjawisko latentne ma charakter złoŜony, czyli wielowymiarowy zastosowanie mają metody skalowania wielowymiarowego stosowane do zestawu kilku lub kilkunastu pytań bądź skal prostych. Skale proste to pojedyncze pytania lub stwierdzenia o określonej skali odpowiedzi. Zwykle skala odpowiedzi moŜe być: (1) nominalna, (2) porządkowa, (3) przedziałowa lub (4) ilorazowa, co odpowiada klasyfikacji skal zaproponowanej przez Stevensa20. O skali 18 Ch. Frankfort-Nachmias, D. Nachmias, op. cit., s. 471. 19 Skala złoŜona to zestaw określonej liczby skal prostych lub zestaw kliku bądź nawet kilkunastu pytań lub stwierdzeń. 20 Rószkiewicz M., Metody ilościowe w badaniach marketingowych, Wydawnictwo Naukowe PWN, Warszawa 2002; Sagan A., Badania marketingowe. Podstawowe kierunki. Wydawnictwo Akademii Ekonomicznej w Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 20 nominalnej mówi się, gdy pozwala ona wyłącznie na identyfikację kategorii odpowiedzi lub typów mierzonych obiektów. O skali porządkowej mówi się, gdy – oprócz moŜliwości identyfikacji kategorii odpowiedzi lub typów mierzonych obiektów – pozwala ona równieŜ na ustalenie ich porządku. Skala przedziałowa słuŜy zarówno do identyfikacji kategorii odpowiedzi lub typów mierzonych obiektów, ustalania porządku rodzajów odpowiedzi, ale równieŜ porównywania ocenianych obiektów między sobą. Porównania te przeprowadzane są w formule absolutnej, tj. określić moŜna, o ile dany obiekt jest lepszy lub gorszy od innego obiektu. Skala ilorazowa posiada natomiast (oprócz własności wszystkich skal wymienionych wcześniej) moŜliwość dokonywania porównań w formie względnej. Oznacza to, Ŝe dla obiektów zmierzonych za pomocą takiej skali moŜna określić, ile razy kaŜdy z nich jest lepszy lub gorszy od innego21. W praktyce skale przedziałowa i ilorazowa traktowane są równowaŜnie, natomiast najwięcej wątpliwości budzi stosowanie skal porządkowych. Biorąc pod uwagę, Ŝe skale porządkowe są bardzo często stosowane (np. do pomiaru postaw) warto poświęcić im kilka słów. Mówiąc o skali porządkowej ma się myśli sposób gradacji wariantów odpowiedzi na zadane pytanie lub przedstawione stwierdzenie, przy czym wariantów tych powinno być co najmniej trzy. Najpowszechniej stosowanymi skalami porządkowymi są skale Likerta, dyferencjału semantycznego i Stapela22. Skale te stosuje się nie tylko do pojedynczych pytań lub stwierdzeń, ale przede wszystkim w przypadku gdy pytań lub stwierdzeń w kwestionariuszu ankietowym jest kilka lub kilkanaście i dotyczą one tego samego zagadnienia. W takim przypadku mówi się nawet o skali Likerta w odniesieniu do zestawu (baterii) stwierdzeń, z których kaŜde skalowane jest za pomocą odpowiedzi definiowanych właśnie na skali Likerta. Stosowanie tego typu określeń, choć uŜywane w praktyce, moŜe być mylące. Określenie „skala Likerta” występuje bowiem w dwojakim znaczeniu: (1) zestaw (bateria) stwierdzeń, (2) sposób gradacji odpowiedzi. Skala porządkowa (jak równieŜ skala nominalna) określana jest mianem skali słabej bądź niemetrycznej, poniewaŜ na danych mierzonych na nominalnym poziomie pomiaru nie Krakowie, Kraków 2004. Ostasiewicz W. Istota pomiaru statystycznego, [w:] Pomiar statystyczny, red. W. Ostasiewicz, Wydawnictwo Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 2003. 21 Więcej na temat klasyfikacji skal wg Stevensa znaleźć moŜna w Rószkiewicz M., Metody ilościowe w badaniach marketingowych, Wydawnictwo Naukowe PWN, Warszawa 2002; Sagan A., Badania marketingowe. Podstawowe kierunki. Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków 2004. Ostasiewicz W. Istota pomiaru statystycznego, [w:] Pomiar statystyczny, red. W. Ostasiewicz, Wydawnictwo Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 2003. 22 Zob. Rószkiewicz M., Metody ilościowe w badaniach marketingowych, Wydawnictwo Naukowe PWN, Warszawa 2002; Sagan A., Badania marketingowe. Podstawowe kierunki. Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków 2004; Ch. Frankfort-Nachmias, D. Nachmias, Metody badawcze w naukach społecznych, Zysk i S-ka Wydawnictwo, Kaczmarczyk S., Badania marketingowe. Metody i techniki, PWE, Warszawa 2002. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 21 powinno się wykonywać Ŝadnych operacji matematycznych23. Niemniej jednak w praktyce sumowanie i uśrednianie danych porządkowych stosuje się (np. gdy dane mierzone są na skali Likerta, wykorzystuje się je do budowy skali skumulowanych ocen). Warto jednak pamiętać, Ŝe liczby porządkowe wskazują jedynie na sposób uporządkowania obiektów, zaś odległości między nimi nie muszą być takie, na jakie wskazują zastosowane liczby. Liczby te, zastosowane jako skala porządkowa, są tylko symbolami, bądź kodami dla poszczególnych typów odpowiedzi. Odległości między nimi przedstawiają „skoki” między odpowiedziami w sensie psychologicznym. Kategorie odpowiedzi mogą w percepcji respondentów nie być od siebie oddzielone w sposób ostry. W przypadku gdy dwa stopnie skali są do siebie zbliŜone w sensie psychologicznym, naleŜy zadać sobie pytanie, czy jednego z nich nie naleŜy wyeliminować. Natomiast gdy dwa stopnie skali są od siebie oddalone, naleŜy rozwaŜyć, czy nie naleŜałoby jednego dodać. Faktem jest, Ŝe nie istnieje optymalna liczba stopni skali porządkowej, która byłaby poprawna w kaŜdej sytuacji. Decyzja leŜy w gestii badacza i powinna być poparta badaniami empirycznymi. W celach ilustracyjnych rozwaŜono sytuację, gdy respondent proszony jest o udzielenie odpowiedzi na pytanie „W jakim stopniu zadowolona/y jest Pani/Pan ze swoich stosunków z najbliŜszymi w rodzinie”24 i ma do wyboru jedną z następujących moŜliwości: 1– bardzo zadowolona/y, 2–zadowolona/y, 3–dosyć zadowolona/y, 4–dosyć niezadowolona/y, 5–niezadowolona/y, 6–bardzo niezadowolona/y. W takiej sytuacji pomiar jego zadowolenia ze stosunków z najbliŜszymi w rodzinie przeprowadzany jest na skali porządkowej, zaś udzielona odpowiedź w bazie danych zapisywana jest za pomocą określonego kodu, czyli w tym przypadku symbolu liczbowego. Niemniej jednak, gdy porówna się odpowiedzi udzielone przez dwie pary respondentów (A1 i A2 oraz B1 i B2), takie jak pokazano w tabeli 6, to nie moŜna mieć Ŝadnej pewności, Ŝe znaczeniowa róŜnica w ich odpowiedziach jest taka sama, choć wskazują na to liczby (róŜnica w obu przypadkach równa 2). 23 Przykładowo nie powinno się takich danych sumować ani uśredniać. Z moŜliwych do przeprowadzenia na tego typu danych analiz statystycznych warto wymienić: budowę rozkładu odpowiedzi oraz tylko dla danych porządkowych – obliczenie miar pozycyjnych połoŜenia, zróŜnicowania i asymetrii. Więcej na temat moŜliwych do wykonania operacji matematycznych i statystycznych na danych z poszczególnych poziomów pomiaru znaleźć moŜna w Rószkiewicz M., Metody ilościowe w badaniach marketingowych, Wydawnictwo Naukowe PWN, Warszawa 2002; 24 Diagnoza Społeczna 2011 – kwestionariusz ankietowy dostępny na stronie http://www.diagnoza.com/ Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 24 Wykres 1. Odsetki wskazań poszczególnych kategorii odpowiedzi29. Źródło: Węziak D., Wpływ długości skali odpowiedzi na wyniki pomiaru – zastosowanie wielorakiej analizy korespondencji, Badanie statutowe Kolegium Analiz Ekonomicznych: Metody i techniki w analizie zachowań ekonomicznych gospodarstw domowych, Warszawa 2005. Jak pokazuje wykres 1, najczęściej wybieranymi kategoriami odpowiedzi były: 0 – tak samo waŜne, następnie w kolejności pozytywny punk ekstremalny +5 – zdecydowanie waŜniejsze, kategoria +3 (wyjątek stanowią stwierdzenia a i d) oraz w negatywnej części skali punkt maksymalny -5 – zdecydowanie mniej waŜne. ZauwaŜyć moŜna równieŜ, Ŝe zdecydowanie częściej wybierane były kategorie pozytywne (nawet te nie będące maksymami lokalnymi), czyli odpowiadające większej wadze potrzeby zabezpieczenia starości nad innymi potrzebami. Pomimo stosunkowo rzadszych wskazań kategorii ujemnej części skali, równieŜ tutaj moŜna zauwaŜyć schemat odpowiedzi przypominający kształtem ten z dodatniej połówki skali, co przejawiało się częstszymi wskazaniami kategorii ekstremalnej, a takŜe leŜącej pośrodku tej części skali, czyli -3. Na podstawie uzyskanych wyników Węziak30 sformułowała następujące wnioski. Po pierwsze, kształt uzyskanych rozkładów sugerować moŜe, Ŝe respondenci, chcąc udzielić odpowiedzi, dekomponowali skalę odpowiedzi na dwie części: od -5 do 0 i od 0 do +5. Po drugie, badani stosunkowo łatwo określali się w jednej z dwóch połówek, ale potem nie 29 Poprawną formą graficzną prezentacji rozkładu odpowiedzi jest wykres słupkowy (nieciągły). Wynika to stąd, Ŝe skala Stapela jest skalą porządkową. W tym jednak przypadku celowo zastosowano wykres liniowy, aby pokazać, Ŝe moŜe być ona traktowana jako skala ciągła. 30 Węziak D., Wpływ długości skali odpowiedzi na wyniki pomiaru – zastosowanie wielorakiej analizy korespondencji, Badanie statutowe Kolegium Analiz Ekonomicznych: Metody i techniki w analizie zachowań ekonomicznych gospodarstw domowych, Warszawa 2005 Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 25 zawsze byli w stanie róŜnicować odpowiedzi. Po trzecie, bardzo rzadko w porównaniu do innych kategorii w odpowiedniej połówce skali odpowiedzi wskazywane były punkty odpowiadające słabej preferencji: +1 – w pozytywnej połówce – oraz -1 i -2 dla negatywnej połówki. Stosunkowo rzadsze wybieranie niektórych kategorii odpowiedzi nasunęło podejrzenie, Ŝe być moŜe skala odpowiedzi była zbyt trudna dla respondentów, a uzyskane kształty rozkładów były nie tylko wynikiem treści pytań, ale równieŜ efektem długości skali. Wysunięta została hipoteza, Ŝe o ile respondent jest w stanie wypowiedzieć się na temat znaczenia potrzeby zabezpieczania własnej starości względem innych wyróŜnionych w badaniu potrzeb, to juŜ z określeniem siły preferencji ma większy problem. Podsumowując, skalowanie dotyczy ustalenia skali odpowiedzi na poszczególne pytania zamknięte, co przekłada się na ustalenie jednostki pomiaru dla badanych zjawisk. Polega ono na przyporządkowaniu (zgodnie z określonymi zasadami) wybranych symboli (cyfr) obserwowanym faktom lub wyraŜanym opiniom i ma decydujący wpływ na sposoby opracowania danych. Natomiast pomiar zjawiska to ustalenie za pomocą jakich i ilu pytań lub stwierdzeń zmierzyć badane zjawisko. Pytania i stwierdzenia określa się mianem wskaźników31 zjawiska, zaś o mierzonej cesze (operacjonalizującej badane zjawisko) mówi się wtedy, Ŝe jest ona zjawiskiem wskaźnikowanym. 3.1. Skalowanie cech obserwowalnych Cechy obserwowalne to te cechy, które moŜna obserwować i mierzyć wprost w badaniach empirycznych o charakterze ilościowym. Jako narzędzie pomiaru wykorzystać moŜna m.in. kwestionariusz ankietowy. Cechy te, ze względu na swój obserwowalny i jednowymiarowy charakter, występują zwykle w postaci jednej z charakterystycznych i znanych dla nich kategorii oraz mają zwykle określone jednostki miary. Z tego powodu do ich pomiaru stosuje się zwykle pojedyncze pytania kwestionariuszowe lub skale proste32. 3.2. Skalowanie cech ukrytych 31 wskaźnik to zdarzenie obserwowalne, które pozwala z określonym prawdopodobieństwem stwierdzić zaistnienie zjawiska wskaźnikowanego. 32 Pojedyncze stwierdzenia o odpowiedziach skalowanych na skali porządkowej, np. typu Likerta Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 26 W badaniach społecznych do badania zjawisk złoŜonych i bezpośrednio nieobserwowalnych wykorzystuje się skale pomiarowe złoŜone, zbudowane najczęściej z kilku, kilkunastu lub kilkudziesięciu skal prostych określanych równieŜ mianem stwierdzeń33, twierdzeń34, wypowiedzi35, aspektów36, kwestii37 bądź pozycji skali38. Są to na ogół krótkie zdania oznajmujące39, z którymi respondent moŜe się zgadzać lub nie zgadzać, a z których kaŜde ma na celu objęcie innego aspektu badanego zjawiska. Ze względu na nieobserwowalny i często złoŜony charakter mierzonych zjawisk i pojęć, niezwykle waŜne jest wykazanie przez badacza, Ŝe proponowane do jego pomiaru skale pomiarowe są wysokiej jakości. Oznacza to, Ŝe wyniki uzyskiwane za ich pomocą powinny rzeczywiście dotyczyć mierzonego zjawiska lub pojęcia latentnego oraz powinny być precyzyjne. Pierwszy aspekt dotyczy trafności skali pomiarowej, zaś drugi – jej rzetelności. Metody statystyczne dostarczają narzędzi do zweryfikowania, na ile przyjęte przez badacza rozwiązania pomiarowe zapewniają uzyskanie narzędzia wysokiej jakości. Do pomiaru cech ukrytych stosuje się jedno z dwóch alternatywnych podejść: (1) skalowanie oparte na czynnikach oraz (2) skalowanie czynnikowe. 3.2.1. Skale oparte ma czynnikach – skalowanie jednowymiarowe W badaniach społecznych do badania złoŜonych i często bezpośrednio nieobserwowalnych zjawisk wykorzystuje się jednowymiarowe skale złoŜone. Są to skale zbudowane z szeregu stwierdzeń lub pytań określanych mianem pozycji skali. Czasem, aby zwiększyć dokładność pomiaru pozycjom tym nadaje się róŜną intensywność40, nie jest to jednak konieczne. Odpowiedzi udzielane na poszczególne pozycje skali mierzy się za pomocą którejś ze skal porządkowych, np. za pomocą skali Likerta. Pozycja respondenta na takiej 33 Ostasiewicz W. Istota pomiaru statystycznego, [w:] Pomiar statystyczny, red. W. Ostasiewicz, Wydawnictwo Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 2003, s. 20; Rószkiewicz M., Metody ilościowe w badaniach marketingowych, Wydawnictwo Naukowe PWN, Warszawa 2002, s.48; Sagan A., Badania marketingowe. Podstawowe kierunki. Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków 2004, s. 89. 34 Nachmias D, Frankfort-Nachmias Ch., Metody badawcze w naukach społecznych, Wydawnictwo Zysk i Spółka, Poznań 2001, s.477-480. 35 Churchill G. A., Badania marketingowe. Podstawy metodologiczne, Wydawnictwo Naukowe PWN, Warszawa 2002, s. 412 36 Ostasiewicz W. Istota pomiaru statystycznego, [w:] Pomiar statystyczny, red. W. Ostasiewicz, Wydawnictwo Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 2003, s. 20 37 Ostasiewicz W. Istota pomiaru statystycznego, [w:] Pomiar statystyczny, red. W. Ostasiewicz, Wydawnictwo Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 2003, s. 20 38 Kaczmarczyk S., Badania marketingowe. Metody i techniki, PWE, Warszawa 2002, s. 128-129; Ostasiewicz W. Istota pomiaru statystycznego, [w:] Pomiar statystyczny, red. W. Ostasiewicz, Wydawnictwo Akademii Ekonomicznej im. Oskara Lanego we Wrocławiu, Wrocław 2003, s. 20 39 Kaczmarczyk S., Badania marketingowe. Metody i techniki, PWE, Warszawa 2002, s. 127 40 Kaczmarczyk S., Badania marketingowe. Metody i techniki, PWE, Warszawa 2002 Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 29 konstrukcji skali pomiarowej powinno być wykorzystywane podejście oparte na skalach czynnikowych. Rysunek 3. ZaleŜności przyczynowo-skutkowe (linie ciągłe) i korelacyjne (linie przerywane) miedzy pozycjami skali X1, X2, X3 i X4 oraz zmienną latentną mierzoną (diagnozowaną) za pomocą tej skali – zastosowanie wskaźników reflektywnych Źródło: Rószkiewicz M. Analiza klienta, w druku 3.2.2 Skalowanie czynnikowe - skale wielowymiarowe Wśród metod skalowania zjawisk wielowymiarowych lub zjawisk latentnych wielowymiarowych lub jednowymiarowych za pomocą skal czynnikowych wyróŜnić moŜna dwa podejścia: 1. eksploracyjne, 2. konfirmacyjne. W podejściu eksploracyjnym, na podstawie proponowanego zestawu stwierdzeń traktowanych jako potencjalne wskaźniki mierzonego zjawiska latentnego, dąŜy się do określania liczby jego wymiarów, ich interpretacji oraz do ich zmierzenia (wyskalowania). Stosuje się zatem podejście polegające na wykryciu struktury badanego zjawiska oraz interpretacji uzyskanych w ten sposób wyników. Struktura ta moŜe być złoŜona (wielowymiarowa) lub prosta (jednowymiarowa). W przypadku struktury złoŜonej, metody eksploracyjne słuŜą do wyjaśnienia liczby wymiarów oraz ich interpretacji. Natomiast w przypadku struktury jednowymiarowej, metody eksploracyjne zastosować moŜna w celu potwierdzenia jednowymiarowości proponowanej do pomiaru jednowymiarowego zjawiska latentnego skali pomiarowej. Do metod eksploracyjnych zalicza się między innymi eksploracyjną analizę czynnikową, analizę głównych składowych oraz skalowanie Rascha. W podejściu konfirmacyjnym punktem wyjścia jest teoretyczny model badanego zjawiska latentnego. Model ten, zwany równieŜ modelem konceptualnym, konstruowany jest na podstawie analizy literatury tematu oraz przyjętych przez badacza celów badawczych oraz X1 X2 X3 X4 X – zmienna latentna zmienne wskaźnikowe – stwierdzenia lub pytania Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 30 pytań i hipotez badawczych. Obejmuje nie tylko zestaw zmiennych wskaźnikowych, ale równieŜ występujące między nimi relacje. Model ten jest następnie weryfikowany, czyli, za pomocą odpowiednich metod statystycznych, sprawdza się, na ile proponowana przez badacza w modelu konceptualnym koncepcja teoretyczna znajduje potwierdzenie w danych. Jeśli potwierdzenie to jest satysfakcjonujące, estymuje się model pomiarowy i kwantyfikuje zmiennych skalujące zdefiniowane apriorycznie konstrukty. Do metod konfirmacyjnych zalicza się konfirmacyjną analizę czynnikową oraz modelowanie równań strukturalnych. 3. 2.2.1. Podejście eksploracyjne W ramach podejścia eksploracyjnego wyróŜnić moŜna wiele metod skalowania. Ich podstawowa klasyfikacja bazuje na określeniu charakteru zmiennych obserwowalnych oraz charakteru zmiennych latentnych. W obu przypadkach rozróŜnia się zmienne ciągłe od zmiennych dyskretnych. W konsekwencji powstają cztery kombinacje tak, jak to zaprezentowano w tabeli 7. Tabela 7. Klasyczna klasyfikacja metod modelowania zmiennych ukrytych Zmienne obserwowalne Zmienne ukryte Ciągłe (latent traits) Dyskretne (latent classes) Ciągłe Analiza czynnikowa Analiza profili ukrytych Dyskretne Modele IRT Analiza klas ukrytych Źródło: opracowanie własne na podstawie Skrondal A., Rabe-Hesketh S., Generalized Latent Variable Modeling. Mulitlevel. Longitudinal, and Structural Equation Models Chapman&Hall/CRC, 2004 W sytuacji gdy zmienne obserwowalne mają charakter ciągły oraz zjawisko latentne kwantyfikuje się jako zmienną ciągłą właściwą metodą analityczną jest analiza czynnikowa. W sytuacji gdy zmienne obserwowalne mają charakter ciągły, ale badane zjawisko latentne kwantyfikuje się jako zmienną dyskretną, właściwą metodą analityczną jest analiza profili ukrytych. W sytuacji gdy zmienne obserwowalne mają charakter dyskretny i badane zjawisko latentne równieŜ ma charakter dyskretny (tzn. kwantyfikuje się jako zmienną latentną dyskretną), właściwą metodą analityczną jest analiza klas ukrytych. I wreszcie gdy zmienne obserwowalne mają charakter dyskretny, ale badane zjawisko latentne kwantyfikuje się jako zmienną ciągłą, właściwymi metodami analitycznymi są modele IRT, w tym model Rascha. Przedstawiona powyŜej klasyfikacja pokazuje podział klasyczny. Wraz z obserwowanym w ciągu kilkunastu ostatnich lat wzrostem mocy obliczeniowej komputerów moŜliwe stało się łączenie ze sobą w ramach jednej specyfikacji czterech klasycznych modeli słuŜących do kwantyfikacji zmiennych latentnych. Ze względu na fakt, Ŝe tematyka niniejszej Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 31 publikacji koncentruje się na metodach przygotowania badania, a nie samej analizie jego wyników, poniŜej przedstawiono przykłady zastosowania dwóch metod, które stosuje się do weryfikacji poprawności i trafności modelu konceptualnego oraz do konstrukcji skali pomiarowej – analizę czynnikową w wersji eksploracyjnej oraz model Rascha45. Eksploracyjna analiza czynnikowa – przykłady zastosowań Eksploracyjna analiza czynnikowa moŜe być stosowana nie tylko do wykrycia struktury związków występujących między zmiennymi wskaźnikowymi diagnozującymi określone zjawisko lub zjawiska nieobserwowalne bezpośrednio, ale równieŜ do badania wymiarowości zbioru zmiennych wskaźnikowych lub teŜ do sprawdzenia jednowymiarowości skali pomiarowej. To pierwsze zastosowanie zaprezentowała Rószkiewicz46, zaś drugie – Woynarowska-Sołdan i Węziak-Białowolska47. Rószkiewicz48 zastosowała procedurę analizy czynnikowej w celu wygenerowania postaw wobec gromadzenia oszczędności. Analizę przeprowadziła na zestawie 7 stwierdzeń odnoszących się do motywów gromadzenia oszczędności (treść stwierdzeń zamieszczono w tabeli 8). Uzyskane przez nią wartości ładunków po rotacji49, dla trzech czynników50, do których ograniczono analizę zgodnie z sugestiami płynącymi z prezentowanej w literaturze tematu teorii oszczędzania, zestawiono w tabeli 8. 45 Przykład zastosowania analizy klas ukrytych do wyskalowania zmiennej latentnej o charakterze dyskretnym znaleźć moŜna w Białowolski P., Węziak-Białowolska D., 2011, Zastosowanie analizy klas ukrytych do identyfikacji wykluczenia gospodarstw domowych z rynku kredytowego „Roczniki Kolegium Analiz Ekonomicznych”, Nr 23/2011, s.159 - 174 46 Rószkiewicz M., Oszczędzanie. Postawy i zachowania polskich gospodarstw domowych wobec oszczędzania, Aureus, Kraków 2008 47 Woynarowska-Sołdan M., Węziak-Białowolska D., Narzędzia do badania klimatu społecznego w szkole promującej zdrowie i ich analiza psychometryczna, „Edukacja, Studia, Badania, Innowacje”, nr 3 (111), 2010, s. 71-80 48 Rószkiewicz M., Oszczędzanie. Postawy i zachowania polskich gospodarstw domowych wobec oszczędzania, Aureus, Kraków 2008. 49 Przeprowadzona rotacja typu Varimax nie zmieniła struktury zaleŜności miedzy wyróŜnionymi motywami oraz trzema pierwszymi czynnikami wyznaczonymi metodą głównych składowych. JednakŜe rotacja ta zwiększyła polaryzację wartości ładunków, co jest rozwiązaniem bardziej jednoznacznym względem rozwiązania początkowego. 50 W ocenie adekwatności próby do załoŜeń tej metody, mierzonej statystyką Kaisera-Maylera-Olkina uzyskano satysfakcjonujący poziom 0,791. Przy czym wariancje trzech zmiennych czynnikowych odtworzyły 72,8% wariancji zmiennych podstawowych. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 34 Ocena jakości skali pomiarowej mierzącej stosunek do osób starszych za pomocą modelu Rascha Węziak55 zastosowała model Rascha do oceny jakości skali mierzącej stosunek do osób starszych. Respondentów poproszono o wyraŜenie opinii na osiem następujących stwierdzeń56: A1. Dzięki doświadczeniu są ciągle potrzebni A2. Gwarantują zachowanie tradycyjnych wartości w społeczeństwie A3. Młodsze generacje mogą korzystać z ich obecności, wiedzy, doświadczenia A4. Społeczeństwo powinno brać pod uwagę prawa starszych A5. Społeczeństwo powinno brać pod uwagę problemy osób starszych A6. Osoby starsze są nieproduktywne i tylko stanowią obciąŜenie dla społeczeństwa A7. Starsze osoby stanowią przeszkodę dla zmian A8. Starsze osoby stanowią cięŜar dla społeczeństwa Respondenci mieli do wyboru jedną z pięciu kategorii odpowiedzi, z których kaŜda była etykietowana (1 – zdecydowanie się zgadzam, 2 – zgadzam się, 3 – ani się zgadzam, ani się nie zgadzam, 4 – nie zgadzam się, 5 – zdecydowanie się nie zgadzam). W celu ułatwienia interpretacji wyników dokonano przekodowania wyników w taki sposób, aby osoby z wyŜszym wynikiem sumarycznym charakteryzowały się bardziej pozytywnym stosunkiem do osób starszych niŜ osoby o niŜszym wyniku ogólnym. Ze względu na porządkową (Likertowską) skalę odpowiedzi analizy wykonano za pomocą porządkowego modelu Rascha (ang. rating scale model). W pierwszym kroku sprawdzono, czy dane spełniają załoŜenia modelu. Przeciętne wartości statystyki dopasowania IMS i OMS dla respondentów były na poziomie równym bądź bliskim 1, co odpowiada wartości oczekiwanej tych statystyk i świadczy o tym, Ŝe badana grupa respondentów nie powinna być uznana za nietypową57. Natomiast statystyki 55 Węziak D., Ocena jakości skali ze szczególnym uwzględnieniem jej rzetelności i trafności za pomocą skalowania Rascha, „ASK Społeczeństwo Badania Metody”, Nr. 15, 2006, s. 107-131 56 Do ilustracji wykorzystano dane pochodzące z badania „Badanie poglądów na zagadnienia ludnościowe oraz politykę ludnościową PPA2 (Population Policy Attitudes Survey)” przeprowadzonego w IV kw. 2001 przez Instytut Statystyki i Demografii Szkoły Głównej Handlowej w Warszawie przy współpracy z Głównym Urzędem Statystycznym w ramach projektu „Population Policy Acceptance Study. The Viewpoint of Citizens and Policy Actors regarding the Management of Population Related Change DIALOG”. Badanie objęło osoby w wieku 18-64 lat z gospodarstw domowych w mieszkaniach wylosowanych do próby BAEL (Badanie aktywności ekonomicznej ludności). Wywiady przeprowadzono z 4244 respondentami z 2027 gospodarstw domowych. (Kotowska i in. 2003). 57 Bond T.G., Fox Ch. M., Applying The Rasch Model. Fundamental Measurement in the Human Science, Lawrenece Erlbaum Associates, Publishers Mahaw, New Jersey 2001. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 35 SIMS i SOMS wyniosły -0,4, co równieŜ nie odbiegało znacząco od wartości oczekiwanych tych statystyk. Obliczone dla wszystkich pozycji skali pomiarowej łącznie wartości IMS i OMS były na poziomie 0,99 i 0,95, a więc bardzo bliskim wartości oczekiwanej tych statystyk58, co świadczyło o tym, Ŝe skala nie powinna być uznana za nietypową, a w dalszym kroku pozwoliło przyjąć, Ŝe badana grupa stwierdzeń mierzy stosunek do osób starszych. PowyŜszy wniosek potwierdziły równieŜ wartości statystyk SIMS i SOMS, które wyniosły -0,1 i -0,4. Współczynnik α-Cronbacha, bądący klasyczną miarą rzetelności skali pomiarowej, wyniósł 0,851 przy średniej korelacji między pozycjami skali na poziomie 0,42. Pozwoliło to uznać, Ŝe analizowana skala pomiarowa okazała się być rzetelna na satysfakcjonującym poziomie. Wniosek ten potwierdziła analiza wartości współczynnika rzetelności uzyskanego w toku analiz modelem Rascha. Współczynnik ten (RP) był na poziomie 0,72, co oznaczało, Ŝe zgodnie z zaleceniami Green i Frantom59 był on na akceptowalny. Przeciętne oszacowanie pozycji respondentów mierzone logitem wyniosło 2,63, co przy uwzględnieniu informacji, Ŝe w skalowaniu Rascha przeciętne oszacowanie pozycji skali wynosi 0, pozwala uznać, Ŝe przeciętnie biorąc respondenci bardzo łatwo zgadzali się z analizowanymi stwierdzeniami. Oznaczało to, Ŝe ich stosunek do osób starszych był pozytywny. W następnym kroku prowadzi to jednak do konkluzji, Ŝe dla tej grupy respondentów skala nie była optymalnie dopasowana pod względem zróŜnicowania intensywności stwierdzeń i sugeruje jej rozszerzenie o stwierdzenia, z którymi trudniej się zgodzić, po uprzednim przeprowadzeniu analizy poszczególnych stwierdzeń indywidualnie. W kolejnym kroku przeprowadzono analizę kaŜdego ze stwierdzeń osobno. W tabeli 9 przedstawiono pozycje skali uszeregowane według rosnących wartości oszacowań ich intensywności. Tabela 9. Charakterystyki pozycji skali POZYCJE SKALI OIPS B.S. STATYSTYKI DOPASOWANIA IMS SIMS OMS SOMS (r)A7. Starsze osoby stanowią przeszkodę dla zmian 0,32 0,15 0,98 -0,1 0,94 -0,4 (r)A6. Osoby starsze są nieproduktywne i tylko stanowią obciąŜenie dla społeczeństwa 0,21 0,15 1,14 1,1 1,09 0,7 58 Bond T.G., Fox Ch. M., Applying The Rasch Model. Fundamental Measurement in the Human Science, Lawrenece Erlbaum Associates, Publishers Mahaw, New Jersey 2001. 59 Green K. E., Frantom C. G., 2000. Survey development and validation with the Rasch Model, A paper presented at the International Conference on Questionnaire Development, Evaluation, and Testing. http://www.jpsm.umd.edu/qdet/final_pdf_papers/green.pdf Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 36 (r)A8. Starsze osoby stanowią cięŜar dla społeczeństwa 0,13 0,15 1,13 1 1,11 0,9 A2. Gwarantują zachowanie tradycyjnych wartości w społeczeństwie 0,08 0,15 0,93 -0,5 0,84 -1,3 A3. Młodsze generacje mogą korzystać z ich obecności, wiedzy, doświadczenia 0,02 0,15 0,82 -1,5 0,81 -1,5 A4. Społeczeństwo powinno brać pod uwagę prawa starszych -0,17 0,15 0,78 -1,9 0,78 -1,8 A1. Dzięki doświadczeniu są ciągle potrzebni -0,26 0,15 1,22 1,7 1,14 1,1 A5. Społeczeństwo powinno brać pod uwagę problemy osób starszych -0,33 0,15 0,93 -0,5 0,92 -0,6 ŚREDNIA 0,00 0,15 0,99 -0,1 0,95 -0,4 ODCHYLENIE STANDARDOWE 0,22 0,00 0,15 1,22 0,14 1,0 *OIPS – szacowanie intensywności pozycji skali; B.S. – błąd szacunku; Źródło: Węziak D., Ocena jakości skali ze szczególnym uwzględnieniem jej rzetelności i trafności za pomocą skalowania Rascha, „ASK Społeczeństwo Badania Metody”, Nr. 15, 2006, s. 120 Uszeregowanie badanych stwierdzeń według malejących wartości oszacowań ich intensywności naleŜy rozumieć w następujący sposób. Respondenci najtrudniej zgadzali się z rozumianym w sposób przeciwny stwierdzeniem (r)A7. Starsze osoby stanowią przeszkodę dla zmian, następnie ze stwierdzeniami (równieŜ o przeciwnym znaczeniu): (r)A6. Osoby starsze są nieproduktywne i tylko stanowią obciąŜenie dla społeczeństwa i (r)A8. Starsze osoby stanowią cięŜar dla społeczeństwa. Najłatwiejsze do zaakceptowania były stwierdzenia A1. Dzięki doświadczeniu są ciągle potrzebni i A5. Społeczeństwo powinno brać pod uwagę problemy osób starszych. Kwestią niezwykle istotną z punktu widzenia trafności treściowej skali pomiarowej jest zastanowienie się, czy kolejność, w jakiej ustawione są pozycje skali (według oszacowań stopnia akceptowalności), ma sens. Czyli czy na przykład łatwiej jest zgodzić się ze stwierdzeniem A2. Gwarantują zachowanie tradycyjnych wartości w społeczeństwie niŜ A1. Dzięki doświadczeniu są ciągle potrzebni. A takŜe czy osoba charakteryzująca się pozytywnym stosunkiem do osób starszych nie zgodzi się ze stwierdzeniem (r)A7. Starsze osoby stanowią przeszkodę dla zmian, podczas gdy osoba o bardziej negatywnej postawie nie zgodzi się ze stwierdzeniem A5. Społeczeństwo powinno brać pod uwagę problemy osób. Analiza treści stwierdzeń i wyników porządkowego skalowania Rascha pozwoliła na powyŜsze pytania odpowiedzieć twierdząco. śadnego z badanych stwierdzeń nie moŜna było uznać za nie pasujące do skali, co pokazały statystyki IMS i OMS zawierające się w przedziałach odpowiednio <0,78; 1,22> i <0,78; 1,14>. PowyŜszy wniosek okazał się poprawny równieŜ w przypadku Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 39 Rysunek ten jest ilustracją podejścia badawczego zaproponowanego przez Węziak- Białowolską64 do oceny własności psychometrycznych skali motywacji testowej stworzonej na podstawie odpowiedzi udzielonych przez uczniów klas trzecich gimnazjum na stwierdzenia kwestionariusza ankietowego do samodzielnego wypełnienia65. Proponowane podejście obejmowało przeprowadzenie analiz eksploracyjnych66 i konfirmacyjnych67. Analizy eksploracyjne miały na celu zweryfikowanie, czy zastosowane narzędzie – stwierdzenia kwestionariusza – jest przydatne do stworzenia skali motywacji testowej. Natomiast analizy konfirmacyjne posłuŜyły do zweryfikowania, czy stworzone narzędzie charakteryzuje się odpowiednią dokładnością pomiarową – trafnością i rzetelnością. W toku eksploracyjnych okazało się, Ŝe zbiór 10 zmiennych wskaźnikowych moŜe być wiarygodnie zastąpiony czterema nowymi zmiennymi (głównymi składowymi), które razem odtwarzają 65,85% wariancji zbioru zmiennych wskaźnikowych. Analiza wzoru ładunków czynnikowych pokazała, Ŝe główne składowe kwantyfikowały następujące wymiary motywacji testowej i stopnia przygotowania do sesji zrównującej: (F1) pierwsza główna składowa – zaangaŜowanie w rozwiązanie testu zrównującego (stwierdzenia S5_r, S13 oraz S14), (F2) druga główna składowa – subiektywna ocena stopnia aktualnie posiadanej wiedzy niezbędnej do rozwiązania testu zrównującego i właściwego egzaminu (stwierdzenia S1, S4 oraz S8_r), (F3) trzecia główna składowa – subiektywna ocena stopnia potencjalnego przygotowania do właściwego egzaminu (stwierdzenia S2_r i S9_r), (F4) czwarta główna składowa – ocena stopnia przygotowania się do rozwiązania testu zrównującego (stwierdzenia S3 i S7). Odpowiadający powyŜszemu rozwiązaniu w obszarze dwóch pierwszych wymiarów schemat modelu zaprezentowano w lewej części rysunku 4. Natomiast z prawej strony rysunku 4 zamieszczono odpowiadający mu schemat modelu konfirmacyjnej analizy czynnikowej, czyli model z warunkami ograniczającymi. 64 Węziak-Białowolska D., Ocena własności psychometrycznych skali motywacji testowej, XVII Konferencja Diagnostyki Edukacyjnej, w druku 65 Do zmierzenia poziomu motywacji testowej uczniów oraz stopnia przygotowania do sesji zrównującej zastosowanych zostało 10 stwierdzeń. Uczniowie proszeni byli o ustosunkowanie się do nich na 5-stopniowej skali Likerta. 66 Zastosowano analizę głównych składowych z rotacją varimax – w celu rozpoznania moŜliwości utworzenia z zaproponowanego zestawu zmiennych mniejszego zbioru zmiennych, które dobrze wyjaśniają korelację między tymi zmiennymi i tym samym dobrze odtwarzają informację zawartą w zbiorze wyjściowym; sprawdzony został poziom zmienności wspólnej kaŜdego ze stwierdzeń (min. 0,3) oraz poziom wyjaśnianej wariancji (min. 60%); 67 Modele zostały zweryfikowane mi. in. pod względem istotności zmiennych wskaźnikowych (stwierdzeń) oraz jakości dopasowania. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 40 Strategia postępowania w skalowaniu zmiennych latentnych w podejściu czynnikowych Przystępując do skalowania zjawisk nieobserwowalnych za pomocą podejścia czynnikowego, zwłaszcza w sytuacji gdy badane zjawisko jest słabo rozpoznane w literaturze tematu, warto rozwaŜyć zastosowanie następującej strategii postępowania. Najpierw na zbiorze zmiennych wskaźnikowych wyselekcjonowanych do pomiaru zjawiska latentnego przeprowadza się eksploracyjną analizę czynnikową. Jej wyniki pozwalają na wykrycie struktury związków występujących między zmiennymi wskaźnikowymi oraz na wprowadzenie modyfikacji do tej listy (usunięcie zmiennych wskaźnikowych). Następnie za pomocą współczynnika α-Cronbacha weryfikuje się rzetelność uzyskanych skal czynnikowych. W przypadku uzyskania niesatysfakcjonujących wyników ponownie moŜliwe jest zmodyfikowanie zestawu zmiennych wskaźnikowych przez usunięcie tych z nich, których zgodność ze skalą nie została potwierdzona. W ostatnim kroku przeprowadza się konfirmacyjną analizę czynnikową i ponownie na podstawie uzyskanych wyników przeprowadza się modyfikację zestawu zmiennych wskaźnikowych przez usunięcie tych z nich, które okazały się być nieistotne statystycznie lub nietrafne (znaki ładunków czynnikowych nie były zgodne z przewidywaniami). Ostateczne rozwiązanie ocenia się pod względem rzetelności stosując na przykład współczynnik rho Joreskoga, którego formuła jest następująca: a) w przypadku występowania skorelowania składników resztowych ( ) ( ) ( ) 2 2 21 2 ij λ ρ λ λ θ = + − + ∑ ∑ ∑ ∑ (2) lub b) w przypadku braku skorelowania składników resztowych ( ) ( ) ( ) 2 2 21 λ ρ λ λ = + − ∑ ∑ ∑ (3) gdzie: λ – ładunek czynnikowy wystandaryzowany, θ – niezerowe kowariancje składników resztowych. Współczynnik ten przyjmuje wartości z przedziału <0; 1>. Procedurę taką zastosowała Węziak-Białowolska do weryfikacji koncepcji kapitału intelektualnego regionu68. Konstrukcja modelu do pomiaru kapitału intelektualnego regionu zrealizowana została poprzez: 68 Węziak-Białowolska D., Model kapitału intelektualnego regionu. Koncepcja pomiaru i jej zastosowanie, Oficyna Wydawnicza SGH, Warszawa 2010 Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 41 − zidentyfikowanie skal pomiarowych do badania zmiennych o charakterze nieobserwowalnym występujących w modelu konceptualnym, − analizę trafności i rzetelności zaproponowanych skal pomiarowych, − opis sformułowanych w modelu konceptualnym relacji za pomocą równań strukturalnych. Do oceny adekwatności zestawów zmiennych obserwowalnych zaproponowanych do konstrukcji jednowymiarowych skal opisujących określone składniki kapitału intelektualnego wykorzystane zostały eksploracyjna oraz konfirmacyjna analiza czynnikowa. Analiza eksploracyjna miała na celu sprawdzenie, czy za obserwowanymi zmiennymi kryje się struktura, która mogła być ujawniona za pomocą mniejszej liczby wymiarów. Z kolei analiza konfirmacyjna pozwoliła ocenić jakość zaproponowanych modeli pomiarowych poszczególnych składników i elementów kapitału intelektualnego regionu. Pomiaru kapitału intelektualnego regionu, jego składników oraz ich elementów dokonano na podstawie danych z badania Diagnoza Społeczna 2005 oraz danych z Banku Danych Regionalnych Głównego Urzędu Statystycznego dotyczących 2005 roku za pomocą analizy głównych składowych oraz eksploracyjnej i konfirmacyjnej analizy czynnikowej. Konfirmacyjna analiza czynnikowa dla wielu grup – badanie zgodności pomiaru W sytuacji gdy analiza prowadzona jest w celu porównania przeciętnych wartości zmiennych ukrytych klasyczny model konfirmacyjnej analizy czynnikowej xx F ε= Λ + (4) gdzie: Λx - macierz ładunków konfirmacyjnej analizy czynnikowej, x – zmienne bezpośrednio obserwowalne, F – zmienne nieobserwowalne bezpośrednio, ε – czynnik swoisty, rozszerza się tak, aby zawierał wyraz wolny τ oraz uwzględniał zróŜnicowanie modelu w g grupach: g g xg g gx Fτ ε= + Λ + (5) zakładając jednocześnie, Ŝe: (6) gdzie: – wektor przeciętnych wartości zmiennej F w grupie g (ang. vector of factor means for group g). gxgggxggg EFEExE κτετ Λ+=+Λ+= )()()()( gκ Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 44 identyfikacji zalecana jest analiza mocy testu oraz wartości parametru EPC (ang. Expected Paramether Change) określającego oczekiwaną przybliŜoną zmianę wartości analizowanego parametru w przypadku estymacji modelu bez Ŝadnego warunku ograniczającego narzuconego na ten parametr.74 Występowanie wszystkich trzech typów zgodności dla wszystkich zmiennych wskaźnikowych określane jest w literaturze przedmiotu mianem pełnej zgodności pomiaru (ang. full measurement invariance)75. Warto jednak zauwaŜyć, Ŝe w praktyce potwierdzenie pełnej zgodności bywa czasem niemoŜliwe. Niemniej jednak, jak pokazali Steenkamp i Baumgartner76, do przeprowadzenia porównań zarówno przeciętnych wartości zmiennej ukrytej, jak i poziomów skorelowania między zmiennymi w modelu, wystarczy, aby wystąpiła zgodność częściowa (ang. partial measurement invariance). Oznacza ona, Ŝe do prowadzenia porównań wystarczy, aby równość ładunków czynnikowych i wyrazów wolnych (dla zmiennych wskaźnikowych ciągłych) lub progów skali odpowiedzi (dla zmiennych wskaźnikowych kategorialnych) zachodziła dla dwóch zmiennych wskaźnikowych77. Badanie zgodności pomiaru stosuje się zarówno (1) w przypadku analiz przekrojowych, jak i (2) w przypadku analizy danych wzdłuŜnych. W pierwszym podejściu mówi się o porównaniach przeciętnych wartości zmiennej latentnej między wyróŜnionymi grupami respondentów – np. między kobietami i męŜczyznami lub między grupami wyróŜnionymi ze względu na status na rynku pracy (pracujący, bezrobotny, bierny zawodowo). Przykład takiego zastosowania przedstawili Davidov, Schmidt i Schwartz78. Autorzy ci weryfikowali, czy między krajami biorącymi udział w badaniu Europejski SondaŜ Społeczny (European Social Survey – ESS) zachodzi zgodność pomiaru dla teorii podstawowych wartości ludzkich Schwartza (1992) (ang. theory of basic human values), która jest operacjonalizowana i mierzona w tym badaniu. Do jej operacjonalizacji stosuje się 21 stwierdzeń, które mierzą waŜność 10 podstawowych wartości ludzkich. Autorzy za pomocą konfirmacyjnej analizy czynnikowej dla wielu grup sprawdzali, czy znaczenie poszczególnych wartości definiowanych przez teorię Schwartza jest ekwiwalentne między krajami. Jest to konieczne, bo tylko potwierdzenie takie ekwiwalencji umoŜliwia analizowanie i porównywanie między krajami związków między wartościami a postawami, 74 Taką analizę przeprowadza się wykorzystując program JRULE. 75 Davidov E. (2008) A Cross-Country and Cross-Time Comparison of the Human Values Measurements with the Second Round of the European Social Survey, “Survey Research Methods”, Vol.2, No.1, 33-46. 76 Steenkamp J-B., Baumgartner H.,1998, Assessing Measurement Invariance in Cross-National Consumer Research, “The Journal of Consumer Research”, Vol. 25, No. 1 (Jun., 1998), 78-90. 77 Steenkamp J-B., Baumgartner H.,1998, Assessing Measurement Invariance in Cross-National Consumer Research, “The Journal of Consumer Research”, Vol. 25, No. 1 (Jun., 1998), 78-90. 78 Davidov E., Schmidt P., Schwartz S. H., Bringing values back in the adequacy of the European Social Survey to measure values in 20 countries, Public Opinion Quarterly, Vol. 0, No. 0, 2008, pp. 1–26 Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 45 zachowaniami oraz charakterystykami społeczno-demograficznymi respondentów. Wyniki uzyskane przez Davidova, Schmidta i Schwartza potwierdzają istnienie takiej porównywalności dla rundy 2002-2003 dla 14 z 25 krajów biorących udział w badaniu. W podejściu drugim analizuje się zmiany intensywności zjawiska latentnego mierzonego za pomocą zmiennej ukrytej w czasie. Takie zastosowanie konfirmacyjnej analizy czynnikowej dla wielu grup znaleźć moŜna m.in. u Davidova79 oraz u Węziak- Białowolskiej80. Davidov81 powtórzył badania dotyczące zgodności pomiaru podstawowych wartości ludzkich Schwartza między krajami biorącymi udział w I (runda z roku 2002-2003) oraz II rundzie badania ESS (runda z roku 2004-2005). Weryfikował, czy występuje zgodność skali oraz zgodność punktu referencyjnego osobno dla kaŜdego z 19 krajów biorących udział w obu rundach. Wyniki, które uzyskał, pokazują, Ŝe w 9 krajach zgodność taka występuje, natomiast w 10 pozostałych krajach pierwotne modele konceptualne dla teorii wartości ludzkich Schwartza wymagały modyfikacji. Niemniej jednak po wprowadzeniu niezbędnych zmian w modelach konceptualnych udało się potwierdzić istnienie zgodności pomiaru dla wszystkich 19 krajów. Wniosek z badań Davidova jest taki, Ŝe dla tych 19 krajów moŜna analizować zmiany w wyznawanych wartościach, które zaszły między analizowanymi rundami badania. Węziak-Białowolska82 podjęła próbę zweryfikowania, czy podejście do mierzenia kapitału społecznego proponowane przez van Oorschota, Artsa i Gelissena83 moŜe być zastosowane w warunkach polskich. Podejście zastosowane przez autorkę obejmowało (1) przedstawienie modelu konceptualnego kapitału społecznego, (2) weryfikację, czy wyselekcjonowane zmienne wskaźnikowe mają odpowiednie własności, aby tworzyć wskaźniki syntetyczne, (3) budowę modeli pomiarowych dla wymiarów kapitału społecznego za pomocą konfirmacyjnej analizy czynnikowej oraz (4) analizę zmian ich poziomu w okresach 2005 – 2007 oraz 2007 – 2009. Krok czwarty moŜliwy był do realizacji tylko dzięki potwierdzeniu istnienia pełnej zgodności skalarnej dla wszystkich wymiarów kapitału 79 Davidov E., 2008, A Cross-Country and Cross-Time Comparison of the Human Values Measurements with the Second Round of the European Social Survey, “Survey Research Methods”, Vol.2 , No.1 , 33-46. 80 Węziak-Białowolska D., Kapitał społeczny w Polsce w świetle Diagnozy Społecznej – pomiar i wyniki, „Studia Demograficzne”, w druku 81 Davidov E., 2008, A Cross-Country and Cross-Time Comparison of the Human Values Measurements with the Second Round of the European Social Survey, “Survey Research Methods”, Vol.2 , No.1 ,s. 33-46. 82 Węziak-Białowolska D., Kapitał społeczny w Polsce w świetle Diagnozy Społecznej – pomiar i wyniki, „Studia Demograficzne”, w druku. 83 van Oorschot W., Arts W., Gelissen J., 2006, Social Capital in Europe. Measurement and Social and Regional Distribution of a Multifaceted Phenomenon, “Acta Sociologica”, Vol. 49(2), 149-167. Zeszy ty Naukowe – Ins ty tu t S ta tys tyki i Demogra f i i [Nr 16 /2011] 46 społecznego. Istnienie pełnej zgodności skalarnej oznaczało stałość w czasie konceptualizacji mierzonych zjawisk, a tym samym trafność proponowanego do ich pomiaru podejścia.