Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Analiza danych wielowymiarowych, ćwiczenie - Notatki - Bazy danych - Część 1, Notatki z Bazy danych i relacyjne bazy danych

W notatkach wyeksponowane zostają tematy z zakresu bazy danych: analiza danych wielowymiarowych. Część 1.

Typologia: Notatki

2012/2013

Załadowany 24.03.2013

Irena85
Irena85 🇵🇱

4.7

(88)

302 dokumenty

1 / 15

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
WIELOWYMIAROWA ANALIZA DANYCH
Z WYKORZYSTANIEM NARZĘDZIA
MS SQL SERVER
docsity.com
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Podgląd częściowego tekstu

Pobierz Analiza danych wielowymiarowych, ćwiczenie - Notatki - Bazy danych - Część 1 i więcej Notatki w PDF z Bazy danych i relacyjne bazy danych tylko na Docsity!

WIELOWYMIAROWA ANALIZA DANYCH

Z WYKORZYSTANIEM NARZĘDZIA

MS SQL SERVER

Spis treści

    1. WPROWADZENIE
    1. TWORZENIE HURTOWNI DANYCH
  • 2.1. Wprowadzenie
  • 2.2. Zadanie
  • 2.3. Wykonanie zadania
    1. ANALIZA OLAP..................................................................................................
  • 3.1. Wprowadzenie
  • 3.2. Zadanie
  • 3.3. Wykonanie zadania
    1. ANALIZA EKSPLORACYJNA DANYCH
  • 4.1. Wprowadzenie
  • 4.2. Zadanie
  • 4.3. Wykonanie zadania
    1. ZADANIE DO WYKONANIA.............................................................................

 strukturę płatka śniegu – jedna tabela faktów łączy się z wieloma tabelami wymiarów, przy czym niektóre wymiary mogą tworzyć hierarchie: Tabela faktów Tabela wymiaru Tabela wymiaru Tabela wymiaru Tabela wymiaru Tabela podwymiaru Tabela podwymiaru Tabela podwymiaru Tabela podwymiaru Tabela podwymiaru Rys. 2 Struktura płatka śniegu  strukturę burzy śniegowej – kilka tabel faktów łączy się z wieloma wymiarami, przy czym niektóre wymiary mogą być wspólne dla różnych tabel faktów (wymiary oczywiście mogą tworzyć hierarchie): Tabela faktów Tabela wymiaru Tabela wymiaru Tabela wymiaru Tabela wymiaru Tabela faktów Tabela podwymiaru Tabela podwymiaru Tabela wymiaru Rys. 3 Struktura burzy śniegowej Wszystkie prezentowane struktury modelu danych pozwalają na wykorzystanie OLAP’wej technologii przetwarzania danych. Główną jej zasługą jest efektywne wykorzystywanie danych hurtowni do analiz opartych na złożonych zapytaniach iteracyjnych. Wielowymiarowe struktury OLAP’owe i narzędzia agregacji danych umożliwiają łatwe i szybkie przetwarzanie, agregowanie i podsumowywanie ogromnych zbiorów danych i udostępnianie wyników tych analiz w sposób przyjazny dla użytkownika. Informatycznym narzędziem umożliwiającym realizację tych analiz jest SQL Server Business Intelligence Studio , będące komponentem systemu MS SQL Server.

2.2. Zadanie

Przygotować strukturę analitycznej bazy danych, która umożliwiałaby prowadzenie analiz OLAP i eksploracji danych. Będzie to struktura gwiazdy, zgodna ze schematem prezentowanym na WYMIAR_PROJ FAKTY_PROJ WYMIAR_PRAC WYMIAR_ADRES Rys. 4 Struktura hurtowni danych

2.3. Wykonanie zadania

 Na użytek ćwiczeń stworzymy jedynie kilka dodatkowych widoków w bazie danych Kadry , aby w wygodny sposób można było zdefiniować wielowymiarową kostkę OLAP.  Realizację zadania należy rozpocząć od przygotowania nowych widoków w bazie danych Kadry , które zostaną wykorzystane przy tworzeniu kostki OLAP’owej. Jako pierwszy utworzymy Fakty_Proj , będzie to widok definiujący fakty związane z realizacją projektów. Definicję tego widoku prezentuje Rys. 5. Atrybut CzasProj jest liczony w dniach od daty rozpoczęcia do daty zakończenia projektu: Cast(DataZak-DataRoz as int. Rys. 5 Definicja widoku Fakty_Proj  Kolejny widok to Wymiar_Adres, który pozwoli na analizę realizacji projektów pod kątem miejsca zamieszkania osób, które brały w nich udział. Jego definicję prezentuje Rys. 6. W celu umożliwienia bardziej precyzyjnej analizy alokacji geograficznej atrybut KodMiasto został rozdzielony na dwie składowe: Kod i Miasto. Rys. 6 Definicja widoku Wymiar_Adres

3. Analiza OLAP

3.1. Wprowadzenie

OLAP ( ang. Online Analytical Processing ) to komputerowe przetwarzanie, które umożliwia użytkownikowi łatwe i selektywne wydobywanie i oglądanie danych względem różnych wymiarów. Analiza OLAP wykorzystuje koncepcję tzw. kostki OLAP, która posiada wymiary ( ang. dimensions ), zwane także perspektywami, hierarchie ( ang. hierarchies ) i miary ( ang. measures ). Przykład analizy OLAP to badanie liczby zrealizowanych projektów przez poszczególne jednostki organizacyjne w kolejnych latach działalności firmy. Jednostki organizacyjne i lata to właśnie wymiary analizy, a liczba zrealizowanych projektów - miara. Dane zapisywane są w kostce OLAP hierarchicznie. Dzięki temu możemy je analizować na różnych poziomach szczegółowości, rozpoczynając od informacji zagregowanych (np. liczba projektów zrealizowanych w poszczególnych latach) i dochodząc do bardzo szczegółowych, obejmujących pojedyncze operacje (np. liczba projektów zrealizowanych przez konkretnego pracownika w określonym miesiącu). Analiza OLAP pozwala na odpowiadanie na pytania: "kto?", "co?", "kiedy?", "jak?", "dlaczego?", a także na wszechstronną analizę scenariuszową ("co jeśli?"). Umożliwia prognozowanie przyszłych trendów kształtowania się zjawiska na podstawie danych historycznych. Przykładowe pytania, na które odpowiedzi dostarczają narzędzia OLAP: o Jak kształtuje się liczba zrealizowanych projektów w określonych jednostkach organizacyjnych w określonych miesiącach roku? o Którzy pracownicy są najbardziej efektywni – biorą udział w największej liczbie realizowanych projektów? o Jak długo realizowane są projekty przez poszczególne jednostki organizacyjne w określonych kwartałach roku? o Gdzie szukać pracowników najbardziej efektywnych (realizujących największą liczbę projektów w najkrótszym czasie)?

3.2. Zadanie

Należy przygotować kostkę OLAP, która pozwoli analizować dane z tabeli Fakty_Proj względem wymiarów: Wymiar_Proj, Wymiar_Prac, Wymiar_Adres.

3.3. Wykonanie zadania

 Elementy strukturalne kostki OLAP’owej są już gotowe, więc można przystąpić do jej tworzenia. Pierwszym krokiem jest uruchomienie aplikacji SQL Server Business Intelligence Development Studio. Wcześniej wykorzystaliśmy ją do importu danych z systemu MS Access do MS SQL Server. Teraz wykorzystamy ja do tworzenia i uruchamiania projektów analitycznych.  W oknie startowym należy wybrać Create Project. Tworzymy nowy projekt w narzędziu Analysis Services o nazwie AnalizaOLAP, zapisywany na Pulpicie w folderze Instrukcje BD – Ćwiczenie 13- 14 – Wykonanie ćw 13- 14 (Rys. 9 ).

Rys. 9 Analysis Services Project  Pierwszym krokiem tworzenia nowego projektu jest ustalenie połączenia ze źródłową bazą danych (Rys. 10 ). Należy w eksploratorze projektu wybrać na folderze Data Sources opcję New Data Source. Rys. 10 Nowe źródło danych  Zgłasza się Data Source Wizard , który przeprowadzi użytkownika przez proces tworzenie źródła danych na potrzeby analizy. W pierwszym kroku (po przejściu przez ekran powitalny) należy wybrać przycisk New. Otworzy się okno Connection Manager , w którym należy wybrać z listy typ połączenia ( Provider: Native OLE DB\Microsoft OLE DB Provider for SQl Server ), wpisać nazwę serwera ( Server name ) oraz wybrać z listy bazę danych ( Select or enter database name ). Na koniec należy przetestować istnienie połączenia (przycisk Test connection ). Prawidłowe parametry dla tego okna prezentuje Rys. 11.

Rys. 13 Źródło danych Kadry  Teraz należy ograniczyć całą strukturę bazy danych Kadry tylko do tych elementów, które będą wykorzystywane w projekcie. W tym celu wybieramy New Data Source View na folderze Data Source Views (Rys. 14 ). Rys. 14 Przygotowywanie nowego widoku danych źródłowych  Ponownie uruchomi się kreator, gdzie w oknie Select a Data Source należy wybrać przycisk Next na połączeniu z bazą Kadry (Rys. 15 ). Rys. 15 Tworzenie widoku danych dla projektu

 Otworzy się okno, w którym ze wszystkich elementów bazy danych Kadry wybieramy tylko te, które są niezbędne dla projektu. Należy wskazać widoki zawierające fakty i wymiary kostki (Rys. 16 ). Rys. 16 Wybór elementów struktury kostki  Po zakończeniu selekcji w kolejnym oknie nastąpi otwarcie panelu o nazwie Kadry.dsv Design , w którym zostaną umieszczone wszystkie dołączone elementy. Pomiędzy wymiarami i faktami należy utworzyć ręcznie relacje zgodnie z Rys. 17. Rys. 17 Struktura relacji pomiędzy widokami

Rys. 20 Wybór źródła danych dla kostki  Aplikacja automatycznie wykrywa i definiuje fakty i wymiary w kostce, a następnie wyświetla wyniki na kolejnym ekranie (Rys. 21 ). Jeżeli automatyczne propozycje są różne od Rys. 21 to należy dostosować je do wzorca. Rys. 21 Fakty i wymiary w strukturze kostki  Proponowane są też miary obliczane w oparciu o dane liczbowe zawarte w tabeli faktów (Rys. 22 ). Można też dokonać zmiany nazw poszczególnych wartości obliczanych (pp. Rys. 22 ). Rys. 22 Miary obliczane dla kostki

 Kolejne okna kreatora to akceptacja atrybutów dla poszczególnych wymiarów i zakończenie tworzenia struktury kostki. W ostatnim oknie należy wybrać przycisk Finisz , aby przejść do Kadry.Cube (Design).  Kostka OLAP jest już gotowa (Rys. 23 ). Na żółto zaznaczone są fakty w strukturze kostki. Niebieskie są poszczególne wymiary. Rys. 23 Okno projektowe kostki OLAP  Aby zacząć korzystać z kostki należy ją wygenerować poprzez wybranie opcji Process z menu podręcznego folderu Kadry.Cube (Rys. 24 ). Rys. 24 Generowanie kostki  Kostka jest już dostępna w postaci tabeli przestawnej w zakładce Browser panelu Kadry.Cube (Design). Wymiary oraz miary można przeciągać myszką w wybrane