Business Intelligence - Notatki - Informatyk, Notatki'z Informatyka
mila_dziewczyna
mila_dziewczyna17 June 2013

Business Intelligence - Notatki - Informatyk, Notatki'z Informatyka

PDF (448.5 KB)
24 strony
386Liczba odwiedzin
Opis
Informatyka: notatki z zakresu informatyka dotyczące business intelligence i zarządzania wiedzą.
20punkty
Punkty pobierania niezbędne do pobrania
tego dokumentu
Pobierz dokument
Podgląd3 strony / 24
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

1

WYKŁAD I – 17.02.2010

Literatura: • Olszak C.M. Tworzenie i wykorzystanie systemów BI na potrzeby współczesnej organizacji • Surma J. Business Intelligence. System wspomagania decyzji biznesowych • Nycz M. Pozyskiwanie wiedzy menadżerskiej

Zaliczenie: • Test wielokrotnego wyboru (przedostatni wykład, wyniki od razu) • Sprawdzian ustny (przedostatni lub ostatni)

Business Intelligence to procesy, technologie, narzędzia niezbędne do przetwarzania danych w wartościową wiedzę, a wiedzę w plany, które gwarantują duże zyski i odniesienie sukcesu w prowadzonym biznesie.

Business Intelligence to zorientowany na użytkownika proces zbierania, eksploatacji, interpretacji i analizy danych, który prowadzi do usprawnienia i zracjonalizowania procesu podejmowania decyzji. Systemu te wspierają kadrę menedżerską w podejmowaniu decyzji biznesowych w celu kreowania wzrostu wartości przedsiębiorstwa.

Dane – każde dowolne przedstawienie faktów, liczb, pojęć w sformalizowanej postaci, umożliwiające przekazywanie i dokonywanie na nich różnorodnych czynności przetwarzania zmierzających do przekształcenia ich w informację.

Dane, gromadzone w procesach gospodarczych podlegają złożonemu przetwarzaniu, zanim zostaną zaprezentowane i wykorzystane jako informacja.

Całkowity proces przetwarzania dzielimy na prostsze podstawowe procesy, wśród których możemy wyróżnić: • klasyfikację danych • porządkowanie / sortowanie danych • zestawianie / agregację danych • wykonywanie obliczeń • selekcję / wybór danych

Informacja – znaczenie jakie przypisujemy danym. Zrozumienie co przedstawiają, oznaczają dane.

Kryteria oceny jakości informacji: • istotność • aktualność • dokładność • weryfikowalność • dyspozycyjność • porównywalność

Wiedza – wykracza poza informacje, gdyż implikuje zdolność do rozwiązywania problemów, do inteligentnego zachowania i działania. To usystematyzowana informacja, będąca wynikiem celowego nagromadzenia lub wypadkową doświadczeń w odniesieniu do poszczególnych obszarów w działalności.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

2

Dane  Informacja  Wiedza

Fakty, liczby, tekst  Znajomość rzeczy  Zdolność do efektywnego działania

Dane(przetwarzanie, obróbka)Informacje(wnioskowanie,uczenie się)Wiedza

Rodzaje wiedzy: • racjonalna i nieracjonalna • ogólna i specjalistyczna • systematyczna i niesystematyczna • a priori i a posteriori • głęboka i płytka

Wiedza ukryta(tacit) Wiedza jawna(explicit)

Wiedza z doświadczenia Wiedza z wnioskowania

Wiedza przejawiająca się w zastosowaniu Wiedza którą można wyrazić

Wiedza analogowa (praktyka) Wiedza cyfrowa(teoria)

Przykład: Umiejętności manualne

Przykład: Formuła matematyczna

Zarządzanie wiedzą to nowy paradygmat zarządzania XXI wieku. Zarządzanie wiedzą to ogół procesów umożliwiających tworzenie, upowszechnianie i wykorzystywanie wiedzy do realizacji celów organizacji.

Cechy odróżniające wiedzę od innych zasobów(Alvin Toffler) Dominacja – wiedza zajmuje priorytetowe miejsce wśród pozostałych zasobów, ma ona

strategiczne znaczenie dla funkcjonowania każdego przedsiębiorstwa • Niewyczerpalność – oznacza to, że wartość zasobów wiedzy nie zmniejsza się gdy jest

przekazywana • Symultaniczność – wiedza może być w tym samym czasie wykorzystywana przez wiele osób w

wielu miejscach jednocześnie • Nieliniowość – brak jednoznacznej korelacji pomiędzy wielkością zasobów a korzyściami z tego

faktu wynikającymi. Posiadanie dużych zasobów wiedzy nie decedyje bezpośrednio o przewadze konkurencyjnej

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

3

WYKŁAD II – 24.02.2010

Zarządzanie wiedzą Zarządzanie wiedzą to nowy paradygmat XXI wieku. Zarządzanie wiedzą to ogół procesów umożliwiających tworzenie, upowszechnianie i wykorzystywanie wiedzy do realizacji celów organizacji.

Zarządzanie wiedzą jest rozwiązaniem systemowym, które umożliwia radykalny wzrost efektywności wykorzystania posiadanej wiedzy jawnej i ukrytej, sprawiając, że stanie się ona siedzą wspólną całej organizacji.

Modele zarządzania wiedzą a) Model zasobowy – wiedza jako najważniejszy zasób organizacji. To się wydaje logiczne.

b) Konwersji wiedzy jawnej i niejawnej (japoński)– 4 transformacje wiedzy, podczas których tworzona

jest wiedza. [ 1 faza transformacji (wydobycie z pracownika wiedzy, umiejętności i zapisanie tego gdzieś, 2 faza (zamiana wiedzy jawnej na jawną)), 3faza (zamawiana wiedzy jawnej na niejawną) faza zdobywania doświadczeń) 4 faza(zamiana wiedzy niejawnej w niejawną(uczeń mistrz)(uczestniczenie grup doświadczonych z laikami)). Na rynka europejskich mało popularny.

c) Model procesowy – dostosowany do tego, aby wtłoczyć technologię informacyjną w proces zarządzania wiedzą. W skład tego modelu wchodzą procesy i podprocesy. Procesy: - tworzenie, upowszechnianie, wykorzystywanie wiedzy do realizacji celów organizacji

Fazy modelu procesowego

Najistotniejsze dla systemów BI = pozyskiwanie wiedzy

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

4

Proces pozyskiwania wiedzy Zautomatyzowane pozyskiwanie(odkrywania) wiedzy to wydobywanie z dostępnych źródeł informacji istotnych, interesujących i użytecznych prawidłowości oraz zapisywanie ich w pewnej reprezentacji dogodnej do dalszego wykorzystania.

Źródła, z których pozyskiwana jest wiedza mogą być dwojakiego rodzaju:

a) Kapitał intelektualny ( wiedza poszczególnych pracowników i współpracowników organizacji) – pozyskiwanie wiedzy z zasobów ludzkich nazywane jest nabywaniem wiedzy.

b) Nie będące kapitałem intelektualnym (patenty, dokumenty, rozporządzenia, zbiory bazodanowe) – pozyskiwanie wiedzy z tych źródeł odbywa się w procesie odkrywania wiedzy.

Q – oznacza jakość

MDM – master data management (repozytorium zarządzania głównymi danymi)

Etapy procesu pozyskiwania wiedzy a) Weryfikacja i poprawianie jakości danych b) Łączenie i ekstrakcja c) Transformacja d) Eksploracja

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

5

e) Konstrukcja f) Ocena jakości modeli g) Wizualizacja

Ad. a)

Zbiór danych tworzonych przez człowieka zawiera błędy:

- przypadkowe,

- systematyczne.

Śmieci na wejściu = śmieci na wyjściu (garbate In garbate out - GIGO)

Rodzaje błędów:

• Brakujące wartości cech – dla niektórych przypadków wartości niektórych cech nie są wypełnione • Niepoprawne wartości cech – wartości niektórych cech są błędne • Nieustandaryzowane wartości cech – te same w istocie wartości cech są różnie zapisane

Techniki diagnozowania błędów:

a) analiza statystyczna:

- analiza rozkładów wartości,

- identyfikacja wartości dostających, itp.,

b) narzędzia sprawdzania pisowni (analiza tekstowa)

Ad. b)

Źródła danych mogą być:

a) Heterogoniczne: – różne struktury, - - || - funkcjonalności, - - || -Modele danych.

b) Rozproszone

Odpowiednie zestawienie danych z różnych źródeł wymaga:

a) Zrozumienia procesu biznesowego b) Sposobu powstania źródeł c) Trybu aktualizacji źródeł

Ad. c)

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

6

Dla poszczególnych źródeł opracowane zostaje dedykowana warstwa oprogramowania konwerter/monitor.

Konwerter ma za zadanie transformowanie danych z formatu wykorzystywanego w źródle, do formatu wykorzystywanego w repozytorium docelowym. Monitor ma za zadanie wykrywanie zmian w danych źródłowych i ich przekazywanie poprzez konwerter do centralnego repozytorium. Istotą procesu transformacji jest dobór najbardziej optymalnego zestawu cech, polegających na :

• Wyselekcjonowaniu odpowiedniego zestawu cech – eliminacja cech nieprzydatnych, • Dodaniu nowych, wyprowadzonych cech – przekształcenie cech pierwotnych.

Ad. d)

Zadaniem metod eksploracji danych, jest automatyczne odkrywanie nietrywialnych , dotychczas nieznanych, zależności, związków, podobieństw lub trendów – ogólnie nazywanych wzorcami w dużych repozytoriach danych.

DATA MINING

Eksploatacja skonstruowanych modeli, polega na badaniu zaimplementowanych modeli ze względu na :

• Jakość wyników, • Wydajność obliczeniową

Ad. e) - budowa, konstruowanie modelu!

Ad. f)

Ocena jakości modelu obejmuje ocenę:

• dokładności modelu – charakterystyka rozkładu popełnianych błędów, • złożoność modelu • tempa dezaktualizacji modelu, • kosztu adaptacji modelu do ewentualnych zmian lub ponownej konstrukcji modelu

Ocena dedykowana jest w odniesieniu do innych, alternatywnych modeli.

Ad. g)

Reprezentacja wiedzy – przedstawienie odkrytej wiedzy użytkownikowi za pomocą multimedialnych technik:

a) mapa myśli, b) wyświetlenie wiadomości, c) wyświetlenie danych, d) wyświetlenie powiązań

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

7

SIB

Implementacja procesu pozyskiwania wiedzy w systemie informatycznym

CRM

ERP

SAP ETL HD Hurtownie tematyczne Analiza i Raporty

TXT

XML

XLS

HD (DATA WAREHOUSE):

a) uporządkowany tematycznie, b) zintegrowany, c) zawierający wymiar czasowy, d) nieulotny.

Zbiór danych wspomagających podejmowanie decyzji

O hurtowniach może się pojawić pytanie, więc pooglądać od dr Kani

WYKŁAD III – 03.03.2010

Ok. 6- 12 % czasu pracy pracownika to czas poświęcony na znalezienie właściwej osoby lub źródeł informacji potrzebnych do rozwiązania problemu

Ok. 7- 20% czasu pracy ekspertów i specjalistów to czas poświęcony na udzielenie innym odpowiedzi na powtarzające się pytania

Obecnie mniej niż 20% wiedzy organizacji jest w jakikolwiek sposób utrwalana

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

8

Proces zapytania w BD

Proces zapytania system BI

Istota SBI

Ujęcie techniczne: a) Zintegrowany system narzędzi, technologii i produktów do zbierania danych z rozproszonych

źródeł • Integrowanie, analizowanie i udostępnianie danych

b) Cecha charakterystyczna: HD, narzędzia OLAP, techniki drążenia danych c) Procesy, technologie, narzędzia niezbędne do przetwarzania danych w wartościową wiedzę, a

wiedzę w plany – gwarancja sukcesu w prowadzonym biznesie d) Inspiracja do stworzenia nowej kultury pracy z informacją i wiedzą, dzielenia się informacją,

wydobywania wiedzy na potrzeby podejmowanych decyzji

Cechy i możliwości SBI a) Wspierają decydentów w zakresie wyboru informacji, kojarzenia faktów, wnioskowania oraz

dzielenia się informacją b) Stanowią zbiór systemów wspomagania decyzji, systemów wnioskowania, wyszukiwania informacji

kontekstowej, tworzą podstawę szybkiego i precyzyjnego podejmowania decyzji c) Układ różnych koncepcji, metod, procesów wykorzystujących informację i przyczyniając się do

poprawy podejmowania decyzji oraz lepszego zrozumienia dynamiki biznesu d) Mają za zadanie wspomagać procesy podejmowania decyzji poprzez analizę danych

zgromadzonych w różnych systemach transakcyjnych e) Zorientowane na przyszłość, umożliwiają symulację potencjalnych wariantów przyszłości i

opracowanie planu działania f) W czasie rzeczywistym oferują interaktywny dostęp do danych, zapobiegają utracie wiedzy, co

wynika z masowej akumulacji informacji i ułatwionego dostępu do nich g) Dedykowane kadrze kierowniczej i specjalistom zajmującym się strategią oraz analizami

skutkującymi w podejmowaniu niezbędnych decyzji dla rozwoju firmy h) Odpowiadają za przetwarzanie analityczne oraz szybki dostęp i prezentację informacji dyrektorom,

analitykom oraz pracownikom, którzy zarządzają wiedzą

Menadżer

Analityk

Pytania prezentacja

HURTOWNIA DANYCH

Utrzymanie aktualizacja

Programista

Administrator BD

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

9

i) Aktywny proces analizy informacji, integracja kluczowych informacji z kontekstową informacją w celu wykrycia ważnych zdarzeń i wyjaśnień wątpliwych kwestii decyzyjnych, monitorowanie trendów w biznesie

j) Rozwiązania BI stosowane w różnych obszarach funkcjonowania organizacji: • Modelowanie różnych wariantów rozwoju firmy, informowaniu o realizacji strategii,

identyfikacji problemów i „wąskich gardeł” w ich rozwiązaniu, dostarczeniu informacji o otoczeniu i trendach na rynku

• Poprawne relacji z klientami, dostarczaniu wiedzy o klientach przedstawicielom handlowym, by mogli szybko reagować na ich potrzeby, śledzenie poziomu satysfakcji klientów

• Analizie zyskowności produktów i usług, przejawiającym się między innymi w dostarczaniu analiz „najlepszych” i „najgorszych” produktów, pracowników, regionów (sprzedaż, koszt, wynik)

• Analizie procesów wewnętrznych sprawności operacyjnej organizacji, polegającej na dostarczaniu wiedzy i doświadczeń powstałych przy projektowaniu oraz wprowadzaniu produktów na rynek, wymianie wiedzy pomiędzy działami firmy oraz zespołami

• Controlingu i rachunkowości zarządczej, w analizie rzeczywistości kosztów i przepływów finansowych

k) Style BI: • raportowanie korporacyjne – polegające na tworzeniu standardowych raportów na potrzeby

analityków, pojedynczych specjalistów , zarządu firmy • Proste możliwości analityczne (Cube Analysis) – odwołują się do pojedynczych kostek OLAP • Zapytania ad hoc i analizy wielowymiarowe – pozwalają na dogłębną analizę danych i

zapytania ad hoc z wykorzystaniem funkcjonalności OLAP • Analizy statystyczne i drążenia danych – umożliwiają wykorzystanie technik statystycznych i

algorytmów drążenia danych do analizy predykcyjnej i odkrywania korelacji pomiędzy danymi

• Dostarczanie raportów i aktywne alarmowanie – oferowanie raportów informujących o sytuacjach nietypowych, stanach krytycznych, wąskich gardeł

Architektura SBI na potrzeby organizacji Elementy wchodzące w skład architektury i narzędzi SBI

a) HD b) Narzędzia do ekstrakcji i przesyłania danych – odpowiadają za transfer danych pochodzących z

różnych źródeł, a przede wszystkim z systemów transakcyjnych i Internetu do HD c) Narzędzia do analizy i eksploracji danych – umożliwiają użytkownikom wstęp do danych oraz ich

wszechstronne analizowanie i drążenie d) Warstwa prezentacji – aplikacje zawierające graficzne i multimedialne interfejsy, przekazujące

informacje w sposób czytelny i zrozumiały

HD a) Kolekcja tematycznie zintegrowanych, nieulotnych, historycznych danych, służących wspomaganiu

decyzji organizacyjnych b) Możliwość śledzenia najistotniejszych wskaźników: rentowność, ryzyko kredytowe, poziom

zadowolenia klientów c) Element pośredni pomiędzy systemami transakcyjnymi a narzędziami analitycznymi d) Źródła pozyskiwania danych: systemy transakcyjne, systemy MRPII, bazy danych istniejące w

otoczeniu danej organizacji, zasoby WWW , arkusze kalkulacyjne, XML

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

10

e) Dane historyczne w HD

Korzyści HD a) Uzyskanie zintegrowanego i całościowego obrazu firmy b) możliwość przeglądania globalnych zestawień oraz najdrobniejszych szczegółów c) generowanie wielowymiarowych zestawień d) poddawanie analizie dowolnych fragmentów danych e) udostępnianie spójnych historycznych danych f) wprowadzanie jednolitych definicji g) efektywne wykorzystanie danych gromadzonych w systemach transakcyjnych

Narzędzia do ekstrakcji i przesyłania danych – odpowiadają za transfer danych pochodzących z różnych źródeł, a przede wszystkim z systemów transakcyjnych i Internetu do hurtowni danych

Ekstrakcja danych a) polega na uzyskaniu dostępu do danych pochodzących z różnych źródeł

narzędzia do analizy i eksploracji danych – umożliwiają użytkownikom wstęp do danych oraz ich wszechstronne analizowanie i drążenie

narzędzia OLAP Eksploracja danych to proces odkrywania istotnych zależności korelacji, wzorców, i tendencji poprzez przeszukiwanie dużych ilości danych, przechowywanych w repozytoriach danych (składnicach)

Odkrywanie nowej wiedzy:

a) wiedza, jako wynik eksploracji, jest wykorzystywana do prognozowania lub opisu stanu rzeczywistego

b) wiedza uzyskana w wyniku eksploracji danych to wiedza ukryta, głęboka

Warstwa prezentacji danych – aplikacje zawierające graficzne i multimedialne interfejsy, przekazujące informacje w sposób czytelny i zrozumiały

Formy prezentacji danych – wykresy, tabele, rysunki, mapy, dźwięk, film, itp.

Zakres prac obejmujących projektowanie interfejsu a) analiza użytkowników b) analiza zadań użytkownika c) ustalanie kryterium przydatności, uwzględnianie aspektów użytkownika d) dobór odpowiedniego stylu interfejsu e) uwzględnienie zasad, standardów, przewodników pracy

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

11

WYKŁAD IV – 10.03.2010

Odkrywanie wiedzy z danych. Wstępna obróbka zbioru danych.

Metodologia CRISP_DM 1) Zrozumienie uwarunkowań biznesowych. 2) Zrozumienie danych. 3) Przygotowanie danych. 4) Modelowanie. 5) Ewaluacja. 6) Wdrożenie.

Zrozumienie danych a) Zebranie danych; b) Zaznajomienie się z danymi i odkrycie pierwszych zależności poprzez wykorzystanie wstępnej

analizy danych; c) Ocenę jakości danych; d) Wykrycie interesujących podzbiorów, które mogą zawierać wzorce.

Przygotowanie danych a) Przygotowanie ostatecznego zbioru danych; b) Czynności jakie należy wykonać w tym etapie to: • Wyczyszczenie surowych danych, tak aby były gotowe do wykorzystania przez narzędzia

modelujące; • Wykonanie przekształceń na pewnych zmiennych, jeżeli jest to konieczne; • Wybór przypadków i zmiennych, które będą analizowane i które są odpowiednie do analizy.

Ocena jakości danych a) Baza danych może zawierać następujące błędy: • Brakujące wartości w rekordach; • Przestarzałe lub zbędne pola • Nieodpowiedni, dla modeli eksploracji danych, format danych; • Wartości niezgodne z przyjętymi normami lub „zdrowym rozsądkiem”; • Punkty oddalone.

Analiza przypadku (PRZYKŁAD) a) Zbiór danych http://www.spss.pl/larose/ b) Zawartość zbioru danych: • 19 cech (zmiennych); • 3333 przypadków (obserwacji)

c) Zbiór opisuje klientów p[pewnej firmy oferującej usługi telefoniczne; d) Kluczową zmienną w zbiorze jest zmienna churn wskazująca klientów, którzy rezygnują z

korzystania z usług jednej formy na rzecz innej firmy; e) Ostatecznym celem analizy jest zidentyfikowanie przyczyn rezygnacji.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

12

Zmienne

Zmienne ilościowe a) Czas współpracy – czas posiadania konta prze klienta b) Liczba wiadomości liczba wiadomości w poczcie głosowej c) Dzień minuty d) Dzień rozmowy e) Dzień opłata f) Wieczór minuty g) Wieczór rozmowy h) Wieczór opłata i) --------------------- j) Noc minuty wiadomo o co kaman k) Noc rozmowy l) Noc opłata m) Międzynarodowe minuty n) Międzynarodowe rozmowy; o) Międzynarodowe opłaty p) Liczba rozmów z BOK

Zmienne jakościowe a) Churn – przyjmowane wartości prawda/fałsz b) Telefon c) Plan międzynarodowy d) Poczta głosowa

Zmienne churn, plan międzynarodowy, poczta głosowa są zmiennymi tekstowymi;

Zmienna telefon jest ciągiem znaków, na tego typu danych nie można wykonywać działań arytmetycznych;

Przestarzałe lub zbędne zmienne (chyba w tym przykładzie) a) Zmienne ilościowe: • Zmienne quasi – stałe

Współczynnik zmienności < 5%

b) Format danych • Translacja zakodowanych wartości (prawda -1, fałsz - 0); • Ujednolicenie wartości jakościowych (fałsz, falsz, Fałsz itp.); • Ujednolicenie wartości ilościowych; • Zmiana formatu danych (O <> 0 ).

Zestawienie błędów a) Brakujące wartości w rekordach ; b) Przestarzałe lub zbędne pola ; c) Nieodpowiednie, dla modeli eksploracji danych, format danych; d) Wartości niezgodne z przyjętymi normami lub „zdrowym rozsądkiem”; e) Punkty oddalone.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

13

Wykrywanie zależności (już po przykładzie) a) Zmienne ilościowe; • Współczynniki korelacji;

WYKŁAD V – 17.03.2010: PRZENIESIONY NA 23.04.2010 WYKŁAD VI – 24.03.2010: POKAZ PROGRAMU EXCEL

WYKŁAD VII – 31.03.2010: POKAZ PROGRAMU STATISTICA

WYKŁAD VIII (21.04.2010)

Odkrywanie wiedzy z danych Grupowanie Grupowanie obiektów polega na znajdowaniu skończonego zbioru klas (podzbiorów) w bazie danych.

Celem grupowania jest podział zbioru na stosunkowo homogeniczne (jednorodne, zgodne) grupy (klasy) zwane klastrami (skupieniami) różniące się względem siebie.

Grupowanie – etapy • Wybór cech • Wybór miary odległości • Grupowanie i interpretacja

Grupowanie – miara odległości Miara odległości musi spełniać następujące warunki (aksjomaty):

• d(x,y) = 0  x=y • d(x,y) = d(y,x) (warunek symetrii) • d(x,z) <= d(x,y) + d(y,z) (warunek trójkąta)

• Metryka euklidesowa

����(��,��) = �(��1 − ��1)2 +⋯+ (���� − ����)2

• Metryka Manhattan (miejska)

��+(��, ��) = �|���� + ����| ��

��=1

• Metryka Czebyszewa (nieskończoności)

��+(��,��) = dopisac!!!

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

14

Klasyfikacja – metody grupowania Podstawowy podział metod grupowania jako kryterium przyjmuje mechanizm grupowania. Wyróżniamy:

• Metody hierarchiczne, • Metody niehierarchiczne (iteracyjno-optymalizacyjne)

Grupowanie – metody hierarchiczne Generują sekwencje podzbiorów zbioru, w wyniku której otrzymywany jest dendrogram (struktura drzewiasta).

Wyróżniamy dwie podmetody:

Metody aglomeracyjne – w pierwszym kroku zakłada się, że każda obserwacja stanowi jedna grupę, w kolejnych krokach dwie grupy, które są najbliżej łączone są w nową wspólną grupę, ostatecznie wszystkie rekordy należą do jednej (obejmującej wszystkie elementy) grupy;

Metody rozdzielające – w pierwszym kroku zakłada się, że wszystkie obserwacje stanowią jedną grupę, w kolejnych krokach najbardziej niepodobne rekordy wyodrębniane są i rozdzielane w osobne grupy, ostatecznie każdy rekord reprezentuje osobną grupę.

Kluczowym zagadnieniem, obok określenia odległości pomiędzy poszczególnymi rekordami jest określenie odległości pomiędzy grupami. Wyróżniamy kilka kryteriów określania tej odległości:

Metoda pojedynczego połączenia – najbliższego sąsiedztwa o Odległość pomiędzy skupieniami jest zdefiniowana jako odległość miedzy dwoma

najbliższymi punktami, po jednym z każdej grupy. Poszukiwana jest minimalna odległość pomiędzy dowolnymi rekordami z dwóch grup.

Metoda całkowitego połączenia – najdalszego sąsiedztwa o Odległość pomiędzy skupieniami jest zdefiniowana jako odległość miedzy dwoma

najbardziej oddalonymi punktami, po jednym z każdej grupy. Poszukiwana jest minimalna odległość pomiędzy dowolnymi rekordami z dwóch grup, które są najbardziej oddalone od siebie

Metoda średniego połączenia o Odległość pomiędzy skupieniami jest zdefiniowana jako średnia odległość wszystkich

rekordów z poszczególnych grup. Poszukiwana jest minimalna wartość średniej. o Metoda średniego połączenia ma tendencję do tworzenia grup podobnych uzyskanych

metodą całkowitego połączenia

Grupowanie – metody iteracyjno - optymalizacyjne Cechą charakterystyczną tej grupy metod jest zadana z góry (przez analityka) liczba skupień

• Tworzony jest początkowy podział obiektów (zbiór klajstrów k), a następnie, stosując technikę iteracyjnej realokacji obiektów pomiędzy klastrami, podział ten jest modyfikowany w taki sposób, aby uzyskać poprawę podziału zbioru obiektów pomiędzy klastry.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

15

WYKŁAD VIII (23.04.2010)

Okrywanie wiedzy z danych. Reguła asocjacji. Wzorce sekwencji

Reguły asocjacyjne Analiza podobieństw (ang. affinity analysis) = Analiza koszykowa zakupów (ang. market basket analysis)

Znalezienie grup produktów, które klienci kupują najczęściej, czyli odkrycie wzorców zachowań konsumenckich klientów.

Wynikiem analizy koszyka zakupów jest zbiór reguł asocjacyjnych, postaci

����{(������ = ��) ∧ (����2… … … … … … … … …

Miary określające statystyczną ważność i siłę reguły Θ →ϕ

….

Wsparcie Sup(Θ→ϕ) nazywać będziemy stosunek liczby obserwacji, które spełniają warunek Θʌϕ do liczby wszystkich obserwacji, czyli wsparcie reguł jest równe prawdopodobieństwu zajścia zdarzenia Θʌϕ

Ufność conf(Θ→ϕ) nazywać będziemy stosunek liczby obserwacji, które spełniają warunek Θʌϕ do liczby obserwacji, które spełniają warunek Θ (ufność reguły = warunkowemu prawdopodobieństwu p(ϕ|Θ)

Reguły asocjacyjne – rodzaje Reguły asocjacyjne dzielimy ze względu na trzy kryteria:

• Typ przetwarzanych danych, • Wymiarowość przetwarzanych danych • Stopień abstrakcji przetwarzanych danych

Typy przetwarzanych danych Binarne reguły asocjacyjne – danych występujące w regule są danymi (zmiennymi) binarnymi,

mogącymi przyjmować tylko dwie wartości: ‘I’ ({true}) lub ‘0’ ({false}), • Ilościowe reguły asocjacyjne – dane występujące w regule są danymi ciągłymi i/lub

kategorycznymi. Ilościowe reguły asocjacyjne reprezentują, współwystępowanie wartości niektórych danych.

Wymiarowość przetwarzanych danych Jednowymiarowe reguły asocjacyjne – dane występują w regule reprezentują tę samą dziedzinę

wartości, • Wielowymiarowe reguły asocjacyjne – dane występujące w regule reprezentują różne dziedziny

wartości

Stopień abstrakcji przetwarzanych danych Jednopoziomowe reguły asocjacyjne – dane występujące w regule reprezentują ten sam poziom

abstrakcji,

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

16

Wielopoziomowe reguły asocjacyjne – dane występujące w regule reprezentują różne poziomy abstrakcji.

Naiwny algorytm odkrywania reguł asocjacyjnych Naiwny algorytm składa się z trzech głównych kroków:

1. Dany jest zbiór elementów I i baza danych D. 2. Wygeneruj wszystkie możliwe podzbiory zbioru I i następnie, dla każdego podzbioru oblicz wsparcie

tego zbioru w bazie danych D. 3. Dla każdego zbioru , którego wsparcie jest większe/równe minsup, wygeneruj regułę asocjacyjną –

dla każdego otrzymanej reguły oblicz ufność reguły.

Algorytm A priori odkrywania reguł asocjacyjnych • Zakładamy, że wszystkie transakcje są wewnętrznie uporządkowane (np. leksykograficznie) • Lk oznacza kolekcje zbiorów częstych o rozmiarze nazywanych częstymi zbiorami k-elementowymi • Ck oznacza kolekcje zbiorów kandydujących o rozmiarze k, nazywanych kandydującymi zbiorami k-

elementowymi

WYKŁAD IX (28.04.2010)

Odkrywanie wiedzy z tekstu. Web mining

Odkrywanie wiedzy z tekstu Przetwarzaniem zbiorów dokumentów za pomocą metod data mining w celu znalezienia informacji, która nie jest dostępna bezpośrednio lub tez jest trudno dostępna.

Analiza i automatyczne przetwarzanie informacji przechowywanych w zbiorach dokumentów i tekstowych bazach danych (ang. information retrieval).

IR – niestrukturalizowane informacje, inne spojrzenie na zapytania; poszukiwanie przybliżone, automatyczna indeksacja termami – słowami kluczowymi

Analiza języka naturalnego NLP (ang. Natural Language Processing)

Zbiór technik komputerowych służących do analizy i reprezentacji tekstów występujących na poziomie analizy lingwistycznej w celu uzyskania przypominającego ludzki sposobu przetwarzania języka w określonym zakresie zadań i zastosowań.

Technika text mining • Dokument jest reprezentowany jako ciąg znaków, zbiór slow kluczowych lub jako jednostki

leksykalne

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

17

o Bezpośrednie przetwarzanie całego dokumentu (ciągu znaków) jest stosowane • Reprezentacja pierwotnego tekstu za pomocą pojedynczych „termów” (tzw. wektory słów) • Indeksacja dokumentu – przygotowanie tekstu aby mógł być poddany dalszej analizie technikami

numerycznymi o Termy – zmienne nominalne – symboliczne

• Indeksowanie polega na przypisaniu dokumentowi zbioru identyfikatorów, słów kluczowych charakteryzujących temat lub przedmiot dokumentu i wyrażeniu ich w odpowiednim języku informacyjno-wyszukującym

Automatyczna indeksacja Stop lista

• Słowa często pojawiające się w tekście • Dziedzina tekstu

Lematyzacja (an. Steming)

• Słowa są zbudowane jako syntaktyczne (gramatyczne) warianty pewnego podstawowego podsłowa, rdzenia

Wykrycie powiązań Odkrycie asocjacji pomiędzy cechami słowami kluczowymi polega na zastosowaniu rożnych metod data mining, takich jak analiza koszykowa (reguły asocjacji) w celu wykrycia relacji pomiędzy cechami.

Zastosowanie • Wyszukiwanie dokumentów

o Określanie podobieństwa dwóch dokumentów • Rangowanie ważności różnych dokumentów • Grupowanie (poszukiwanie klasyfikacji) dokumentów

o Algorytmy grupowania (najczęściej hierarchiczne) wykorzystujące termy o Grupowanie dokumentów na podstawie podobieństw: wspólny autor, źródło pochodzenia

• Automatyczne klasyfikowanie dokumentów • Analiza powiązań

o Zależności między jednostkami tekstu • Analiza dokumentów WWW lub XML

Web mining Zastosowanie metod data mining do wykrywania wzorców i prawidłowości z sieci WWW

Cele Web mining Wspieranie użytkowników i właścicieli stron w znajdowaniu oczekiwanych, przydatnych i użytecznych informacji na dynamicznych stronach WWW

Zadania po stronie użytkownika • Odkrywanie dokumentów na temat • Odkrywanie semantycznie powiązanych dokumentów • Wydobywanie istotnej wiedzy z wielu źródeł

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

18

• Filtrowanie informacji/wiedzy

Zadania po stronie właściciela • Zwiększenie kontaktu z klientem • Ukierunkowanie promocji produktów, usług, reklam na grupy docelowe • Pomiar efektywności zawartości struktury stron WWW • Wprowadzenie dynamicznej personalizacji usług i zawartości

Web mining stosowany jest w trzech obszarach analizy dokumentów WWW:

• Web Usage Mining • Web Content Mining • Web Structure Mining

Web Usage Mining – analiza informacji o korzystaniu z serwera wykonywana poprzez zastosowanie algorytmów data mining do przetwarzania danych odczytanych z logów serwera w celu odkrycia zachowania i preferencji klientów

Dane pochodzące z logów:

• Geograficzne • Przedziały czasowe • Częstotliwość dostępu • Kategoryzacja zasobów

Wyróżniane są dwa podejścia:

• Spersonalizowane – analiza indywidualnego klienta/użytkownika i budowa jego profilu • Niespersonalizowane – obserwacji zbiorowego zachowania użytkowników – optymalizacja struktury

serwisu oraz identyfikacja ciekawych (często odwiedzanych) miejsc w serwisie

Web Content Mining – inteligentne szukanie wskazanych danych w zasobach sieciowych różnego typu

• Filtrowanie informacji, eksplorowanie wiedzy • Kategoryzacja dokumentów WWW • Webowe hurtownie danych • Wykorzystanie procedur Text miningu • Wyszukiwanie kontekstowe (semantyczne) treści

o Dynamiczne dokumenty WWW – format HTML • Osadzone obiekty multimedialne

Web Structure Mining – szukanie zależności w strukturach hiperłączy pomiędzy dokumentami

• Wyszukiwanie połączeń pomiędzy dokumentami WWW o Z jakich lokalizacji wyświetlana jest strona i do jakich lokalizacji prowadzi:

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

19

 Strony – autorytety  Zbiór autorytetów – społeczności sieci Web

• Struktura wewnętrzna strony o Analiza i opis struktury znaczników HTML lub XML

• Wykorzystanie teorii grafów

WYKŁAD X (05.05.2010)

Pozyskiwanie wiedzy z procesów Proces – to uporządkowany w czasie ciąg zmian i stanów zachodzących po sobie.

Proces biznesowy • uporządkowany zbiór czynności zaprojektowany w celu wytworzenia określonego wyjścia dla

szczególnego klienta lub rynku, • uporządkowany zbiór połączonych działań(czynności) wytwórczych lub usługowych, wykonywanych

w określonym czasie, przynoszących w efekcie korzyści klientowi zewnętrznemu lub wewnętrznemu,

W trakcie realizacji procesu biznesowego następuje przekształcenie określonych zasobów (materialnych i/lub informacyjnych) i poprzez te przekształcenia dodawanie do nich wartości za którą gotów jest zapłacić klient rozumiany jako osoba, podmiot bądź systemu któremu wykonawca dostarcza konkretny produkt.

Elementy procesu biznesowego Przyjmuje się, że proces biznesowy jest złożony z trzech elementów:

• sterowanie (logika) określa połączenia i przejścia między etapami procesu; • wykonywanie działania, w których biorą udział różni wykonawcy oraz otoczenie (klienci, dostawcy),

nie zakończyłby się sukcesem, gdyby były wykonywane w oderwaniu od siebie bez koordynacji, reguł

Działania to kroki w procesie, określone przez: • ograniczenia:

-zasobowe -czasowe

• warunki wykonania: -warunki inicjacji- określając co musi być spełnione zanim działanie zostanie rozpoczęte, - warunki końcowe- określające co musi być spełnione aby działanie można było uznać za zakończone

Zasoby – wszystkie elementy potrzebne do wykonania działania:

• materialne • niematerialne

Procesy biznesowe dzielimy na : Procesy zarządzania –kierują działaniem systemu.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

20

• Cele: -formułowanie strategii i celów organizacji -kontrolowanie przebiegu pozostałych procesów

• Przykłady: -proces zarządzania przedsiębiorstwem -proces zarządzania strategicznego

Procesy operacyjne –stanowią istotę biznesu i jest pierwotnym źródłem wartości dodanej.

• Cele: - wykonywanie typowych działań zmierzających do realizacji złożonych celów i strategii

• Przykłady: - proces wsparcia i zapewnia ciągłość produkcji, - proces zarządzania kontaktami z klientami, -proces dostarczania produktów i usług.

Procesy pomocnicze – wspiera procesy główne.

Przykłady:

• proces zarządzania finansowego przedsiębiorstwa, • procesy zarządzania efektywnością, • proces dostarczania produktów i usług.

Zarządzanie procesowe – skoncentrowanie działalności organizacji na procesach jest odpowiedzią na wady podejścia funkcjonalnego i rzeczowego (reistycznego) do zarządzania.

Zarządzanie w ujęciu funkcjonalnym – polega na podziale pracy na małe fragmenty, z których każdy jest udoskonalony w celu zwiększenia efektywności wykonania całego procesu.

Przekształcenie firmy w firmę zorientowaną procesowo (określaną również jako procesocentryczną), polega na takim dostosowaniu działań, struktur organizacyjnych i zasobów firmy, aby aktywność wszystkich tych elementów ukierunkowana była na jak najlepszą realizacje procesów biznesowych.

Skuteczne zarządzanie procesami to zdolność do: • identyfikacji i opisania procesów • projektowania, organizowania i symulacji • skutecznego wdrażania i uruchamiania • monitorowania i operowania przebiegiem, • zapisywania i analizy informacji o przebiegach • udostępnienia wydobytej wiedzy właścicielom, organizatorom i wykonawcom procesu • wdrażanie usprawnień

Monitorowanie – uruchomiony proces wymaga stałego monitorowania jego przebiegu, czyli badania odchyleń od założonego wzorca i w razie konieczności skorzystanie z mechanizmów kontroli i sterowania.

Monitorowania:

• pomiar wykonania procesu • możliwość związana z procesem dowolnie określonych wskaźników (KPI- Key Process Indicators) • obserwacja KPI w trakcie realizacji i po wykonaniu procesu

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

21

• wgląd w zasoby (czas, materiał, ludzi, aplikacje, informacje) wykorzystywane w trakcie wykonywania procesów.

Analiza – dane zebrane w toku monitorowania przebiegu proces należy zapisać i poddać analizie.

Przeprowadzenie wszechstronnego badania zjawisk związanych z wykonywanym procesem, którego celem jest odkrycie nowej wiedzy użytecznej w usprawnieniu procesu/

Dane ustrukturalizowane: bezpośrednio zapisane w postaci odpowiedniej do analizy (proste pliki logów, bazy danych, hurtownie danych);

Dane nieustrukturalizowane (dokument, multimedia), wymagają zastosowania technik text miningu.

BPMS (ang. Business Process Managment System)

System zarządzania procesami biznesowymi

W ujęciu biznesowym jest synergicznym efektem zaawansowanej technologii z praktyką opartą o podejście procesowe.

BPMS zwierają narzędzia, aplikacje, technologie, pozwalające na projektowanie i modelowanie procesów symulację – udostepniają wzór… • integrację – skomponowanie procesu wymaga współdziałania różnorodnych elementów (zasobów

informacyjnych) • środowisko kompozycji złożonych aplikacji umożliwiających (w oparciu o graficzny interfejs)

zbudowanie i przetestowanie aplikacji bez pisania kodu • środowisko wykonani – czyli silnik procesów, dzięki któremu zaprojektowane wzorce można

uruchomić w realnym świecie • monitorowanie i przekazywanie w czasie rzeczywistym informacji o realizowanych

procesach menedżerom i właścicielom procesów • narzędzia sterowania – w celu osiągnięcia oczekiwanych rezultatów konieczne jest posiadanie

zbioru narzędzi, które umożliwiają pomiar procesów, nadzór na tym jak przebiegają… • analiza powykonawcza – tak, aby możliwe było wyciąganie wniosków z przebiegu już wykonanych

zadań, uczenie się, poszukiwanie lepszych rozwiązań i optymalizacja.

Wykład XI (12.05.2010) Kontynuacja poprzedniego wykładu

BPMS – moduły Schemat, ponoć Mateusz Bartkiewicz go ma. :D

BPMS – repozytoria danych

ODS (Operational Data Store)

Repozytorium przeznaczone do przechowywania bieżących danych operacyjnych o aktualni realizowanych procesach.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

22

Ilości danych powstające podczas przebiegów procesów jest ogromna, zasięg ODS jest ograniczony do danych o bieżących przebiegach procesów.

PDW (Process Data Warehouse)

Hurtownia danych o procesach, zasilana zagregowanymi danymi z ODS.

Budowane w celu przechowywania historycznych danych o procesach i przeprowadzania analiz dla celów strategicznych.

PDS (Process Data Store)

Repozytorium tematycznie zorientowane, zintegrowane, zmienne, bieżące, szczegółowe. Budowane w celu monitorowania procesów on-line.

PIF (Process Informaion Factory)

Fabryka informacji o procesach, stanowi podstawę budowy systemów wspomagania decyzji sterowanych procesowo.

BPI (Business Process Intelligence, Operational Intelligence – OI)

Zastosowanie technik BI w cyklu zarządzania procesami biznesowymi w celu zapewnienia lepszego zrozumienia procesów zachodzących w firmie i znalezienia sposobów na ich usprawnianie.

Systemy inteligentnej analizy procesów mają za zadanie identyfikację i wykrycie przyczyn wystąpienia przerwań lub „wąskich gardeł”.

Elementy wiedzy, jakie można pozyskać z systemów BPI należą do kategorii know-who i know-how dotyczą:

• informacji o umiejętnościach pracowników praz ich grup, • zasobów krytycznych w organizacji i ośrodków wiedzy – osób posiadających wiedzę istotną dla

wykonania określonego typu procesu, • kolejności wykonywanych działań oraz okresów czasu, w których są one podejmowane (zarówno w

sensie kalendarzowym, jak i w sensie czasu, który upłynął od wykonania poprzednich działań), • możliwości katalogowania kolejnych pojawiających się przypadków, • modelowania zachowań w trakcie realizacji konkretnych zadań, • znajdowania wzorców procesów zachodzących w organizacji, • wykrywania nieprawidłowości w wykonywaniu zadań i przyczynach niewykonania zadań lub ich

opóźnieniach.

PIF

PDS PDW

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

23

Process mining Analiza procesów to zbiór technik pozwalający na analizę procesów biznesowych w oparciu o logi zdarzeń.

Cel analizy procesów • optymalizacja przebiegu aktualnego procesu (dobór zasobów), • odkrywanie wzorców znanych procesów z danych o transakcjach, • kontrola zgodności przebiegu danego procesu ze wzorcem, • zakwalifikowanie procesu ad hoc (nieznanego) do jednej z klas procesów, • badanie ewolucji wzorców procesów o prognozowanie, • projektowanie nowych wzorców, • identyfikacja nieznanych procesów z danych o transakcjach, • odkrywanie zachowań poszczególnych wykonawców w trakcie realizacji procesów i odkrywanie

wiedzy o zachowaniach, które przyczyniają się do sukcesu lub porażki procesu.

Cele analizy procesów mogą być osiągane na różnych poziomach:

Poziom pierwszy – poziom monitorowania procesów. Oparty jest na bieżącej informacji o stanie procesu. Poziom ten odpowiada zapytaniom do transakcyjnych baz danych.

Poziom drugi – wielowymiarowa analiza zgromadzonych historii przebiegów procesów. Na tym poziomie informacje o przebiegach procesów traktuje się jako obiekty i analizuje za pomocą systemów OLAP. W takiej HD poszczególne stany procesów oraz procesy traktujemy jako fakty, natomiast definicje procesów, zasoby, czas, uczestnicy procesów tworzą wymiary.

Poziom trzeci – semantyczna analiza procesów. Opera się na znaczeniu terminów, którymi posługują się analitycy i projektanci procesów biznesowych. Przykłady pytań, na które nie można odpowiedzieć na poziomie drugim:

o które procesy zakończyły się powodzeniem/niepowodzeniem? o jaki jest średni czas negocjacji? o które procesy przebiegają zbyt wolno? o jak opóźnienia w realizacji procesów wpływają na stopień zadowolenia klienta?

Analiza semantyczna Można ją rozumieć dwojako:

• jako analizę pojęć i związków między nimi, • jako możliwość wyrażenia wyników analiz wykonywanych na innych poziomach w kategoriach pojęć

biznesowych użytecznych bezpośrednio dla menedżerów wyższego szczebla.

Metody analizy procesów W analizie procesów wykorzystuje się następujące techniki data mining:

• wyszukiwanie wzorców oraz częstych i rzadkich sekwencji zdarzeń, • określanie podobieństwa sekwencji zdarzeń, • znajdowanie reguł asocjacji w sekwencjach zdarzeń, • grupowanie wzorców sekwencji zdarzeń i szeregów czasowych, • metody Case-Base-Reasoning CBR (wnioskowanie na bazie przypadków) dla sekwencji zdarzeń i

wzorców procesów.

Wykłady z przedmiotu Business Intelligence, dr Bogna Zacny, 2010

24

Ontologie Ontologia to narzędzie opisu wiedzy na potrzeby procesu zarządzania wiedzą, w celu jej reprezentacji, udostępniania i współdzielenia.

Ontologie są jawną, formalną specyfikacją wspólnej konceptualizacji.

jawny – rodzaj stosowanych pojęć i ograniczeń ich stosowania jest jawnie zdefiniowany; • formalny – ontologia jest czytelna dla maszyny; • wspólny – odzwierciedla przekonanie, że ontologia zawiera wiedzą konsensualną, tzn. będąc

wynikiem przyjęcia zgodnych pojęć i ich znaczeń przez grupę; • konceptualizacja – abstrakcyjny model jakiegoś zjawiska utworzony przez zidentyfikowanie

relewantnych pojęć tego zjawiska (opis określonej dziedziny).

Uschold, King, Moralee, Zorigos przyjmują szerszą i mniej formalną definicję ontologii:

Ontologia może przyjmować różnorodne formy, ale koniecznie będzie zawierała słownik terminów i jakieś określenie ich znaczenia.

Fikes i Farquhar podali następującą definicję ontologii:

Uważamy, że ontologie są teoriami dziedzinowymi podającymi specyficzne dla danej dziedziny słownictwo, dotyczące obiektów, klas, własności i funkcji, oraz zestaw zależności koniecznie obowiązujących między tymi pozycjami słownictwa. Ontologie zapewniają słownictwo do reprezentowania wiedzy o dziedzinie i do opisywania specyficznych sytuacji w dziedzinie.

Języki opisu ontologii • Resource Description Framework (RDF) • Web Ontology Language (OWL)

Celem RDF jest umożliwienie maszynowego przetwarzania abstrakcyjnych opisów zasobów w sposób automatyczny. Może służyć zarówno do wyszukiwania danych, jak i śledzenia informacji na dany temat.

RDF opisuje dany zasobu z pomocą wyrażenia składającego się z trzech elementów:

• podmiotu – opisywany zasówb, • predykatu – określa jaka własność zasobu jest opisywana, • obiektu – stanowi wartość tej własności.

OWL jest językiem wyższego rzędu opierającym się na XML oraz RDF.

OWL jest rodziną trzech różnych produktów:

• OWL Lite – wersja tworzenia prostego języka dla użytkowników nie wymagających złożonych klasyfikacji i cech,

• OWL DL – wersja zawierająca pełne słownictwo, interpretowanego pod kątem zbioru prostych ustalonych cech,

• OWL Full – rozszerzona wersja.

komentarze (0)
Brak komentarzy
Bądź autorem pierwszego komentarza!
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
Docsity is not optimized for the browser you're using. In order to have a better experience we suggest you to use Internet Explorer 9+, Chrome, Firefox or Safari! Download Google Chrome