Poslovna statistika-Seminarski rad-Ekonometrijske metode-Menadzment 3
dreaming.in.rome
dreaming.in.rome

Poslovna statistika-Seminarski rad-Ekonometrijske metode-Menadzment 3

77 str.
11broj preuzimanja
1000+broj poseta
100%od3broj ocena
1broj komentara
Opis
Seminarski rad,fon,fakultet organizacionih nauka, menadzment,ekonometrijske metode, Poslovna statistika, Ka statističkom razmišljanju,Verovatnoća statističkog zaključka, Teme poslovne statistike,Zanimljivi i korisni sajt...
20 poeni
poeni preuzimanja potrebni da se preuzme
ovaj dokument
preuzmi dokument
pregled3 str. / 77
ovo je samo pregled
3 prikazano na 77 str.
ovo je samo pregled
3 prikazano na 77 str.
ovo je samo pregled
3 prikazano na 77 str.
ovo je samo pregled
3 prikazano na 77 str.
www.puskice.co.yu

www.puskice.co.yu

www.puskice.net

Poslovna statistika

Otkrivanje činjenica iz cifara

Ovaj Websajt je kurs o razumevanju statistika ; na primer, sa sticanjem osećaja za statistički način razmišljanja. To je uvodni kurs u statistiku koji je napravljen da bi Vas podučio osnovnim konceptima i metodima statističkih analiza za procesiranje i proizvode. Sadržaj ovog Websajta je ispričan tako da odgovara Vašim potrebama u donošenju poslovnih odluka i podstakne statističko razmišljanje. Osnovna svrha ovog sajta je povećanje obima u kome se statističko razmišljanje stapa sa menadžerskim razmišljanjem za donošenje odluka u situacijama kada ste neodlučni.

MENI

1. Uvod 2. Ka statističkom razmišljanju 3. Verovatnoća statističkog zaključka 4. Teme poslovne statistike 5. Zanimljivi i korisni sajtovi 6. Prateći sajt broj I : Analiza vremenskih nizova i tehnike proračunavanja 7. Prateći sajt broj II : Računari i računarske statistike 8. Prateći sajt broj III : Dizajn upitnika i uzorci istraživanja 9. Prateći sajt broj IV : Proces modeliranja verovatnoće : Izračunljivo riskantno donošenje

odluka 10. Prateći sajt broj V : Excel za uvodne statističke analize 11. Prateći sajt broj VI : Lista statsističkih knjiga

www.puskice.co.yu

www.puskice.net

Uvod

Ka statističkom razmišljanju za donošenje odluka u neizvesnosti

Uvod : Nastanak statistike Različite škole razmišljanja u statistici Zalivski, frekvenstistički i klasični metodi Šta je poslovna statistika Verovanje, mišljenje i činjenica Vrste laži : Laži, osuđene laži i statistika

Verovatnoća statističkog zaključivanja

Verovatnoća, šansa, mogućnost i izgledi Kako odrediti verovatnoće Opšti zakoni verovatnoće Uzajamna isključivost i nezavisna isključivost Entropy merenja Upotreba i uslovi korišćenja statističkih tabela Veze između distribucija i povezivanja statističkih tabela

 Obična distribucija  Binomska distribucija  Pojzonova distribucija  Izlagačka distribucija  Homogena distribucija  Studentova t distribucija  Chi-kvadratna distribucija

Teme poslovne statistike

Najčešće korišćena grčka slova u statistici Tipovi podataka i nivoi merenja Metodi semplovanja Proveravanje homogenosti populacije Kako konstruisati nacrt okvira Uklanjanje odstupanja Kratak sadržaj statistike

 Predstavljanje uzorka : Merenje centralne tendencije  Odabir između sredstva median i načina  Kvalitet uzorka : Merenje disperzije  Pogađanje distribucije koja odgovara Vašim podacima : Naoštrenost i zakrivljenost  Izračunavanje deskriptivne statistike za grupisane / negrupisane podatke  Numerički primer i diskusije  Multinomijalne distribucije : Očekivana vrednost, Varijacija, Standardno odstupanje i

koeficijent varijacije

www.puskice.co.yu

www.puskice.net

Šta je najvažnije kod normalnih distribucija Šta je distribucija uzoraka Šta je teorema centralne granice Šta su slobodni stepeni

Procena parametara i kvalitet dobre procene Procedure statističkog donošenja odluka Statistika sa pouzdanošću i određivanje veličine uzorka Testiranje hipoteze : Odbacivanje zahteva Klasični pristup testu hipoteze Značenje i interpretacija P vrednosti ( šta kažu podaci) Klasičnih i pristupa zansovanih na p vrednosti u testu hipoteze Uslovi pod kojima se primenjuje većina statističkih testova

 Homogena populacija (ne mešajte jabuke i narandže)  Test nasumičnosti : test nizova  Test normalnosti

Statistički test jednakosti karakteristika populacije

 Srednje vrednosti dve nezavisne populacije (t test)  Dve zavisne srednje vrednosti ( t test za setove podataka u paru)  Više od dve nezavisne srednje vrednosti (ANOVA)  Više od dve zavisne srednje vrednosti (ANOVA)

Snaga testa Parametrički protiv Neparametričkih protiv testova bez distribucije Chi – kvadratni testovi Bonferonijev metod Test prikladnosti za diskretne nasumične promeljive Kada treba da izvedemo procene varijacija Tehnike uzmanja uzoraka : Sečenje i butstrapovanje Šta je linearni moel sa najmanje kvadrata Pirsonov i Spirmanov odnos Kako uporediti dva koeficijenta korelacije Kovarijacija i Korelacija Nezavisni protiv Povezanih Korelacija i nivo značaja Uslovi i lista provere modela linearne regresije Analiza regresije : Planiranje, razvoj i odražavanje Predviđanje marktinškog odgovora Garancije : Statsitičko planiranje i analiza Analiza faktota

www.puskice.co.yu

www.puskice.net

Uvod

Današnje poslovne odluke se izvode iz podataka. U svim aspektima naših života i u znatnom poslovnom konteksu, zapanjujuće razlike podataka su dostupne za proveravanje i obaveštenje. Poslovni menadžeri i profesionalci se sve više ohrabruju da pravdaju odluke na osnovu podataka.

Poslovnim menadžerima su potrebni sistemi za podršku odluka zasnovanih na statističkom modelu. Statističke veštine Vam omogućavaju da inteligentno sakupite, analizirate i interpretirate podatke relevantne za donošenje odluka. Statistički koncepti i statističko razmišljanje Vam omogućavaju da :

 Rešavate probleme u raznim kontekstima  Dodajete stvarno značenje odlukama.

Ovaj Websajt je kurs o razumevanju statistika ; na primer, sa sticanjem osećaja za statistički način razmišljanja. Razumevanje statistike je sjajno; čini da ono što je odlično u statističkom razmišljanju pripadne i Vama. To je uvodni kurs u statistiku koji je dizajniran tako da Vam pruži osnovne koncepte, i metode statističke analize za procesiranje i proizvode. Sadržaj ovog Websajta je ispričan tako da odgovara Vašim potrebama u donošenju poslovnih odluka i podstakne statističko razmišljanje. Osnovna svrha ovog sajta je povećanje obima u kome se statističko razmišljanje stapa sa menadžerskim razmišljanjem za donošenje odluka u situacijama kada ste neodlučni. Uveliko je poznata činjenica “Statističko razmišljanje će jednoga dana biti potrebno za efikasnog građanina koliko i sposobnost da čita i piše.” Pa, hajde da budemo ispred svog vremena.

U kompetitivnosti poslovni menadžeri moraju da dizajniraju kvalitet za proizvode, a potom procese pravljenja proizvoda. Moraju da obezbede process neprekidnog poboljšavanja svih faza proizvodnje i servisa. Ono što proizvodi procese koji pružaju visoki prihod i retko izneveri jesu statistički metodi strateškog zapošljavanja, naročito statistički dizajnirani eksperimenti. To olakšava razvoj snažnih proizvoda koji su imuni na promene u okolini i varijacije unutrašnjih komponenti. Pažljivo isplanirana statistička proučavanja uklanjaju svaku smetnju na putu do visokog kvaliteta i produktivnosti u svakoj fazi proizvodnje. To štedi vreme i novac. Dobro je poznato da kvalitet mora biti uključen u proizvode što je ranije moguće u procesu dizajniranja. Pojedinac mora da zna kako da iskoristi pažljivo isplanirane, isplative eksperimente radi poboljšanja, optimizovanja i pravljenja snažnih proizvoda i procesa.

Poslovna statistika je nauka koja Vam pomaže da donosite odluke usled nezvesnosti zbog numeričkih i merljivih skala. Proces donošenja odluka mora biti zasnovan na podacima a ne ličnom mišljenju ili verovanju.

Đavo je u odstupanjima : Varijacije su neizbežne u životu. Svaki proces, svako merenje svaki uzorak ima varijacije. Menadžeri moraju razumeti varijacije iz dva razloga. Najpre, zato da bi naveli druge da primene statističko razmišljanje u svakodnevnim aktivnostima i drugo, da bi primenili koncept u svrhu kontinualnog napretka. Ovaj kurs će Vam pružiti

www.puskice.co.yu

www.puskice.net

iskustvo da promovišete upotrebu statističkog razmišljanja i tehnika da biste ih primenili u donošenju mudrih odluka svaki put kada se susretnete sa varijacijama u poslovnim podacima. Naučićete tehnike za inteligentan pristup i snalaženje sa rizicima koji postoje u donošenju odluka. Stoga, upamtite :

Kao i vreme, ako nešto ne možete da kontrolišete, treba da naučite kako da ga merite i analizirate, da biste ga predvideli, efikasno.

Ukoliko ste imali statistiku ranije, i imate osećaj nemogućnosti da shvatite koncepte, to je uglavnom zbog Vaših ranijih, nestatističkih instruktora statistike. Njihove razlike stvaraju kod studenata fobije od slatke nauke statistike. U vezi sa tim, professor Herman Černov je doneo sledećI zaključak u Statističkoj nauci, Tom 11, br 4, 335-350, 1996:

“Pošto svi na ovom svetu misle da mogu podučavati statistici iako je ne poznaju, staviću sebe u poziciju da predajem biologiju iako je ne znam.”

Ubacivanje brojeva u formule i njihovo razbijanje, nema samo po sebi nikakvu vrednost. Treba da nastavite da ulažete trud u koncepte i da se skoncentrišete na interpretaciju rezultata.

Čak i kada rukom rešite mali problem, želeo bih da upotrebite kompjuterske programe i proračune zasnovane na internetu, da obave sav prljavi posao za Vas.

Trebalo bi da ste u stanju da pročitate logičke tajne u svim formulama, a ne da ih pamtite. Na primer, u izračunavanju varijacije, imajte u vidu njenu formulu. Umesto da je pamtite, trebalo bi da počnete sa nekoliko zašto :

I Zašto dižemo na kvadrat devijacije Zato što, ako saberemo sve devijacije uvek dobijamo vrednost nule. Zato, da bismo rešili ovaj problem, mi dižemo na kvadrat devijacije. Zašto ih ne povećati do četiri (tri ne bi vredelo)? Pa, dizanje na kvadrat uspeva, zašto bismo činili život komplikovanijim nego što jeste? Upamtite, takođe, da dizanje na kvadrat uvećava devijacije, stoga ide u našu korist da izmerimo kvalitet podataka.

II Zašto postoje znakovi sabiranja u formuli? Da bi se sabralie devijacije dignute na kvadrat svake tačke podataka radi izračunavanja ukupnog zbira odstupanja dignutih na kvadrat.

III Zašto zbir kvadrata delimo sa n-1? Količina odstupanja takođe treba da odražava veličinu uzorka, tako da moramo uneti veličinu uzorka. To jest, u većem uzorku postoji većI broj kvadratnih devijacija nego prostih. Zašto n-1 a ne n? Razlog za to je što kada delimo sa n-1, varijacija uzorka pruža procenjenu varijaciju mnogo bližu varijaciji stanovništva, nego kada delimo sa n. Primetićete da za veće uzorke n (recimo preko 30) nije važno da li delimo sa n ili n-1. Rezultati su otprilike isti i oba su prihvatljiva. Faktor n-1 je ono što smatramo “prihvatljivim stepenima”.

www.puskice.co.yu

www.puskice.net

Primer pokazuje kako da ispitujete statističke formule, umesto da ih pamtite. Zapravo, kada pokušavate da razumete formule, ne treba da ih pamtite, jer su one delovi povezanosti Vašeg mozga. Jasno razmišljanje je uvek važnije od sposobnosti da uradite mnogo aritmetike.

Kada gledate u statističke formule, trebalo bi da formula razgovara sa Vama, kao kada muzičar gleda deo muzičkih nota i čuje muziku. Kako postati statističar koji je istovremeno muzičar?

Kurs o razumevanju statističkog razmišljanja daje ivicu poslovnim profesionalcima. Profesionalci sa izraženim kvantitativnim veštinama su traženi. Taj fenomen će rasti kako podstrek za odluke zasnovane na podacima bude jačao, i količina i dostupnost podataka. Statistički alat može da se razvije i napreduje u svim fazama karijere.

Proces donošenja odluke u okolnostima nesigurnosti se uglavnom zasniva na primeni statistike za procenu verovatnoće nekontrolisanih događaja (ili faktora), kao i procene rizika Vaše odluke. Prvobitna ideja statistike je bila sakupljanje informacija o i za državu. Verovatnoća ima mnogo dužu istoriju (state). Verovatnoća (probability) je izvedena iz glagola to probe u značenju saznati ono što nije pristupačno ili razumljivo. Reč dokaz (proof) je istog porekla koje obezbeđuje potrebne detalje za razumevanje onoga za šta se tvrdi da je tačno.

Glavni cilj ovog kursa je učenje statističkog razmišljanja; naglašavanje koncepata, manje teorije i recepata, i konačno podsticanje aktivnog učenja uz korišćenje korisnih i zanimljivih Web sajtova.

Neke teme poslovne statistike

Grčka slova koja se najčešće koriste kao statističke oznake

U statistici i drugim naučnim oblastima koristimo grčka slova da bismo odali počast drevnim grčkim filosofima koji su izumeli nauku (kao što su Sokrat, izumitelj dijalektičkog razumevanja).

Grčka slova koja se najčešće koriste kao statističke oznake alpha beta ki-sqre delta mu nu pi rho sigma tau theta α β x² δ μ ν π ρ σ ζ θ

NAPOMENA : ki-kvadrat (ki-sqre) nije kvadrat ničega. Ime ukazuje na chi-kvadrat. Ki ne postoji u statistici.

Uvod : Nastanak statistike

Prvobitna ideja statistike je bila sakupljanje informacija o i za državu (state).

www.puskice.co.yu

www.puskice.net

Statistika je nastala sredinom 17. veka. Čovek po imenu Džon Graunt, iz Londona, počeo je da pregleda prikaze nedeljnih crkvenih publikacija koje je izdavao službenik parohije koji je beležio rođenja, krštenja, i smrti u svakoj parohiji. Ovi takozvani pregledi smrti takođe su sadržavail uzroke smrti. Graunt koji je bio trgovac je organizovao ove podatke u formi koju nazivamo deskriptivnom tj. opisnom statistikom, koju je objavljivao kao Prirodna i politička obzervacija pregleda smrti. Nedugo nakon toga, odabran je za člana Kraljevskog društva. Statistika pozajmljuje neke koncepte iz sociologije kao što je koncept “Stanovništva”. Smatra se da pošto statistika najčešće uključuje studije ljudskog ponašanja, ne može imati preciznost fizičkih nauka.

Verovatnoća ima mnogo dužu istoriju. Potiče iz proučavanja igara na sreću i kockanja tokom šesnaestog veka. Teorija verovatnoće je bila grana matematike koju su proučavali Blez Paskal i Pjer de Fermat u sedamnaestom veku. Sada, u dvadeset prvom veku izračunavanje verovatnoće se koristi za kontrolisanje protoka saobraćaja u sistemu autoputeva, telefonskih linija, ili procesora računara; pronalaženje genetičkog koda pojedinaca ili naroda; kontrolu kvaliteta, osiguranje, investicije, i druge sektore poslovanja i industrije.

Nova i razna polja ljudskih aktivnosti u razvoju koriste statistiku. Ipak, izgleda da to samo polje ostaje nepoznato javnosti. Profesor Bredli Efron je odlično tu činjenicu izrazio:

Tokom dvadesetog veka statističko razmišljanje i metodologija su postali naučni okvir za bukvalno gomile oblasti uključujući obrazovanje, agrikulturu, ekonomiju, biologiju, medicinu, i sve više njihov uticaj raste na nauke kao što su astronomija, geologija, fizika. Drugim rečima, prerasli smo iz malog nepoznatog polja u veliko nepoznato polje.

Različite škole mišljenja u statistici

Postoji nekoliko škola mišljenja u statistici. One su nastajale vremenom, postepeno, kako se pojavljivala potreba za njima.

Proces nastanka nove škole mišljenja

Proces nastajanja nove škole mišljenja u bilo kojoj oblasti je uvek Išlo nekim prirodnim putem. Nastanak novih škola mišljenja u statistici nije izuzetak. Proces nastanka :

Kada već postoji ustanovljena škola, mora se raditi u definisanom okviru.

Kada nastane kriza, na primer, neke nedoslednosti u rezultatu okvira iz sopstvenih zakona.

Reakcija :

1. Odbijanje razmatranja krize. 2. Pokušaj da se izgladi i objasni kriza u okviru postojećeg okvira. 3. Preobražaj nekih dobro poznatih naučnika privlačI sledbenike u novu školu.

www.puskice.co.yu

www.puskice.net

Opažanje krize u statističkoj zajednici zahteva ojačanje osnove. Nakon što kriza prođe, stvari će možda izgledati drugačije i istoričari statistike mogu odbaciti događaj kao jedan u nizu koraka dograđivanja osnove. Pa, možemo čitati istorije statistike, kao priču o piramidi koja se gradi vremenom sloj po sloj na čvrstoj osnovi.

Druge škole mišljenja se pojavljuju da bi ublažile i proširile postojeću teoriju verovatnoće i statistike. Neki ublažavajućI pristupi koriste koncepte i tehnike koje su se razvile u slabijoj teoriji, teoriji verovatnoće i Dempster-Shaferovoj teoriji.

Sledeća figura ilustruje tri glavne škole mišljenja, Klasična (dodeljena Laplaku), Realtivna frekvencija (Fišer) i Bajezijska (Sevidž). Strelice u ovoj figuri predstavljaju neke od glavnih kritika između Objektivne, Frekventističke i Subjektivne škole mišljenja.

Bajezijski, Frekventistički i Klasični metodi

Problem sa klasičnim pristupom je to što ono što sačinjava ishod nije određeno objektivno. Ono Što je za jednu osobu jednostavan događaj, za drugu je složen. Jedan istraživač može pitati, za novootkrivenu planetu “koja je verovatnoća da postoji život na novoj planeti?” dok drugi može pitati “koja je verovatnoća da na njoj postoji život zasnovan na ugljeniku?”

Bruno de Fineti u uvodu svoje rasprave u dva toma o o idejama bajezista, jasno kaže da “Verovatnoće ne postoje”. Pod tim podrazumeva da se verovatnoća ne nalazi na kockici ili novčIću; nije karakteristična za stvari kao što su masa, razdaljina itd.

Neki bajezijski pristupi smatraju teoriju verovatnoće nastavkom deduktivne logike za rešavanje nesigurnosti. Cilj joj je da zaključi iz prvih principa jedinstven ispravan način predstavljanja verovanja o stanju stvari, i dopunjavanja istih sa svetlom dokaza. Zakoni verovatnoće imaju isti status kao i zakoni logike. Ovi bajezijski pristupi su eksplicitno subjektivni u smislu da se bave verovatnoćom koju će racionalan agent pridružiti propozicijama on/ona smatra, dajući njenom/njegovom stanju znanja iskustvo. Nasuprot tome, bar neki nebajezijski pristupi smatraju verovatnoće objektivnim atributima stvari ili situacija koje zaista postoje (dostupnost podataka).

Bajezijski i klasičan statističar pri analizi istih podataka generalno dolaze do istog zaključka. Ipak, bajezijski je sposobniji da uveća stvarnu nesigurnost u svojim analizama, naročito kada su dostupne suštinske ranije informacije. Bajezijci su skloni da fnkcije distribucije verovatnoće dodele parametrima stanovništva dok frekventsisti nisu.

Iz perspective jednog naučnika postoje čvrste osnove za odbacivanje bajezijskog razmišljanja. Problem je u tome što se bajezijsko razmišljanje ne bavi objektivnim već subjektivnim verovatnoćama. Posledica je to da svako razmišljanje po bajezijskom principu ne može biti javno provereno, što ga čini bezvrednim za nauku, kao neverodostojne eksperimente.

Bajezijske perspective često bacaju potrebnu svetlost na klasične procedure. Neophodno je ući u bajezijski okvir da bi se intervalima pouzdanosti dala interpretacija verovatnoĆe koju praktikanti žele. Ovaj uvid je koristan za privlačenje pažnje na stavku da bi druga ranija distribucija vodila ka drugom intervalu.

www.puskice.co.yu

www.puskice.net

Bajezijanac može prevariti zasnivajući raniju distribuciju na podacima; Frekventista može zasnovati hipotezu tako da bude testirana na podacima. Na primer, uloga protokola u kliničkim eksperimentima je da spreče to zahtevom da pre sakupljanja podataka, bude određena hipoteza. Na isti način. bajezijanac može biti obavezan da odredi raniju u javnom protokolu pre nego započne proučavanje. U kolektivnom naučnom proučavanju, to bi bilo složenije nego kod hipoteza frekventista jer ranije moraju biti lične da bi se održala doslednost.

OdgovarajućI kvantitet koji je predložen za merenje nesigurnosti zaključka;na primer rešavanje neočekivanog unapred je samo po sebi funkcija verovatnoće.

Ukoliko izvodite niz identičnih nasumičnih eksperimenata (naprimer, bacanje novčIća) osnovna distribucija verovatnoće koja maksimizuje verovatnoću ishoda koju ste proučavali je distribucija verovatnoće proporcionalna rezultatima ekspermenta.

To ima direktnu interpretaciju objašnjavanja kako relativno dobro svako moguće objašnjenje ili model, bez obzira da li je izveden iz podataka ili ne, predviđa podatke posmatrača. Ukoliko se ispostavi da su podaci ekstremni (netipični) na neki način, tako da verovatnoća ukazuje na mali broj modela, to će uskoro biti preuzeto u sledećem krugu naučnih istraživanja od strane naučne zajednice. Nisu potrebne garancije na duže staze ni lična mišljenja.

Postoji jedan aspect u kome je bajezijski pristup usmeren ka donošenju odluka a frekventistički pristup testiranja hipoteza ka nauci. Na primer, možda nema dovoljno dokaza za naučno dokazivanje da je agent X opasan za ljude, ali može se opravdati ako neko odlučI da ga izbegava u dijeti.

U skoro svim slučajevima, procena tačke je kontinualna nasumična promenljiva. Stoga, verovatnoća da je verovatnoća u određenoj proceni tačke, je ravna nuli. To znači da u vakuumu informacija, ne možemo određivati verovatnoću. Čak i kada imamo informacije možemo pogađati samo opseg verovatnoće.

Stoga, u proceni parametara date populacije, neophodno je da procenu tačke prati neka mera moguće greške procene. Široko prihvaćen pristup je da procenu tačke mora pratiti neki interval o proceni sa određenom merom uverenja da taj interval sadržI stvarne vrednosti parametara populacije.

Šta je poslovna statistika

U ovom našem raznolikom svetu ne postoje dve potpuno isto stvari. Statističara zanimaju i sličnosti i razlike na primer, šeme i odstupanje.

Tabele koje izdaju osiguravajuća društva odražavaju njihove statističke analize prosečnog očekivanog života muškaraca i žena u bilo kojim godinama. Osiguravajuća društva, zatim, na osnovu tih brojeva, izračunavaju odgovarajuće premije za određene pojedince da bi kuplil dati iznos osiguranja.

www.puskice.co.yu

www.puskice.net

Istraživačke analize podataka koriste numeričke i grafičke tehnike za proučavanje šema i odstupanja od šema. Najčešće korišćene deskriptivne statističke tehnike su : Histogrami učestalosti distribucije, Box & Whisker i Spread nacrti, normalni nacrti, Kokrejn nacrti, Residual, ROC i dijagnostički nacrti, Skatergrami i Eror Bar nacrti, Ladder, Aggreement i Survival nacrti; i piramida stanovništva. Grafičko mode;iranje je kolekcija moćnih i praktičnih tehnika za pojednostavljivanje i opisivanje međusobnih veza između statističkog koncepta uslovne nezavisnosti i grafičko-teoretskog koncepta razdvajanja.

Kontroverzni “Milion ljudi maršira ka Vašingtonu” iz 1995 godine je demonstriralo da veličina skupine može imati značajne političke posledice. Organizatori marša su se nepokolebljivo održali, procene zvaničnih službi koje je ponudio američki park servis (300 000) su bile suviše niske.

U istraživanju distribucije podataka, trebalo bi da ste u stanju da primetite značajne karakteristike, kao što su oblik, lokacija, promenljivost, i neobične vrednosti. Iz pažljivih opazanja šema u podacima, možete stvoriti pretpostavku o vezama među promenljivim. Znanje o tome kako jedna varijabla može biti povezana sa drugim, prožima se u gotovo celokupnoj statistici, od jednostavnih poređenja proporcija do linearne regresije. Razlika između povezivanja i uzročnosti mora pratiti ovaj konceptualni razvoj.

Podaci moraju biti sakupljeni u skladu sa dobro razvijenim planom ukoliko želite da se održe važeće informacije o pretpostavci. Plan mora identifikovati bitne varijable povezane sa pretpostavkom, i određivati kako će biti izmerene. Iz plana sakupljanja podataka može biti fomulisan statistički model iz koga mogu biti izvedeni zaključci.

Statistički modeli se trenutno koriste u raznim oblastima poslovanja i nauke. Ipak, terminologija se razlikuje od oblasti do oblasti. Na primer, podudaranje modela sa podacima, zvano kalibracija, podudaranje istorije, i asimilacija podataka, sve su to sinonimi procene parametara

Baza podataka Vaše organizacije sadrži mnoštvo informacija, ali članovi grupe za tehnologiju odluke izdvajaju samo njen delić. Zaposleni gube vreme u pretraživanju višestrukih izvora baze podataka. Donosioci odluka su isfrustrirani jer ne mogu na vreme da dobiju podatke kritične za posao. Stoga, veliki broj odluka se donosi nagađanjem, a ne na osnovu činjenica. Takođe mnoge prilike se propuštaju, tj. ukoliko uopšte budu prihvaćene.

Podaci su sirove informacije a ne pravo znanje. Redosled od podataka do znanja je sledeći : od podataka do informacije, od informacija do činjenica, i konačno od činjenica do znanja. Podatak postaje informacija onog trenutka kada postane bitan za rešavanje nekog problema. Informacija postaje činjenica kada može da se potvrdi podacima. Činjenica postaje znanje, kada se uspešno iskoristi u procesu odlučivanja. Kada integrišete veliku količinu činjenica kao znanje, onda će Vaš um biti natčovečanski u istom smislu kao da je ljudski rod sa pismom natčovečanski u poređenju sa ljudskim rodom bez pisma. Sledeća figura ilustruje process statističkog mišljenja zasnovan na podacima u konstruisanju statističkih modela za donošenje odluka u neizvesnosti.

Zato nam je potrebna poslovna statistika. Statistika se uzdigla od potrebe za smeštanjem znanja na sistematsku bazu. To je zahtevalo proučavanje zakona o verovatnoćI, razvoj merenja karakteristika podataka i odnosa itd.

www.puskice.co.yu

www.puskice.net

Osnovni cilj poslovne statistike je da donese zaključak (na primer, predviđanje, donošenje odluke) o određenim karakteristikama populacije zasnovanim na informacijama koj se nalaze na nasumičnom uzorku čitave populacije. Uslov nasumičnosti je esencijalan da bi uzorak bio zaista reprezentativan za populaciju, na osnovu koga pokušavamo da razumemo populaciju.

Poslovna statistika je nauka o dobrom donošenju odluka u okolnostima nezivesnosti i koristi se u disciplinama kao što su finansijske analize, ekonometrija, proizvodnja i operacije koje uključuju poboljšanje usluga, i istraživanja tržišta. Pruža znanje i veštine za interpretaciju i upotrebu statističkih tehnika u raznim poslovnim primenama. Tipičan kurs poslovne statistike je namenjen za poslovanje i pokriva statistička proučavanja, opisnu statistiku (sakupljanje, opisivanje, analizu i kratak sadržaj podataka), verovatnoću, i binomne i obične distribucije, proveru hipoteza i intervale poverenja, linearnu regresiju, i odnos.

Statistika je nauka o donošenju odluka uz uvažavanje karakteristika grupe ljudi ili predmeta na osnovama numeričkih informacija dobijenih iz nasumično odabranog uzorka grupe. Statističari ovoj numeričkoj obzervaciji pripisuju realizaciju nasumičnog uzorka. Ipak, upamtite da se nasumični uzorak ne može videti. Nasumični uzorak je samo uzorak konačnih ishoda nasumičnog procesa.

U fazi planiranja statističke istrage kritično je pitanje veličine uzorka (n). Na primer, veličina uzorka za ograničenu populaciju veličine N je podešen na Sqrt (N) +1 zaokruženo na najbliži ceo broj. Jasno je, da veći uzorak obezbeđuje značajnije informacije, i tačniju procenu i bolji statistički sud u vezi sa testom hipoteza.

Gornja figura ilustruje ideju statističkog mešanja populacije i nasumičnog uzorka. Takođe, pruža procenu parametara populacije, sa očekivanom vrednošću μx, standardna odstupanje i funkcija kumulativne distribucije (cdf) Fx, σ i odgovarajuće statistike uzorka, x, standardna devijacija uzorka Sx, i empirički cdf.

Populacija: Populacija je svaka skupina ljudi, životinja, biljaka ili stvari iz kojih možemo sakupiti podatke. Nasa interesuje čitava grupa, nju žlimo da opišemo ili da izvedemo zaključke o njoj. U gornjoj figuri vek trajanja električne sijalice proizvedene od strane recimo GE je populacija koju posmatramo.

Statistički eksperiment

Generalno, eksperiment je operacija u kojoj odabiramo vrednosti jednih promenljivih i merimo vrednost drugih, kao u fizici. Kod statističkog eksperimenta, uzima se nasumični uzorak populacije i zakljuučuju se vrednosti nekih promenljivih. Na primer, u istraživanju, mi istražujemo tj. posmatramo situaciju bez pokušaja da je promenimo, kao na primer u istraživanju političkog mišljenja, nasumičan uzorak relevantne populacije obezbeđuje informacije o glasačkim namerama.

Da bi se napravila bilo kakva opšta slika o populaciji, često se proučava nasumični uzorak čitave populacije, koji bi trebalo da predstavlja čitavu populaciju. Za svaku populaciju postoji veći broj mogućih uzoraka. Statistike uzoraka daju informacije o

www.puskice.co.yu

www.puskice.net

odgovarajućim parametrima populacije. Na primer, srednji broj seta podataka daje informaciju o celokupnoj populaciji srednji broj μ.

Važnoje da istražitelj pažljivo i u potpunosti definiše populaciju pre nego što sakupi uzorak,uključujući i opis članova.

Primer: Populacija za proučavanje zdravlja dece mogu biti sva deca rođena u SAD-u 80 ih godina. Uzorak mogu biti sve bebe rođene sedmog maja bilo koje od tih godina.

Eksperiment je svaki process ili studija koja rezultira kolekcijom podataka, i čiji je ishod nepoznat. U statistici, termin je obično ograničen na situacije u kojima istraživač ima kontrolu nad nekim od uslova u kojima se vrši eksperiment.

Primer: Pre uvođenja novog leka za smanjenje krvnog pritiska, proizvođač izvodi eksperiment upoređivanja efektivnosti novog leka sa onim koji je trenutno u upotrebi. Novo dijagnosticirani subjekti se preuzimaju iz grupe lokalnih opštih običaja. Polovina njih se odabira nasumice za primanje novog leka, ostala polovina prima postojeći. Na taj način istraživač ima kontrolu nad tipom odabranog subjekta i načinom na koji će biti dodeljeni tretmanu.

Eksperimentalna jedinica : Jedinica je osoba, životinja, biljka ili predmet koga zapravo proučava istraživač; osnovni objekat na kome se izvode eksperimenti. Na primer, osoba; majmun; uzorak zemljišta; saksija semenjače; doktorska praksa.

Dizajn eksperimenta je ključni alat za povećanje stope sticanja novih znanja – znanja koja zauzvrat mogu biti iskorišćena za dobijanje konkurentske prednosti, skraćivanje ciklusa razvoja proizvoda, i proizvodnju novih proizvoda i procesa koji bi odgovorili i prevazišli očekivanja Vaših mušterija.

Osnovni zadatak statistike je da proučava karakteristike populacija bez obzira na to da li populaciju čine ljudi, predmeti ili kolekcije informacija. Iz dva osnovna razloga, često je nemoguće proučavati čitavu populaciju :

Proces bi bio isuviše skup i dugotrajan. Proces bi bio destruktivan.

U svakom slučaju, pribegava se opazanju uzorka odabranog iz populacije i pokušavanju da se zaključe informacije o čitavoj populaciji ispitivanjem samo manjeg uzorka. Veoma često, brojevi koji nas najviše zanimaju o populaciji su srednji broj μ i standardno odstupanje σ. Bilo koji broj, kao na primer srednji broj ili standardna odstupanje, koji se izračunava za čitavu populaciju, naziva se parametar. Ukoliko se isti podaci izvode samo iz podataka uzorka, onda se konačni brojevi nazivaju statistika. Često se brojevi predstavljaju grčkim slovima a statistika latinskim slovima (kao što je prikazano u gornjoj figuri). Funkcija koraka u ovoj figuri je EDF Funkcija empiričke distribucije, poznate kao ogive koji se koristi za grafičko predstavljanje kumulativne frekvencije. EDF se konstruiše postavljanjem tačke, koja odgovara srednjoj tački svake klase, na visinu jednaku kumulativnoj frekvenciji klase. EDF predstavlja funkciju distribucije Fx.

www.puskice.co.yu

www.puskice.net

Parametar

Parametar je nepoznata vrednost, i stoga mora biti procenjen. Parametri se koriste za predstavljanje određenih karakteristika populacije. Na primer, srednja vrednost populacije μ je parametar koji se često koristi za ukazivanje na prosečnu vrednost kvantiteta.

U okviru populacije, parametar je fiksna vrednost koja se ne menja. Svaki uzorak izveden iz populacije ima sopstvenu vrednost svake statistike koja se koristi za procenu tog parametra. Na primer, srednja vrednost podataka u uzorku se koristi za informacije o ukupnom srednjem broju μ u populaciji iz koje je taj uzorak izveden.

Statistika : Statistika je kvantitet izračunat iz uzorka podataka. Koristi se za davanje informacija o nepoznatim vrednostima u odgovarajućoj populaciji. Na primer, prosek podataka u uzorku se koristi za davanje informacija o ukupnom proseku u populaciji iz koje je izveden uzorak.

Statistika je funkcija nasumičnog uzorka koji se posmatra, a koji ne sadrži nikakve nepoznate parametre. Stoga je nasumična promenljiva koja se posmatra. Upamtite da, dok je statistika funkcija opazanja, na žalost, često se naziva nasumičnom promenljivom a ne funkcijom.

Moguće je iscrtati više od jednog uzorka iz iste populacije, i vrednost statistike će generalno varirati od uzorka do uzorka. Na primer, prosečna vrednost uzorka je statistika. Prosečne vrednosti u više od jednog uzorka, izvedenih iz iste populacije, neće obavezno biti jednake.

Statistika se često ispisuje rimskim slovima (na primer x i s) dok se ekvivalentne nepoznate vrednosti populacije (parametri) ispisuju grčkim slovima.

Reč proceniti znači oceniti, tj. dati nečemu vrednost. Statistička procena je indikacija vrednosti nepoznatog kvantiteta zasnovanog na posmatranim podacima.

Formalno rečeno, procena je određena vrednost procenjivača koja se dobija iz određenog uzorka podataka i koristi se za prikazivanje vrednosti parametra.

Primer : Pretpostavimo da vlasnik prodavnice želi da zna μ, srednju vrednost potrošnje mušterija u njegovoj prodavnici u toku prethodne godine. Izračunava prosečnu potrošnju stotina (ili možda hiljada) mušterija koje su kupile proizvode u toj prodavnici, to jest srednju vrednost populacije μ. Umesto toga, može iskoristiti procenu srednje vrednosti ove populacije μ izračunavanjem srednje vrednosti reprezentativnog primera mušterije. Ukoliko je konačna vrednost $25, onda će njena procena biti $25.

Postoje dve široke podele statistike : deskriptivna (opisna) statistika i interferencijalna statistika.

Opisna statistika : Numerički statistički podaci mogu biti predstavljeni jasno, koncizno, i tako da donosilac odluke može brzo dobiti osnovne karakteristike podataka da bi ih uključio u proces odlučivanja.

www.puskice.co.yu

www.puskice.net

Princip deskriptivnog kvantiteta, izveden iz podataka uzorka, je srednja vrednost (x) koja je aritmetički prosek podataka uzorka. Služi kao najpouzdanija mera vrednosti tipičnog člana uzorka. Ukoliko uzorak sadrži nekoliko vrednosti koje su toliko velike ili male da imaju efekat preuveličavanja na vrednost srednjeg broja, uzorak se preciznije predstavlja medianom vrednošću gde je polovina vrednosti uzorka ispod a polovina iznad.

Kvantiteti koji se najčešće koriste za merenje disperzije vrednosti o njihovoj srednjoj vrednosti su varijacija s² i njen kvadratni koren, standardna odstupanja s. Varijacija se izračunava određivanjem srednjeg broja, oduzimanjem istog od svake od vrednosti uzorka (ostavljajući devijaciju uzoraka) a potom izračunavanjem proseka kvadrata tih odstupanja. Srednji broj i standardno odstupanje uzorka se koriste kao procene odgovarajućih karakteristika čitave grupe iz koje je izveden uzorak Uglavnom ne opisuju u potpunosti distribuciju (Fx) vrednosti u okviru bilo kog uzorka ili grupe; zaista, različite distribucije mogu imati istu srednju vrednost i standardnu devijaciju. Ipak, obezbeđuju kompletan opis normalne distribucije, u kojoj su pozitivne i negativne devijacije iz srednjeg broja jednako rasprostranjene a male devijacije su mnogo rasprostranjenije od velikih. Za set vrednosti distribuiran na običan način, grafik koji predstavlja zavisnost učestalosti odstupanje od magnituda je zakrivljen u obliku zvona. Oko 68 procenata vrednosti će se razlikovati od standardne devijacije manje od tri puta.

Inferencijalna statistika : Inferencijalna statistika se bavi izvođenjem zaključaka iz uzoraka o populacijama iz kojih su izvedeni. Drugim rečima, ukoliko pronađemo razliku između dva uzorka, želimo da znamo da li je to stvarna razlika (na primer, da li je prisutna u populaciji) ili samo slučajna razlika (na primer, mogla bi biti samo rezultat nasumične greške uzimanja uzorka). Toga se tiču testovi od statističkog značaja. Svaki zaključak iz podataka uzorka o populaciji iz koje je uzorak izveden, mora biti izražen u uslovima verovatnoće. Verovatnoća je jezik i alat merenja za neizvesnost u našim statističkim zaključcima.

Statističko zaključivanje se odnosi na proširivanje Vaših znanja, dobijenih iz nasumičnog uzorka čitave populacije, na čitavu populaciju. To je u matematici poznato kao induktivno razmišljanje. To jest, znanje o celini na osnovu dela. Njegova glavna primena je u testiranju hipoteza o datoj popilaciji. Statističko zaključivanje vodi selekciju odgovarajućih statističkih modela. Modeli i podaci međusobno sarađuju u statističkom radu. Modeli se koriste za izvođenje zaključaka iz podataka, dok je podacima dozvoljeno da kritikuju, Ili čak osporavaju model kroz inferencijalne i dijagnostičke modele. Zaključivanje na osnovu podataka se može smatrati procesom selektovanja odgovarajućeg modela, uključujući i izjavu na jeziku verovatnoće o tome koliko se možemo uzdati u selekciju.

Postoje dva tipa zaključaka koji se izvode u statistici. Prvi je procena, koja uključuje određivanje, sa mogućom greškom u vezi sa uzimanjem uzorka, nepoznate vrednosti karakteristike populacije, kao što je proporcija, koja ima specifičan atribut prosečne vrednosti μ u nekim numeričkim merenjima. Da bi se izrazila tačnost procena karakteristika populacije, moraju se izračunati i standardne greške procena,; to su margine koje određuju moguće greške nastale iz činjenice da se procene zasnivaju na nasumičnim uzorcima iz čitave populacije a ne na kompletnoj populaciji. Drugi tip zaključivanja je testiranje hipoteza. Uključuje definicije hipoteza kao set mogućih vrednosti populacije i alternativni, drugačiji set. Postoje mnoge statsitičke procedure za određivanje, na osnovu uzorka, da li prava karakteristika pripada setu vrednosti u hipotezi ili alternativi.

www.puskice.co.yu

www.puskice.net

Statističko zaključivanje se zasniva na verovatnoćI, idealizovanim konceptima grupe koja se proučava, zvane populacija, i uzorka. Statističar može videti populaciju kao set lopti iz kojih je uzorak odabran nasumice, to jest tako da svaka lopta ima istu šansu kao i bilo koja druga za uključivanje u populaciju.

Upamtite da da bi se mogli proceniti parametric populacije, uzorak veličine n mora biti većI od 1. Na primer, sa uzorkom veličine jedan, varijacija S² u okviru uzorka je 0/1 = 0. Procena za varijaciju σ² u okviru populacije bi bila 0/0 što je neodređen kvantitet, značI nemoguć.

Verovatnoća (srednje vrednosti, istraživanje nepoznatih) je alat koji se koristi za predviđanje kako treba da izgleda distribucija podataka u datom modelu. Nasumični fenomeni nisu slučajni, oni prikazuju red koji se pojavljuje samo na duge staze i opisan je distribucijom. Matematički opis varijacije je centralan u statistici. Verovatnoća potrebna za statsitičko zaključivanje nije aksiomsko ili kombinatorno, već je orijenstisano na opisivanje distribucija podataka.

Statistika je alat koji nam omogućava da uvedemo red u neorganizovanu kakofoniju stvarnog sveta modernog društva. Poslovni svet se razvio i u veličini i konkurenciji. Korporacije moraju obavljati rizične poslove, pratiti rast popularnosti i potrebu za poslovnom statistikom.

Poslovna statistika se razvila iz umetnosti konstruisanja tabela i šema. To je nauka zasnivanja odluka na numeričkim podacima u slučaju neizvesnosti.

Poslovna statistika je naučni pristup donošenju odluka uz rizik. U praksi poslovne statistike, tražimo razumevanje, uvid a ne rešenje. Tragamo za jednim rešenjem koje odgovara svim potrebama poslovanja sa najmanjim mogućim rizikom. Poslovna statistika može od obične poslovne situacije, sa odgovarajućim sakupljanjem podataka, analizama i traganjem za rešenjem, pretvoriti u priliku.

Dok poslovna statistika ne može zameniti znanje i iskustvo donosioca odluke, ipak je dragocen alat koji menadžer može iskoristiti u procesu donošenja odluke da bi smanjio rizik.

Poslovna statistika daje opravdane odgovore na sledeće probleme svakog proizvođača i potrošača :

1. Šta Vaša mušterija ili Vi očekujete od proizvoda koje kupujete ili prodajete? To jest, šta je dobra procena μ ?

2. Kada imate informaciju o Vašim ili očekivanjima Vaše mušterije o kvalitetu proizvoda koji kupujete ili prodajete, šta je kvalitet proizvoda koji prodajete ili kupujete. To jest, šta je dobra procena σ?

3. Kada imate informaciju o Vašim ili očekivanjima Vaše mušterije od proizvoda koji kupujete ili prodajete i o kvalitetu proizvoda koji kupujete ili prodajete, da li se proizvod poredi sa drugim postojećim sličnim tipovima? To jest, poređenje nekoliko μ.

Vrste laži : Laži, osuđene laži i statistika

“Postoje tri vrste laži – laži, osuđene laži, i statistika.” Piše u autobiografiji Marka Tvena.

www.puskice.co.yu

www.puskice.net

Već je prihvaćena činjenica da će statističko razmišljanje biti neophodno za efikasnog građanina koliko i sposobnost čitanja i pisanja.

Slede primeri toga kako statistika može biti pogrešno iskorišćena u medijima, što može biti opisano kao nauka okupiranja ljudske neinteligencije dovoljno dugo da bi se iz nje mogao izvući novac. Osnivač Revlona je rekao “U fabrici pravimo kozmetiku, u prodavnici prodajemo nadu.”

U većini slučajeva reklamna obmana se postiže izostavljanjem nekih stavki :

1. Neverovatna produžena tojota : “Kako je moguće da Vam automobil koji je spolja duži samo 9 inča, daje više od dve stope više prostora u unutrašnjosti? Možda je to nova matematika?” Toyota Camry marketing

Gde je greška u ovoj izjavi ? U tome što se obim uzima kao dužina. Na primer, 3x6x4=72 kubne stope, 3x6x4.75=85.5 kubnih stopa. Moglo bi biti više od 2 stope.

2. Pepsi kola marketing : “U skorašnjim testiranjima ukusa širom nacije, više ljudi se odlučilo za Pepsi a ne Koka kolu.”

Pitanja su : Da li je to bio slučaj sa pojedinim testovima, koja je bila veličina uzorka? Nigde se ne kaže “U svim skoašnjim…”

3. Korelacija ? Konzorcijum marketinga elektonskih kompanija. “96% ulica u SAD-u je neosvetljeno, a 88% zločina se odvija u neosvetljenim ulicama”.

4. Zavisni ili nezavisni događaji ? “ukoliko je verovatnoća da neko nosi bombu u avionu .001, onda je šansa da dvoje ljudi nosi bombu .000001. Zato bi trebalo da počnem da nosim bombu prilikom svakog leta.”

5. Brige saveta kartonskog pakovanja : “Istraživanja univerziteta pokazuju da papirni kartoni mleka daju više vitamina na galon.”

Kako je dizajniran eksperiment? Istraživanje je sponzorisao savet! Opada prodaja papirnih pakovanja!”

6. Svi vitamini ili samo jedan? “Da biste dobili vitaminsku ishranu Totala, trebalo bi da pojedete četiri činije mekinja.”

7. Šestostruko bezbednije : Prošle godine 35 ljudi se udavilo u nesrećama sa čamcima. Samo petoro je nosilo zaštitne jakne. Ostali nisu. Uvek nosite zaštitnu jaknu kada se vozite čamcem.”

Koji procenat čamdžija nosi zaštitnu jaknu? Uslovna verovatnoća.

8. Marketing knjogovodstvene firme : “Jedan od naših službenika će Vam se pridružiti u obračunavanju.”

To zvučI kao jedinstven prodajni predlog, ali skriva činjenicu da je izjava zakon SAD-a.

www.puskice.co.yu

www.puskice.net

Postoje mnoge druge uobičajene zloupotrebe statistike : nepošteni i neznalački metodi istraživanja, pretrpana pitanja istraživanja, grafici i piktogrami koji skrivaju ono što nije u programu dokaza, i ispitanici istraživanja koji se automatski biraju, jer ne žele da se izjašnjavaju po nekom pitanju; veoma zanimljive stvari i naravno, one koje proširuju ono što podaci zapravo umanjuju.

Verovanje, mišljenje i činjenica

Slova u broju Vašeg kursa OPRE 504 predstavljaju istraživanje operacija. OPRE je nauka o donošenju odluka (zasnovanih na nekim numeričkim i merljivim skalama) traženjem rešenja. Odlučivanje uz nesigurnosti mora se zasnivati na činjenicama a ne na ličnom mišljenju ili verovanju.

Razumne odluke su uvek zasnovane načinjenicama. Ne bi trebalo da mešamo činjenice sa verovanjem ili mišljenjem. Verovanja se definišu kao nečije lično razumevanje ili potreba. U verovanju, “Ja sam” uvek u pravu i “ti” nisi u pravu. Ne može se ništa učiniti da se osoba ubedi da je ono u šta veruje pogrešno. Mišljenje je manje ekstremno od verovanja. Mišljenje znači da osoba ima određene poglede za koje misli da su ispravni. Takođe zna da drugi imaju pravo na svoje mišljenje. Ljudi poštuju tuđa mišljenja i zauzvrat očekuju isto. Nasuprot verovanjima i mišljenju stoje činjenice. Činjenice su osnove odluka. Činjenica je nešto što je tačno, i može se dokazati da je tačno na osnovu dokaza i logičkih argumenata.

Primeri za verovanje, mišljenje i činjenice mogu se naći u religiji, ekonomiji.

Sa uvažavanjem verovanja, Henri Poincare je rekao “Sumnjajte u sve ili verujte u sve: to su dve podjednako prigodne strategije. Sa svakom od njih oslobađamo se potrebe da mislimo.”

Kako odrediti verovatnoće

Verovatnoća je argument za merenje mogućnosti da se nešto desi. Postoje tri osnovna pristupa određivanja verovatnoća :

1. Klasični pristup : Klasična verovatnoća se iskazuje pod uslovom da je verovatno da će se dogoditi rezultati eksperimenta. Klasična verovatnoća koristi ideju da nedostatak znanja nagoveštava da su sve mogućnosti verovatne. Klasična verovatnoća se primenjuje kada događaji imaju iste šanse da se dogode, i kada je set događaja uzajamno isključiv i kolektivno iscrpan. Klasična verovatnoća se definiše kao :

P(X) = Broj povoljnih ishoda/ukupan broj mogućih ishoda

2. Pristup relativne učestalosti : Relativna verovatnoća se zasniva na sakupljenim istorijskim ili eksperimentalnim podacima. Verovatnoća zasnovana na učestalosti se definiše kao :

P(X) = Broj puta koliko se događaj dogodio/Ukupan broj prilika da se desi događaj.

www.puskice.co.yu

www.puskice.net

Zapamtite da se relativna verovatnoća zasniva na idejama da će opstati ono što se desilo u prošlosti.

3. Subjektivni pristup : Subjektivna verovatnoća se zasniva na ličnoj proceni i iskustvu. Na primer, doctor medicine ponekad primenjuje subjektivnu verovatnoću za produžetak očekivanog veka osobe koja je obolela od raka.

4. Utvrđivanje : je praksa dodeljivanja vrednosti preuzete iz ranijeg iskustva i prilagođavanja vrednosti trenutnim očekivanjima ili okolnostima.

5. Delfi tehnika : Sastoji se iz niza upitnika. Svaki niz je jedan krug. Odgovori iz prvog kruga se sakupljaju i postaju osnova za pitanja iz drugog kruga. Proces se obično ponavlja unapred određen broj puta dok odgovori ne budu takvi da se uoči šablon. Ovaj process omogućava određivanje ekspertskog mišljenja za sve članove grupe i eliminiše efekat mišljenja većine.

Opšti zakoni verovatnoće

1. Opšti zakon dodavanja : Kada se dva događaja dešavaju u isto vreme, a nisu međusobno isključivi, onda :

P(X ili Y) = P(X) + P(Y) – P(X i Y)

Primetićete da jednakost sadrži osobite slučajeve : Slučaj (X i Y) koji je presek seta slučajeva X i Y, i drugi slučaj (X ili Y) koji je skup setova X i Y. Iako je ovo veoma jednostavno, govori nam vrlo malo o tome kako slučaj X utiče na slučaj Y i obrnuto. Ukoliko je P (X i Y) jednako nuli, ukazujući na to se slučajevi X i Y ne ukrštaju (uzajamno su isključivi), onda imamo P(X ili Y) = P(X) + P(Y). S druge strane, ukoliko P (X i Y) nije jednako nuli, onda postoji interakcija između dva slučaja X i Y. Obično to može biti fizička interakcija. To čini odnos P(X ili Y) = P(X) + P(Y) – P(X i Y) nelinearnim, jer je P(X i Y) uslov od koga zavisi rezultat.

2. Specijalni zakon dodavanja : Kada se dva ili više događaja odvijaju u isto vreme, a međusobno su isključivi, onda :

P(X ili Y) = P(X) + P(Y)

3. Opšti zakon množenja : Kada se dva ili više događaja odvijaju u isto vreme, a međusobno su zavisni, onda se koristi opšte pravilo množenja za pronalaženje zajedničke verovatnoće:

P(X i Y) = P(X). P(YIX),

Gde je P(XIY) uslovna verovatnoća.

4. Specijalni zakon množenja : Kada se dva ili više događaja odvijaju u isto vreme, a nezavisni su, onda se koristi specijalan zakon množenja za pronalaženje zajedničke verovatnoće:

P(X i Y) = P(X) . P(Y)

www.puskice.co.yu

www.puskice.net

5. Zakon uslovne verovatnoće : Uslovna verovatnoća se označava sa p(XIY). Taj izraz se čita kao : verovatnoća da će se X dogoditi ako se zna da se Y već dogodio.

Uslovne verovatnoće se zasnivaju na poznavanju jedne od promenljivih. Uslovna verovatnoća događaja, kao što je X, koji se odvija ako se zna da se drugi događaj, Y, već dogodio, se izražava kao :

P(XIY) = P(X i Y) P(Y)

Podrazumeva se da je poznato da P(Y) nije jednako nuli. Upamtite da kada koristite uslovni zakon verovatnoće, uvek delite ukupnu verovatnoću sa verovatnoćom događaja nakon date reči. Da biste dobili P)X sa datim Y) delite ukupnu verovatnoću X i Y bezuslovnom verovatnoćom Y. Drugim rečima, gornja jednakost se koristi za pronalaženje uslovne verovatnoće za bilo koja dva zavisna događaja.

Poseban slučaj Bajesove teoreme je :

P(XIY) = P(YIX).P(X)P(Y)

Ukoliko su dva događaja, kao što su X i Y, nezavisni, onda :

P(XIY) = P(X)

i

P(YIX) = P(Y)

Uzajamno isključivi protiv nezavisnih događaja

Uzajamno isključivi UI : Događaji A i B su uzajamno isključivi ukoliko oba ne mogu da se dogode istovremeno. To jest PŠA i BĆ = 0.

Nezavisnost : Događaji A i B su nezavisni ukoliko informacija da se B već dogodio ne menja verovatnoću da će se A dogoditi. To jest PŠA dato je da se B već dogodioĆ = P ŠAĆ.

Ukoliko se dva događaja uzajamno isključuju, oni su takođe nezavisni : P(uz dato B) = PŠA i BĆ/ PŠBĆ a pošto je P (A i B) = 0 (prema uzajamno isključivim) onda je P(A uz dato B) = 0. Slično tome

Ukoliko su dva događaja zavisna onda takođe nisu uzajamno isključivi.

Ukoliko su dva događaja zavisna, onda su možda ili možda nisu uzajamno isključivi.

Ukoliko dva događaja nisu uzajamno isključiva, onda mogu a i ne moraju biti nezavisna.

www.puskice.co.yu

www.puskice.net

Sledeća figura sadrži sve mogućnosti. Oznake upotrebljene u ovoj tabeli su sledeće : X znači ne ukazuje, znak pitanja ? značI može a i ne mora da ukazuje, dok znak za čekiranje znači da ukazuje.

Bernstajn je prvi koji je otkrio da da su nezavisnost i uzajamna nezavisnost za kolekciju događaja A1…..An različite oznake.

Tipovi podataka i nivoi merenja

Informacije u statistici mogu biti sakupljene korišćenjem kvalitativnih ili kvantitativnih podataka.

Kvalitativni podaci, kao što su boja očiju grupe ili pojedinaca, nisu izračunljivi po aritmetičkim odnosima. Oni su oznake koje obaveštavaju o tome kojoj kategoriji ili klasi pripada pojedinac ili predmet. Zovu se kategoričke promenljive.

Kvantitativni setovi podataka se sastoje iz mera koje zahtevaju numeričke vrednosti za koje su značajni opisi kao što su standardne devijacije. Mogu biti poređani i podeljeni u dve grupe : diskretni podaci i kontinualni podaci. Diskretni podaci su podaci koji se mogu izračunavati, na primer, broj predmeta sa kvarom, proizvedenih u dnevnoj proizvodnji. Kontinualni podaci, kada su parametric merljivi, se izražavaju kontinualnom skalom. Na primer, merenje visine neke osobe.

Prva aktivnost u statistici je merenje ili brojanje. Teorija merenja ili prebrojavanja se bavi vezom između podataka i realnosti. Set podataka je reprezentacija stvarnosti bazirana na numeričkim i merljivim skalama. Podaci se nazivaju primarnim tipom podataka ukoliko je analitičar bio uključn u sakupljanje podataka, bitnih za njegovu istragu. Inače, se nazivaju podacima sekundarnog tipa.

Podaci se dobijaju u nominalni, ordinalnim, intervalnim i srazmernim formama (francuska reč NOIR znači crna boja). Podaci mogu biti kontinualni ili diskretni.

Nula i jedinica merenja su proizvoljne u intervalnoj skali. Dok je jedinica merenja proizvoljna u intervalnoj skali, njena tačka nule je prirodni atribut (dodatak). Kategorička promenljiva se meri na ordinalnoj ili nominalnoj skali.

Teorija merenja se bavi vezom između podataka i realnosti. I statistička i teorija merenja su neophodne za izvođenje zaključaka o realnosti.

Pošto statističari žive za preciznošću, oni preferiraju Intervalne/srazmerne nivoe merenja.

Histogrami : Proveravanje homogenosti populacije

Histogram je grafička prezentacija procene za učestalost distribucije populacije.

Skala je najčešća vrednost u setu opazanja. Podaci mogu imati dve skale. U ovom slučaju, kažemo da su podaci dvoskalni (bimodalni) a set opazanja sa više od dva modela zove se

www.puskice.co.yu

www.puskice.net

multimodalni. Uvek kad postoji više od jedne skale, onda je populacija iz koje je uzet uzorak mešavina više od jedne populacije. Gotovo sve standardne statističke analize su uslovljene pretpostavkom da je populacija homogena, što znači da je gustina jednomodalna. Da bismo proverili da li su podaci uzorka jednomodalni, možemo upotrebiti histograme.

Broj klasnih intervala u histogramu : Pre nego što konstruišemo distribuciju naše učestalosti moramo odrediti koliko ćemo klasa koristiti. To je proizvoljno, ali veliki broj klasa ne daje onoliko jasnu sliku koliko je dodata sa nekim blizu optamilnim brojem. Empirička veza, poznata kao Sterdžovo pravilo, može se iskoristiti kao koristan vodič za određivanje optimalnog broja klasa (k) ako su dati

K = najmanji celi broj većI ili jednak 1+3.332 Log (n)

Gde je k broj klasa, Log je u osnovi 10, n je ukupan broj brojčanih vrednosti koje čine set podataka.

Stoga širina klase je

(najveća vrednost – najniža vrednost) / (1+3,332 Logn)

gde je n ukupan broj delova seta podataka.

Da biste imali najbolje, trebaju Vam neke mere kvaliteta – u ovom slučaju verovatno najbolji način da prikažete sve informacije koje su dostupne u podacima. Tome doprinosi veličina uzorka; pa je uobičajena preporuka da se koristi od 5 do 15 klasa, sa većim brojem klasa, imate veći uzorak. Trebalo bi da imate u vidu pretpostavku za veće širine klasa, preporučljivo je višestrukih 5 ili 10, jer to olakšava razumevanje.

Izvan toga, postaje stvar procene. Isprobajte niz širina klasa, i odaberite onu koja najbolje radi. To pretpostavlja da imate računar i da možete generisati histograme prilično lako.

Često ima nekih marketingških stvari koje dolaze u obzir. Na primer, Ukoliko se VašI podaci porede sa sličnim, kao što su ranija istraživanja, ili istraživanja iz drugih zemalja, ograničeni ste na intervale koji su tamo upotrebljeni.

Ukoliko je histogram dobro osmišljen, onda treba imati u vidu nejednake klase. Koristite uske klase tamo gde su frkvence klase visoke, a široke klase, tamo gde su frekvencije klase niske.

Uobičajeni su sledeći pristupi :

Neka je n veličina uzorka, onda bi broj intervala klasa mogao biti :

MIN š n, 10 Log (n)ć.

Log je logaritam u osnovi 10. Za 200 obzervacija koristili biste 14 intervala a za 2000 33.

www.puskice.co.yu

www.puskice.net

Alternativa je :

1. Pronalaženje ranga (najviša vrednost – najniža vrednost) 2. Deljenje ranga razumnom veličinom intervala 2,3,5,10 ili višestrukih 10. 3. Ciljanje ka ne manje od 5 i ne više od 15 intervala.

Jedna od glavnih primena histograma je testiranje homogenosti populacije. Unimodalnost histograma je potreban uslov homogenosti populacije da bi statističke analize bile znažajne.

Kako napraviti nacrt okvira

Nacrt okvira je grafički prikaz koji ima mnogo karakteristika. Uključuje prisustvo mogućih odstupanja. Ilustruje rang podataka. Prikazuje merenje disperzije kao što je gornji kvartal, donji kvartal i interkvartalni rang seta podataka kao i srednje vrednosti kao mere centralne lokacije koja je korisna za upoređivanje setova podataka. Takođe daje indikacije simetrije distribucije. Osnovni razlog popularnosti nacrtnih okvira je to što kompaktno nude veliku količinu informacija.

Koraci u pravljenju nacrta okvira

1. Crtaju se horizontale linije u srednjem, gornjem i donjem kvartalu. Tim horizontalnim linijama se dodaju vertikalne linije za pravljenje okvira.

2. Vertikalne linije se crtaju od gornjeg kvartala do najudaljenije tačke podataka u okviru razdaljine od 1.5 ili gornjeg kvartala. Slično definisana vetikalna linija se crta iz donjeg kvartala.

3. Svaka tačka podataka izvan vertikalne linije je označena kao asterisk (*).

Uvod

Produženje našeg znanja od nasumičnog uzorka do populacije se naziva induktivnim zaključivanjem. Osnovna funkcija poslovne statistike je da obezbedi tehnike za donošenje induktivnih zaključaka i za merenje stepena nesigurnosti takvog zaključka. Nesigurnost se meri u uslovima izjava verovatnoće i iz tog razloga moramo naučiti jezik nesigrunosti i njegov alat merenja zvani verovatnoća.

Nasuprot induktivnom zaključivanju, matematika koristi deduktivno zaključivanje za dokazivanje teorema, dok se u empiričkoj nauci takvo induktivno zaključivanje koristi za pronalženje novih i proširenje postojećih znanja.

Verovatnoća, Šansa, Mogućnost i Izgledi

www.puskice.co.yu

www.puskice.net

Verovatnoća ima precizno tehničko značenje – zapravo, ima nekoliko i još uvek se vode polemike oko toga koji bi termin trebalo koristiti. Ipak, za većinu događaja za koje se verovatnoća lako izračunava, na primer, bacanje kocke, verovatnoća dobijanja četvorke (::), gotovo svi se slažu sa verovatnoćom 1/6 ukoliko nije filosofska interpretacija. Verovatnoća je uvek broj između 0 ( nije baš isto kao neverovatnoća; moguće je da ukoliko se novčIć baci bezbroj puta, nikada neće pokazati pismo, ali verovatnoća neprekidnog pokazivanja glave je 0) i 1 (opet, nije baš ista stvar kao sigurnost ali je blizu tome).

Reč šansa ili šanse se često koriste kao približan sinonim verovatnoće, ili zbog razlike ili Manjeg broja slogova. Bilo bi bolje da se šansa koristi u neformalnoj upotrebi a verovatnoća onda kada se na to misli.

U slučajevima kada se verovatnoća opazanja opisuje parametričkim modelom, mogućnost vrednosti parametra uz date podatke se definiše kao verovatnoĆa podataka uz date parametre. Ljudi povremeno vide reči moguće, ili mogućnost; ipak ti termini se koriste kao sinonimi za verovatno i verovatnoću.

Izgledi predstavljaju koncept verovatnoće povezan sa verovatnoćom. To je srazmer verovatnoće (p) događaja sa verovatnoćom (1-p) da se neće desiti p/(1-p). Često se izražava kao srazmewr, često celih brojeva; na primer, izgledi 1 od 5 za primer smrti dat gore, ali iz tehničkih razloga deljenje može biti izvršeno da dovede do pozitivnog realnog broja (ovde 0.2). Logaritam srazmera izgleda je korisan u tehničke svrhe, jer ptikazuje rang mogućnosti realnih brojeva na način po kome se čuva simetrija između verovatnoće da će se nešto desiti i verovatnoća da neće.

Izgledi su srazmera događanja i nedogađanja. Ukoliko je stopa smrtnosti bolesti 0.1 (10 %) stopa ne umiranja je 0.9 pa su stoga izgledi 9:1. Upamtite da to nije isti izraz kao i inverzija procenta događaja.

Drugi način poređenja verovatnoća i izgleda je korišćenje razmišljanja deo-celina sa binarnom podelom u grupi. Verovatnoća je često srazmera delova i celine na primer, srazmera dela (onih koji su preživeli 5 godina nakon što im je uspostavljena dijagnoza bolesti)i celine (onih kojima je dijagnostikovana bolest). Izgledi su često srazmera dela i dela; na primer, izgledi za umiranje su srzamera dela koji je uspeo (oni koji su preživeli 5 godina nakon uspostavljanja dijagnoze) i dela koji nije uspeo (oni koji nisu preživeli 5 godina nakon uspostavljanja dijagnoze).

Očigledno je da su verovatnoća i izgledi intimno povezani: Izgledi = p/(1-p). Upamtite da je verovatnoća uvek između 0 i 1, dok je rang izgleda od 0 do beskonačnosti.

Osim njihove upotrebe u klađenju, izgledi pomažu u određivanju male verovatnoće (blizu 0) ili velike verovatnoće (blizu 1) korišćenjem velikih celih brojeva (1 000 prema 1 ili million prema 1). Izgledi veličaju male verovatnoĆe (ili velike verovatnoće) zato da bi predstavili relativne razlike. Razmotrite dve verovatnoĆe 0.01 i 0.005. Obe su veoma male. Nepodučeni posmatrač možda neće shvatiti da je jedno dvaput veće od drugog. Ali ako se izrazi kao izgled 99 prema 1 u odnosu na 199 prema 1, možda će biti lakše uporediti dve situacije fokusiranjem na velike cele brojeve (199 i 99) pre nego na manje delove ili srazmere.

Šta su slobodni stepeni

www.puskice.co.yu

www.puskice.net

Setite se da smo u proceni variranja populacije, koristili (n-1) pre nego n u imenovanju. Faktor n- 1 se naziva slobodnim stepenima.

Procena variranja populacije : Varijacija u populaciji se definiše kao prosek kvadratnih odstupanja iz dsrednjeg broja populacije. Ukoliko izvedemo nasumični uzorak n slučajeva iz populacije gde je srednja vrednost poznata, možemo proceniti variranje populacije putem intuicije. Sabiramo devijacije srednjeg broja populacije i delimo taj zbir sa n. Ova procena se bazira na nezavisnim delovima informacija i dobijamo n slobodnih stepeni. Svako od n posmtranja, uključujući i poslednje, nije ograničeno (slobodno je da varira).

Kada ne znamo srednji broj populacije, ipak možemo proceniti variranje populacije, ali sada računamo devijacije oko srednjeg broja uzorka. To uvodi značajno ograničenje jer se zna da je zbir devijacijaa oko srednjeg broja uzorka jednak nuli. Ukoliko znamo vrednost prvih odstupanje (n-1), onda je poznata i poslednja. Ima samo n-1 nezavisnih delova informacija u ovoj proceni variranja.

Ukoliko proučavate sistem sa n parametrima x1,i = , 1 ….n možete ga predstaviti u prostoru n dimenzije. Svaka tačka u ovom prostoru će predstavljati potencijalno stanje Vašeg sistema. Ukoliko Vaši parametri mogu varirati nezavisno, onda će Vaš sistem biti u potpunosti opisan u hiper obimu n dimenzije. Sada, zamislite da imate jedno ograničenje između parametara (jednačina se oslanja na Vaše n parametre), onda će Vaš sistem biti opisan hiper površinom n-1 dimenzije. Na primer, u trodimenzionalnom prostoru, linearna veza označava avion u dve dimenzije.

U statistici, Vaši n parametric su Vaši n podaci. Da biste procenili variranje, morate najpre da odredite srednji broj E(X). Kada procenite variranje imate jedno ograničenje u Vašem sistemu (to je izraz srednjeg broja) i ostaje samo n-1 slobodnih stepeni za Vaš sistem.

Stoga, delimo zbir kvadratnih devijacija sa n-1, a ne sa n, kada imamo podatke uzorka. U proseku, devijacije oko srednjeg broja uzorka su manje od devijacija oko srednjeg broja populacije. To je zato što je naš srednji broj uzorka uvek u sredini bodova uzoraka; zapravo, minimum mogućeg zbira kvadratnih devijacija za bilo koji uzorak brojeva je oko srednjeg broja za taj uzorak brojeva. Ukoliko saberemo kvadratne devijacije iz srednjeg broja uzorka i podelimo ga sa n, imamo potcenjenu varijaciju u populaciji (koja je bazirana na devijacijama oko srednjeg broja populacije). Ukoliko zbir kvadrata devijacija podelimo sa n-1 umesto sa n, naša procena će biti nešto veća, i može se pokazati da nam ovo prilagođavanje daje nepristrasnu procenu variranja populacije. Ipak, za veliko n, recimo preko 30, činjenica da li ćemo deliti sa n ili sa n-1, ne pravi neku razliku.

Slobodni stepeni u ANOVA-I : Videćete slobodne stepene ključnih analiza u tabelama analiza varijacija (ANOVA). Ukoliko Vam kažem za 4 broja, ali ne kažem koja, prosek bi mogao biti bilo koji. U setu podataka imam 4 slobodna stepena. Ukoliko Vam kažem 3 od ta 4 broja, i prosek, možete pogoditi četvrti. Set podataka, uz dati prosek, ima tri slobodna stepena. Ukoliko Vam kažem prosek i standardne devijacije (odstupanja) brojeva, dao sam Vam 2 informacije, i smanjio slobodne stepene sa 4 na 2. Treba samo da znate dva broja da biste pogodili druga dva.

www.puskice.co.yu

www.puskice.net

U tabeli analize varijacija slobodni stepen je delilac u SS/df koji če rezultirati nepristrasnom procenom variranja populacije.

Df=N-k, gde je N veličina uzorka, a k je mali broj, jednak broju ograničenja, broju delića informacija već iskorišćenih. Slobodni stepen je kvantitet koji se dodaje; ukupni iznosi tih stepena mogu biti podeljeni na razne komponente.

Na primer, pretpostavimo da imamo veličinu uzorka 13, i izračunamo srednji broj, a potom odstupanja od srednjeg broja, samo 12 odstupanja može da varira. Kada pronađemo 12 odstupanja trinaesto je određeno. Stoga, ukoliko neko procenjuje variranja uzorka k=1.

U situacijama bivarirajućih korelacija i regresija, k=2, izračunavanje srednjeg broja uzorka svake promenljive koristi dva dela informacija, ostavljajući N-2 nezavisna dela informacija.

U jednosmernim analizama variranja, sa g grupama, postoje tri načina korišćenja podataka za procenu variranja populacije. Ukoliko su izvučeni svi podaci, kovencionalno SST/(n-1) će obezbediti procenu variranja populacije.

Ukoliko se tretirane grupe razmatraju odvojeno, srednji brojevi uzoraka mogu se smatrati procenama srednjeg broja populacije, i SSb/(g-1) može biti iskorišćeno kao procena. Ostala variranja mogu biti procenjena iz SSw(n-g). Taj primer demonstrira deljenje df (slobodnih stepeni): df ukupni = n-1 = df(između) + df(u okviru) = (g-1)+(n-g).

Stoga, jednostavna radna definicija slobodnih stepeni je veličina uzorka minus broj procenjenih parametara. Potpuniji odgovorbi morao da objasni zašto postoje situacije u kojima slobodan stepen nije ceo broj. Nakon svega što je rečeno, najbolje objašnjenje je da slobodne stepene koristimo za dobijanje nepristrasne procene.

Ukratko, koncept stepeni slobode se koristi u dve svrhe :

 Parametri određenih distribucija, kao što je F, i t distribucija se nazivaju slobodnim stepenima. Stoga, slobodni stepeni mogu biti pozitivni ne celi brojevi.

 Slobodni stepeni se koriste za dobijanje nepristrasne procene parametara populacije.

Uklanjanje odstupanja

Zbog potencijalno velikih variranja, odstupanja mogu biti posledica uzoraka. Savršeno je ispravno imati takav pogled koji legitimno po definiciji pripada grupi istraživanja. Normalno distribuirani podaci će često prikazati takve vrednosti.

ovo je samo pregled
3 prikazano na 77 str.