Maturski, seminarski i diplomski radovi iz matematike.
Razlike izmedu aritmetičkih sredina, neki računi korelacije itd., mogu se primijeniti samo na kuantitatiune brojčane podatke, koji su ili normalno rasporedeni ili bar simetrično rasporedeni. Medutim, ako su podaci kualitatiuni ili ako im distribucija značajno odstupa od normalne, onda se velik broj do sada opisanih postupaka (osim računa proporcija, nekih koeficijenata korelacije ne mogu upotrijebiti, nego se veštinom upotrebljava postupak nazvan x2-test (čitaj: hi-kvadrat). Već u početku treba naglasiti da se hi-kvadrat test računa samo s frekvencijama, pa, prema tome, nije dopušteno u račun unositi nikakve mjerne jedinice! Osnovni podaci istraživanja dakako mogu biti i mjerene vrijednosti, ali u hi-kvadrat unose se samo njihove frekvencije.
2 Hi-kvadrat test
Najčesće korišćeni statistički test je tzv. Hi-kvadrat (c 2) test. Koristi se kad god je potrebno proveriti da li se empirijski dobijene frekvencije, značajno razlikuju od očekivanih. Ovde ćemo obraditi upotrebu testa za rešavanje problema zavisnosti dve varijable.
Hi-kvadrat test je vrlo praktičan test, koji može osobito poslužiti onda kad želimo utvrditi da li neke dobivene (opažene) frekvencije odstupaju od frekvencija koje bismo kekivali pod odredenom hipotezom. On je test0 utoliko slitan raEunu korelacije, što i kod hi-kvadrat testa katkada traiimo postoji li povezanost izmedu dvije varijable, ali i u tim slučajevima postoji bitna razlika izmedu računa korelacije i hi-kvadrat testa, jer nam račun korelacije pokazuje stupanj povezanosti izmedu dvije varijable, dok nam hi-kvadrat test pokazuje vjerojatnost povezanosti. 0 tome će još biti riječi na kraju ovog poglavlja. Gotovo se u svim slučajevima hi-kvadrat izračunava na jednak način (uz ograničenje da katkada treba unijeti neke dodatne korekcije, ili je pak praktičnije upotrijebiti neku drugu formulu koja skraćuje računanje), i to prema formuli:
pri čemu j,, znači opaiene frekvencije, a jt očekivane (teoretske) frekvencije, tj. frekvencije koje bismo očekivali pod nekom odredenom hipotezom.
Najčešće upotrebljavamo hi-kvadrat test u ovim slučajevima:
1. Kad imamo frekvencije jednog uzorka pa ielimo ustanoviti odstupaju li te frekvencije od frekvencija koje oCekujemo uz neku hipotezu.
2. Kad imamo frekvencije dvuju ili vise nezavisnih uzoraka te ielimo ustanoviti razlikliju li se uzorci u opaienini svojstvima.
3. Kad imamo frekvenciju dvaju zavisnih uzoraka, koji imaju dihotomna svojstva, te ielimo ustanoviti razlikuju li se uzorci u mjerenim svojstvima, tj. je li do310 do promjene.
2.1 Prvi primer
Ilustrovaćemo to primerom jedne studije vezane za ispitivanje zavisnosti religiozne i politicke opredeljenosti populacije. Podaci, dobijeni eksperimentalnim puttem dati su u sledecoj tabeli:
Ako bismo frekvencije zamenili procentima, uvideli bismo da je 58.3% Protestanata opredeljeno kao Republikanci, dok, na durgoj strani, svega 36.6% Katolika i 28.4% Jevreja ima isto misljenje o ovoj politickoj partiji. U ovakvoj situaciji, sasvim je normalno postaviti pitanje da li su ove razlike statisticki znacajne. Obzirom da postoje tri religiozne grupacije i tri vrste politickog opredeljenja, ne moze se upotrebiti jedan test razlike proporcija. U ovoj situaciji koristimo hi-kvadrat test, i mozemo postaviti isti tip nulte hipoteze kao do sada. Dakle, mozemo pretpostaviti da nema nikakve razlike u politickom opredeljenju izmedju ovih religijskih grupa. To jest, proporcije republikanaca, demokrata i neopredeljenih glasaca bi u sve tri religijske grupe trebale da budu iste. Pod pretpostavkom da je nulta hipoteza tacna, mozemo lako odrediti ocekivane frekvencije za ukupni broj pripadnika svake od religijskih grupa. To prakticno znaci da bismo mogli, na osnovu ukupnog broja Protestanata, odrediti koliko bi medju njima trebalo da bude Republikanaca i da taj broj uporedimo sa empirijski dobijenim rezultatom. Ako su razlike izmedju ovih brojeva velike, postoji osnovana sumnja u istinitost hipoteze H0.
Zbog toga nam je potrebna neka mera za razlike izmedju ocekivanih i dobijenih frekvencija. Ovakvih mera moze biti jako puno, ali nama je potrebna mera cija je raspodela poznata i tabelirana. Danas nije tabeliranje neophodan uslov, jer je, modernim racunarima moguce bilo koju raspodelu tabelirati vrlo brzo. Iz tih razloga koristimo meru poznatu pod nazivom "hi-kvadrat", definisanu sa:
SADRŽAJ
1 Uvod 3
2 Hi-kvadrat test 3
2.1 Prvi primer 4
2.2 Drugi Primer: 7
3 Zaključak 11
4 Literatura 12