Pastaba itin priekabiems matematikams.
Terminų žodynas parengtas pagal V.Čekanavičiaus ir G.Murausko
vadovėlį Statistika ir jos taikymai I. Jis orientuotas į nematematikus. Todėl neieškokite čia — algebrų, Borelio aibių, funkcijų matumo bei tikimybinių erdvių sandaugų.
DUOMENYS
Populiacija — objektų, kurių savybės tiriamos, aibė.
Imtis — tai populiacijos dalis, kuri naudojama statistiniame tyrime.
Imties didumas — elementų skaičius imtyje.
Imtis reprezentatyvi, jei ji teisingai atspindi tiriamo kintamojo galimų reikšmių proporcijas populiacijoje.
Imties koeficientas .
Čia — imties didumas, — populiacijos didumas.
Imties koeficientas apibrėžiamas tik baigtinėms populiacijoms.
Kvotinė imtis: atsižvelgus į populiacijos sandarą, iš anksto numatomos imties elementų kvotos. Pavyzdžiui, numatoma, kad imtį sudarys 80 lietuvių, 10 rusų, 7 lenkai ir 3 baltarusiai.
Proginė imtis: Į imtį įtraukiami pirmi pasitaikę populiacijos elementai.
Sisteminė imtis: Jos sudarymo principas yra toks: 1) atsižvelgus į populiacijos dydį ir numatomą pačios imties dydį, parenkamas išrinkimo žingsnis, 2) visi elementai išrikiuojami į eilę, 3) iš kelių pirmųjų elementų atsitiktiniu būdu parenkamas pirmas imties elementas,4) pasirinktu žingsniu parenkami visi likę elementai.
Sluoksninė imtis: Visa populiacija suskirstoma į sluoksnius ( stratus). Kiekviename sluoksnyje naudojamas paprastosios atsitiktinės grąžintinės imties sudarymo būdas.
Lizdinė imtis: Visa populiacija suskirstoma į panašias pagal tam tikrą požymį grupes — lizdus ( klasterius). Iš visų lizdų aibės paprastosios atsitiktinės imties būdu parenkama dalis. Į imtį pakliūna visi atrinktųjų lizdų elementai.
Paprastoji atsitiktinė grąžintinė imtis: kiekvienu imties sudarymo momentu visiems populiacijos elementams patekti į imtį galimybės yra vienodos.
Klasikinė vienodas galimybes teikianti situacija yra tokia:
1) visi populiacijos elementai sunumeruojami, 2) elementų numeriai užrašomi ant rutulių, 3) rutuliai sudedami į dėžę ir gerai sumaišomi, 4) ištraukiamas pirmas pasitaikęs rutulys, 5) elementas, atitinkantis ant rutulio užrašytąjį numerį, įtraukiamas į imtį.
Atsakymo lygis atsakiusių į klausimą skaičius visų parinktų respondentų skaičius.
Kintamasis, gautas matuojant turimos savybės kiekį (skaičiuojamąjį dydį), vadinamas kiekybiniu kintamuoju.
Kintamasis, nusakantis savybės buvimą ar nebuvimą, priklausymą vienai iš galimų kategorijų, vadinamas kokybiniu kintamuoju.
Kiekybinis kintamasis vadinamas tolydžiuoju, jei skirtumas tarp kintamojo reikšmių gali būti kiek norima mažas. Jei kiekybinio kintamojo reikšmės gali skirtis ne mažiau kaip tam tikru minimaliu pokyčiu, tai kintamasis vadinamas diskrečiuoju kintamuoju.
Kintamųjų matavimo skalės:
1) Pavadinimų skalė.
2) Rangų skalė.
3) Intervalų skalė.
4) Santykių skalė.
Pavadinimų skalė.
Pavadinimų skalė dar vadinama nominaliąja, arba klasifikacine skale. Pagal kintamojo reikšmes, gautas naudojant pavadinimų skalę objektus galima tik klasifikuoti, t.y. priskirti vienai ar kitai grupei. Šioje skalėje aritmetinės operacijos neturi prasmės. Kintamieji, kurie matuojami pavadinimų skalėje, vadinami kategoriniais kintamaisiais.
Pavyzdžiai: pašto indeksas, lytis, tautybė.
Rangų skalė.
Rangų skalė dar vadinama tvarkos skale. Ši skalė naudojama tada, kai statistikas gali nustatyti objektų tiriamo požymio, savybės skirtumus ir pagal tai juos išrikiuoti į eilę. Kintamieji, kurie matuojami rangų skalėje, vadinami ranginiais kintamaisiais. Pagal ranginių kintamųjų reikšmes objektus galima ne tik skirstyti į klases, bet ir jas sutvarkyti.
Ranginių kintamųjų pavyzdžiai:
varžybose užimtoji vieta, mokslo vardai, mokymosi lygis.
Intervalų skalė.
Matavimams naudojant šią skalę, objektus galima ne tik klasifikuoti, tvarkyti, bet ir kiekybiškai įvertinti skirtumus tarp klasių. Intervaliniai duomenys visada skaitiniai. Skirtumas (intervalas) tarp dviejų kintamojo reikšmių rodo, kiek daugiau ar mažiau matuojamojo reiškinio yra viename elemente, palyginti su kitu elementu. Nulinis taškas intervalų skalėje yra laisvai parenkamas ir nereiškia tiriamos savybės nebuvimo. Intervalų skalėje dviejų intervalų santykis nepriklauso nei nuo matavimo vienetų, nei nuo nulinio taško.
Intervalinių kintamųjų pavyzdžiai: temperatūros matavimai, kalendorinis laikas, metų skaičiavimas — nuo Romos įkūrimo, nuo Kristaus gimimo. Intervalinius duomenis galime sudėti, atimti adauginti (padalinti) iš skaičiaus (taigi ir vidurkinti).
Santykių skalė.
Ši skalė skiriasi nuo intervalų skalės tik tuo, kad joje yra apibrėžta absoliuti atskaitos pradžia, t.y. nulinis taškas, reiškiantis tiriamosios savybės nebuvimą. Santykių skalės kintamieji: ūgis,
svoris, amžius, atlyginimas, kaina, laikas.
APRAŠOMOJI STATISTIKA
Aprašomoji statistika, tai duomenų sisteminimo ir grafinio vaizdavimo metodai. Aprašomoji statistika leidžia koncentruotai užrašyti informaciją, esančią dideliuose duomenų masyvuose. Todėl ji gali būti naudojama ir visos populiacijos duomenims apdoroti.
Išdėstyta nemažėjimo tvarka kiekybinio kintamojo duomenų eilutė vadinama variacine eilute.
Taigi , . Kintamojo reikšmės dažnis — tai skaičius, nusakantis, kiek kartų reikšmė pasikartojo duomenyse. (). Kintamojo reikšmės santykinis dažnis — tai skaičius, nusakantis, kurią statistinės eilutės dalį sudaro ().
Dažnių (empirinė) pasiskirstymo funkcija:
Garantijų funkcija:
Dažnių daugiakampis gaunamas Dekarto koordinatėse atidėtas dažnių reikšmes sujungus atkarpomis. Daugiakampis braižomas ir santykiniams dažniams.
Grupuotiems duomenims dažniausiai braižoma histograma, t.y. empirinės grupuotų duomenų tankio funkcijos grafikas. Histograma braižoma taip:
1) ‘sų ašyje atidedami grupavimo intervalai,
2) kiekviename intervale braižomas stačiakampis, kurio aukštinė proporcinga pakliuvusių į intervalą reikšmių skaičiui ().
Reikalaujama, kad visų stačiakampių plotų suma būtų lygi 1. Ordinačių (‘kų) ašies mastelis dažniausiai skiriasi nuo ‘sų ašies mastelio (kitu atveju būtų sunkoka ką nors įžiūrėti).
Pagrindinės duomenų padėties charakteristikos yra vidurkis, moda ir mediana, apibūdinantys duomenų „centrą“, bei kvantiliai.
Visos charakteristikos, išskyrus modą, skaičiuojamos tik kiekybiniams duomenims.
Imties vidurkis (empirinis vidurkis) yra visų kintamojo matavimų suma padalinta iš jų skaičiaus. . Grupuotiems duomenims vidurkio skaičiavimui naudojami intervalų viduriniai taškai.
Moda — dažniausiai duomenų aibėje pasikartojusi reikšmė. Pavyzdžiui, duomenų aibės 1; 1; 2; 3; 4; 5 moda . Jeigu visos reikšmės statistinėje eilutėje pasikartoja vienodai dažnai, sakoma, kad pasiskirstymas neturi modos. Pavyzdžiui, duomenų aibė 2,3; 2,3; 3,8; 3,8; 4,5;4,5 modos neturi. Jeigu kelios gretimos variacinės eilutės reikšmės pasirodo vienodu dažniu ir šis dažnis yra didesnis, negu bet kuris kitas dažnis, tai moda yra šių reikšmių vidurkis. Pavyzdžiui duomenų aibės 0; 1; 1; 2; 2; 2; 3; 3; 3; 4 moda . Gali būti kelios modos. Modą galima skaičiuoti tiek kiekybiniams tiek ir kokybiniams duomenims. Grupuotiems duomenims moda yra intervalo, į kurį pateko daugiausia duomenų, vidurinė reikšmė.
Mediana yra skaičius, už kurį 50% variacinės eilutės reikšmių yra nedidesnės ir 50% nemažesnės. Tikslesnis medianos apibrėžimas skamba taip: jeigu nelyginis, tai mediana yra variacinės eilutės reikšmė, atitinkanti poziciją. Jeigu stebėjimų skaičius lyginis, tai mediana yra variacinės eilutės reikšmių, atitinkančių pozicijas ir , aritmetinis vidurkis. Mediana dažniausiai naudojama ranginiams duomenims ir intervaliniams — santykiniams duomenims, kuriuose yra išskirčių.
Kvartiliai
dalija variacinę eilutę į keturias „maždaug“ lygias dalis. Vienas iš kvartilių radimo metodų skamba taip: sutampa su mediana ir dalija imtį į dvi dalis. Tuomet yra apatinės dalies mediana, o yra viršutinės dalies mediana.
Triskaitis vidurkis skaičiuojamas pagal tokią formulę:
Pagrindinės sklaidos charakteristikos yra duomenų aibės plotis, vidutinis nuokrypis, dispersija, standartinis nuokrypis, kvartilių skirtumas ir kitimo koeficientas. Šios charakteristikos skaičiuojamos kiekybiniams duomenims.
Imties dispersija: Iš apibrėžimo akivaizdu, kad dispersija visuomet neneigiama. Be to, dispersija lygi nuliui tuo ir tik tuo atveju, kai visi stebėjimai lygūs. Skaičiuojant dispersiją grupuotiems duomenims, taikoma tokia formulė:
kur – grupavimo intervalo ilgis, – j-ojo grupavimo intervalo dažnis, – j-ojo grupavimo intervalo vidurio taškas.
Imties standartinis nuokrypis gaunamas, ištraukus kvadratinę šaknį iš dispersijos: Standartinis nuokrypis matuojamas tais pačiais vienetais, kaip ir patys duomenys.
Kitimo koeficientas: .
Procentinis kitimo koeficientas: . Čia — imties standartinis nuokrypis. Kitimo koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius: . Kitimo koeficientas — bedimensinis dydis. Jis naudojamas, lyginant skirtingų duomenų aibių sklaidas.
Duomenų aibės plotis .
Kvartilių skirtumas IQR.
Vidutinis nuokrypis:
Kokybinės įvairovės indeksas . Čia – kategorijų skaičius, – stebėjimų skaičius, – stebėjimų skaičius – oje kategorijoje ( – osios kategorijos dažnis). Kokybinės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida). Dažniausiai jis taikomas kokybinių duomenų sklaidai įvertinti.
Dažnių skirstinio formos charakteristikos}– tai histogramos (dažnių daugiakampio) formos charakteristikos. Jos yra dvi — ekscesas ir asimetrijos koeficientas.
Asimetrijos koeficientas: . Čia yra standartinis nuokrypis, o yra centrinis empirinis 3-os eilės momentas: . Asimetrijos koeficientas — histogramos simetrijos matas. Jeigu , tai histograma turi teigiamą (dešiniąją) asimetriją, jeigu — neigiamą (kairiąją) asimetriją. Histograma simetriška, kai .
Eksceso koeficientas: . Čia yra standartinis nuokrypis, o yra centrinis empirinis 4-os eilės momentas: . Eksceso koeficientas — histogramos lėkštumo matas. Jeigu — dažnių skirstinio grafiko viršūnė yra aukštesnė, o uodegos plonesnės nei normaliosios kreivės. Jeigu — dažnių skirstinio grafiko viršūnė yra žemesne, o uodegos storesnės nei normaliosios kreivės. Jeigu , tai dažnių skirstinio koncentracija koncentracija apie vidurkį tokia pati, kaip ir normaliosios kreivės.
Normalioji kreivė: funkcijos grafikas. Funkcijos grafikas yra varpo formos ir visas juo apribotas plotas lygus vienetui. Jis yra simetriškas atžvilgiu. Nors pati funkcija apibrėžta su visais , bet toli nuo vidurkio funkcijos reikšmės labai mažos. Intervale plotas, apribotas grafiku, priklauso, nuo , bet nepriklauso nuo ir . Į kairę ir dešinę nuo vidurkio atidėjus du standartinius nuokrypius, gautu intervalu ir normaliąja kreive apribotas plotas lygus 0,9544…
Empirinė taisyklė:
Jeigu duomenų histograma yra varpo formos, tai:
1) apytiksliai 68% visų duomenų patenka į intervalą
2) apytiksliai 95% visų duomenų patenka į intervalą
3) beveik visi duomenys patenka į intervalą
Standartizuotoji z-reikšmė: . Čia — empirinis vidurkis, — standartinis nuokrypis.
Sąlygine išskirtimi vadinamas duomuo, priklausantis intervalui arba intervalui .
Išskirtimi vadinamas duomuo, mažesnis už arba didesnis už .
Čebyšovo taisyklė: Nemažiau kaip dalis visų stebėjimų patenka į intervalą . Čia imties vidurkis, o imties standartinis nuokrypis. Atkreipiame dėmesį, kad nebūtinai sveikas skaičius. Iš Čebyšovo taisyklės išplaukia, kad nemažiau kaip 75% visų stebėjimų paklius į intervalą , o nemažiau kaip 88% visų stebėjimų paklius į intervalą .
Stačiakampė diagrama grafinis suvestinės (min, , Md, , max) vaizdas. Stačiakampėje diagramoje yra „dėžė“ – stačiakampis, brėžiamas nuo pirmojo kvartilio iki trečiojo kvartilio , padalytas brūkšniu į dvi dalis ties mediana Md. (Kartais dar ‘su pažymimas vidurkio taškas). Nuo stačiakampio šono brėžiami „ūsai“, besitęsiantys iki paskutinės neišsiskiriančios duomenų aibės reikšmės ir didžiausios neišsiskiriančios duomenų aibės reikšmės. Išskirčių (sąlyginių išskirčių) reikšmės pažymimos specialiais simboliais.
TIKIMYBIŲ TEORIJOS ELEMENTAI
Tikimybiniu eksperimentu vadinsime tokį eksperimentą, kurio metu gali būti keletas atsitiktinių baigčių. Atliekant tikimybinį eksperimentą, negalima iš anksto pasakyti, kuri iš galimų baigčių įvyks. Atsitiktinės eksperimento baigtys vadinamos atsitiktiniais įvykiais. Jeigu įvykiai smulkiau neskaidytini, tai jie vadinami elementariaisiais. Pvz. metamas kauliukas (tikimybinis eksperimentas), iškrito lyginis taškų skaičius — atsitiktinis įvykis, iškrito 1 taškas, 2 taškai, … — elementarieji įvykiai.
Visų elementariųjų įvykių aibė vadinama elementariųjų įvykių erdve. Elementarieji įvykiai žymimi simboliais , ,…, , o elementariųjų įvykių erdvė simboliu . Aišku, kad .
Būtinasis įvykis — įvykis, kuris įvyksta, įvykus bet kuriai eksperimento baigčiai.
Negalimas įvykis , t.y. įvykis, kuris, atliekant eksperimentą, įvykti negali. Pavyzdžiui, metant kauliuką, įvykis „iškrito nelyginis akučių skaičius, didesnis už 5“ yra negalimas.
Įvykis yra įvykio dalis , jeigu įvykus įvykiui , įvyksta ir įvykis . Tarkime, kad metamas kauliukas, tuomet įvykis yra įvykio iškris nelyginis taškų skaičius dalis. Kiekvienas įvykis yra būtinojo įvykio dalis, t.y. . Bendruoju tikimybių teorijos atveju (kai turi daug sudėtingesnę struktūrą, nei baigtinė elementariųjų įvykių aibė) ne kiekvienas aibės poaibis laikomas įvykiu.
Du įvykius vadiname lygiais , jeigu yra dalis, o yra dalis. Elementariųjų įvykių erdvėje , jeigu juos sudarančios elementariųjų įvykių aibės sutampa. Pavyzdžiui, metant kauliuką, įvykiai ir iškris lyginis taškų skaičius yra lygūs.
Įvykių ir sąjunga vadinsime įvykį, kai įvyksta bent vienas iš įvykių ir . Elementariųjų įvykių erdvėje žymi įvykį, sudarytą iš elementariųjų įvykių, priklausančių bent vienam iš įvykių ir . Šnekamojoje kalboje įvykių sąjungą atitinka teiginys: įvyks arba .
Įvykių ir sankirta vadinsime įvykį, kai kartu įvyksta abu įvykiai ir . Elementariųjų įvykių erdvėje įvykių yra įvykis, sudarytas iš visų bendrųjų elementariųjų įvykių. Šnekamojoje kalboje įvykių sankirtą atitinka teiginys: įvyks ir .
Įvykiai ir vadinami nesutaikomais , jeigu jie negali įvykti kartu. Metant kauliuką, ir yra nesutaikomi. Bet koks įvykis ir negalimas įvykis yra nesutaikomi.
Dviejų įvykių ir skirtumu vadinamas įvykis, kai įvyksta , o neįvyksta. Elementariųjų įvykių erdvėje žymi įvykį, sudarytą iš tų elementų, kurie nepriklauso . Atkreipiame dėmesį, kad įvykiai ir vienas per kitą neišsireiškia.
Įvykis vadinamas priešingu įvykiui . Metant monetą, įvykis herbas yra priešingas įvykiui skaičius.
Daug kartų kartodami eksperimentą, stebime, kaip dažnai pasikartoja konkreti eksperimento baigtis. Jeigu šis dažnis, augant ekperimentų skaičiui, stabilizuojasi ties kažkokiu skaičiumi, tai pastarąjį skaičių ir laikome tiriamos baigties (įvykio) statistine tikimybe. Būtina, kad: a) visi eksperimentai vyktų visiškai vienodomis sąlygomis, b) vieno eksperimento rezultatai neturėtų įtakos kito eksperimento rezultatams (eksperimentai būtų nepriklausomi). Būdingi statistinės tikimybės taikymo pavyzdžiai: Vatikane gyventojų nevedę — tikimybė, kad atsitiktinai parinktas Vatikano gyventojas bus nevedęs 1; tam tikros rūšies operacijų sėkmingos — tikimybė, kad operacija bus sėkminga 0,65.
Klasikinis tikimybės apibrėžimas formuluojamas tik baigtinėms elementariųjų įvykių aibėms , kurios visi elementarieji įvykiai vienodai galimi. Įvykio tikimybe laikysime įvykį sudarančių elementariųjų įvykių skaičiaus santykį su visų elementariųjų įvykių skaičiumi. Klasikinis tikimybės apibrėžimas netinka, jeigu nėra baigtinis arba, jeigu elementarieji įvykiai nėra vienodai galimi.
Bendrasis tikimybės apibrėžimas skamba taip: Tikimybe vadiname funkciją , kuri kiekvienam atsitiktiniam įvykiui priskiria skaičių ir
1) ,
2) ,
3) , jeigu , .
Tikimybės savybės: 1) .
2) .
3) .
4) Jeigu , tai .
5) .
6) Bet kokiam įvykiui teisinga lygybė .
Tikimybė, kad įvyks su sąlyga, kad įvyko vadinama sąlygine tikimybe ir žymima . Jeigu nėra negalimas įvykis (), tai sąlyginę tikimybę galima apibrėžti per besąlygines tikimybes. . Tegul , — bet kokie atsitiktiniai įvykiai, o . Tuomet
1) .
2) Jeigu , tai .
Tikimybių daugybos teorema: .
Įvykiai ir vadinami priklausomais, jeigu . Evivalentus apibrėžimas: įvykiai ir priklausomi, jeigu . Įvykiai ir nepriklausomi, jeigu . Ekvivalentus apibrėžimas: įvykiai ir nepriklausomi, jeigu . Bet koks įvykis ir būtinasis įvykis arba negalimas įvykis yra nepriklausomi.
Pilnosios tikimybės formulė Tegul
1),
2) , .
Tuomet
Bajeso formulė: Tegul
1),
2) , .
Tuomet
Tikimybės , , … vadinamos apriorinėmis. Tikimybės , ,… vadinamos aposteriorinėmis tikimybėmis. Jos skiriasi nuo apriorinių tikimybių tuo, kad atsižvelgta į naują informaciją ( įvyko).
Bernulio eksperimentų schema nusakoma taip: vieną kartą atliekant eksperimentą, jo sėkmės tikimybė lygi . Atliekame nepriklausomų eksperimentų. Sėkmingų Bernulio eksperimentų skaičiaus tikimybė, t.y. tikimybė, kad Bernulio schemoje eksperimentas pavyks kartų yra lygi P(iš bandymų sėkmingų)=.
Atsitiktinis dydis — tai funkcija R. Taigi atsitiktinis dydis nusako taisyklę pagal kurią kiekvienam atsitiktiniam įvykiui priskiriama skaitinė reikšmė. Pvz.: metama moneta (tikimybinis eksperimentas) ir skaičiuojame iškritusius herbus (atsitiktinis dydis — herbų skaičius). Atsitiktinis dydis gali įgyti 2 reikšmes (0 arba 1). Skaitinė reikšmė 0 atitinka įvykį „iškrito herbas“, skaitinė reikšmė 1 atitinka įvykį „iškrito herbas“. Atsitiktinis dydis — tai tam tikras matematinis modelis, o vienas ir tas pats matematinis modelis gali tikti daugeliui situacijų (eksperimentų). Tolydžioji atsitiktinio dydžio funkcija irgi yra atsitiktinis dydis. Atsitiktinio dydžio skirstinys — tai atsitiktinio dydžio įgyjamos reikšmės su jų įgijimo tikimybėmis.
Atsitiktinio dydžio pasiskirstymo funkcija:
Jos savybės:
1) .
2), .
3) nemažėjanti, t.y. , kai .
4) tolydi iš dešinės.
5) .
Atsitiktiniai dydžiai ir vadinami nepriklausomais, jeigu bet kokiems realių skaičių aibės poaibiams ir
. Į kiekvieną skaičių (konstantą) galima žiūrėti kaip į tam tikrą išsigimusį atsitiktinį dydį. Pažymėtina, kad bet koks atsitiktinis dydis ir bet kokia konstanta yra nepriklausomi.
Atsitiktinis dydis įgyjantis baigtinę arba skaičią reikšmių aibę vadinamas diskrečiuoju.
Atsitiktinis dydis , kurio patekimo į intervalą tikimybė skaičiuojama pagal formulę vadinamas absoliučiai tolydžiuoju} dydžiu.
Funkcija vadinama tankiu. Visos tankio funkcijos tenkina dvi savybes: jos yra neneigiamos; visas jų apribotas plotas lygus vienetui. Absoliučiai tolydžiojo atsitiktinio dydžio paiskirstymo funkcija ir tankis yra susiję: , . Atsitiktinio dydžio –lygmens kvantiliu vadinsime skaičių , tenkinantį nelygybes: . Diskrečiajam atsitiktiniam dydžiui kvantilis, tai tokia reikšmė , kuriai: a) visa tikimybinė masė į kairę nuo jos yra mažesnė už ; b) prie tos tikimybinės masės pridėjus įgijimo tikimybę, tikimybinė masė taps nemažesne už . Absoliučiai tolydžiam atsitiktiniam dydžiui kvantilį galima apibrėžti lygybe: . Diskrečiojo atsitiktinio dydžio vidurkis yra reikšmių ir jų įgijimo tikimybių sandaugų suma. E Absoliučiai tolydžiojo atsitiktinio dydžio su tankiu vidurkis apibrėžiamas kaip integralas: Iš vidurkio apibrėžimo matyti, kad vidurkis — tai skaičius. Jis gali būti ir teigiamas ir neigiamas, ir didesnis už vienetą ir mažesnis.
Atsitiktinio dydžio vidurkio savybės: Laikysime, kad visi vidurkiai savybėse yra baigtiniai.
Atsitiktinio dydžio k-tosios eilės momentu, centriniu momentu, absoliučiuoju momentu ir centriniu absoliučiuoju momentu vadinsime: .Galima išreikšti centrinius momentus per paprastuosius ir atvirkščiai. Pvz. , , , , ,…
Atsitiktinio dydžio dispersija . Skaičiavimams patogiau naudoti formulę . Diskretiesiems ir tolydiesiems dydžiams dispersija skaičiuojama pagal formules ir Dispersija yra skaičius. Yra atsitiktinių dydžių, kurie dispersijų neturi.
Atsitiktiniams dydžiams, turintiems baigtines dispersijas, suformuluosime kai kurias dispersijos savybes.
Teorinis standartinis nuokrypis .
Atsitiktinių dydžių ir kovariacija: {\bf E}. Skaičiuoti patogiau pagal formulę: . Svarbiausios kovariacijos savybės yra šios:
1) Jeigu ir yra nepriklausomi, tai .
2) .
Atsitiktinių dydžių ir koreliacijos koeficientas: .
Koreliacijos koeficiento savybės:
Koreliacijos koeficientas nematuoja netiesinės priklausomybės.
Skaitinis matas, atspindintis atsitiktinio dydžio atsitiktinumo laipsnį vadinamas entropija. Atsitiktinio dydžio entropija H:
, jeigu diskretus;
, jeigu absoliučiai tolydus. Šiame apibrėžime laikom, kad
, kai .
Binominis skirstinys.
Tarkime, kad atliekant eksperimentą galimos tik dvi baigtys — „sėkmė“ ir „nesėkmė“. Eksperimento sėkmės tikimybė . Atliekame nepriklausomų eksperimentų (t.y. turime Bernulio schemą). Sėkmių skaičius yra atsitiktinis dydis, kuris vadinamas binominiu atsitiktiniu dydžiu. Jis žymimas , kur , – natūrinis skaičius. Binominio dydžio tikimybės nusakomos formule: Skaitinės charakteristikos:
Geometrinis skirstinys.
Vieną kartą daromas bandymas pasiseka su tikimybe . Nepriklausomus bandymus kartojame tol, kol sulaukiame pirmos sėkmės. Atsitiktinis dydis — bandymų skaičius iki pirmos sėkmės. Sakysime, kad turi geometrinį skirstinį. Geometrinio skirstinio tikimybės nusakomos formule: , Skaitinės charakteristikos:
Puasono skirstinys dar vadinamas retų įvykių skirstiniu. Jis priklauso nuo vieno parametro ir žymimas . Puasono skirstinio tikimybės nusakomos formule: Skaitinės charakteristikos:
Hipergeometrinis skirstinys. Turime objektų, jų tarpe žymėtų. Atsitiktinai išrenkame objektų. Žymėtųjų objektų skaičius išrinktųjų tarpe yra atsitiktinis dydis, turintis hipergeometrinį skirstinį. Hipergeometrinis skirstinys žymimas . Jo tikimybės nusakomos formule: . Skaitinės charakteristikos:
Tolygusis skirstinys. Sakysime, kad turi tolygųjį skirstinį intervale , jei jo tankis . Skaitinės charakteristikos: .
Eksponentinis skirstinys. Sakysime, kad turi eksponentinį skirstinį su parametru , jei jo tankis Skaitinės charakteristikos:
Standartinis normalusis skirstinys. Sakysime, kad atsitiktinis dydis turi standartinį normalųjį skirstinį, jei jo tankis Jis žymimas . Standartinio normaliojo atsitiktinio dydžio pasiskirstymo funkcija: Tankis simetrinis, todėl . Standartinio normalaus skirstinio skaitinės charakteristikos:
Normalusis skirstinys. Sakysime, kad atsitiktinis dydis turi normalųjį skirstinį su parametrais , , jei jo tankis Jis žymimas . Normaliojo skirstinio skaitinės charakteristikos: {\bf E},\quad {\bf D}. Std. nuokrypis . Normalusis skirstinys dar vadinamas Gauso skirstiniu. Jeigu , tai ir kur yra standartinio normaliojo dydžio pasiskirstymo funkcija. Formulėse negriežtas nelygybes galima pakeisti griežtomis.
(„chi-kvadrat“) skirstinį su laisvės laipsnių turi atsitiktinis dydis: , kur yra nepriklausomi, standartinį normalųjį skirstinį turintys atsitiktiniai dydžiai, . skirstinio skaitinės charakteristikos: .
Stjudento skirstinys. Stjudento t-skirstinį su laisvės laipsnių turi atsitiktinis dydis: . Čia yra nepriklausomi, standartinį normalųjį skirstinį turintys atsitiktiniai dydžiai, . Skaitinės charakteristikos: .
Fišerio skirstinys.{ Fišerio} skirstinį su ir laisvės laipsniais turi atsitiktinis dydis: Formulėje , yra nepriklausomi, standartinį normalųjį skirstinį turintys atsitiktiniai dydžiai, . Skaitinės charakteristikos: .
Čebyšovo nelygybė: tegul atsitiktinis dydis, turintis baigtinę dispersiją . Tuomet kiekvienam fiksuotam teisinga nelygybė: Kartais naudojama ekvivalenti nelygybės forma: . Čia .
Didžiųjų skaičių dėsnio} variantas: Tegul , ,…, yra nepriklausomi vienodai pasiskirstę atsitiktiniai dydžiai, turintys vidurkį ir dispersiją . Tuomet kiekvienam fiksuotam galios Didžiųjų skaičių dėsnis iš esmės teigia, kad dideliam nepriklausomų vienodai pasiskirsčiusių dydžių skaičiui labai tikėtina, kad jų aritmetinis vidurkis mažai skirsis nuo tikrojo vidurkio (tikimybė, kad skirtumas bus didesnis už yra maža).
Centrinė ribinė teorema. Tegul , ,…, yra nepriklausomi vienodai pasiskirstę atsitiktiniai dydžiai, turintys vidurkius , ir dispersijas . Tuomet . Čia yra standartinio normaliojo dydžio pasiskirstymo funkcija.
STATISTINĖS IŠVADOS
Atsitiktinė imtis. Tarkime, kad kartų matuojame atsitiktinį dydį . Tuomet atsitiktinę imtį sudaro atsitiktinis vektorius , kurio visi atsitiktiniai dydžiai a) nepriklausomi, b) vienodai pasiskirstę ir turintys tą patį kaip ir matuojamas dydis skirstinį. Atsitiktinės imties funkcija vadinama statistika.
Taškinis įvertinys. Statistika, kuri naudojama nežinomam populiacijos parametrui įvertinti, vadinama taškiniu įvertiniu ir žymima . Nežinomas parametras yra skaičius. Parametro ivertinys yra atsitiktinis dydis. Įvertinio realizacija=ivertis yra skaičius, randamas konkrečiai imties realizacijai. Įvertinys (angl. estimator) – statistika (funkcija) naudojama populiacijos parametrams ivertinti. Įvertis (angl. estimate) — įvertinio reikšmė, gauta kaip įvertinimo rezultatas.
Parametro įvertinys vadinamas pagrįstuoju (suderintuoju) jei kiekvienam fiksuotam .
Parametro įvertinys vadinamas nepaslinktuoju jeigu .
Tegul ir yra nepaslinktieji įvertiniai. Tuomet yra efektyvesnis už , jeigu .
Tegul ir dvi tokios statistikos, kad Intervalas vadinamas parametro pasikliautinuoju intervalu. Skaičius vadinamas pasikliovimo lygmeniu. Tradiciškai pasikliovimo lygmenys yra 0,9;0,95;0,99.
Statistinė (parametrinė) hipotezė. Bet koks teiginys apie populiacijos parametro(ų) reikšmę(es) vadinamas parametrine hipoteze. Statistinę parametrinę hipotezę sudaro du alternatyvūs teiginiai apie galimas parametro reikšmes. Problema formuluojama kaip spėjimas apie galimas parametro reikšmes: , pateikiant alternatyvą, .
Čia – parametrinė hipotezė ( nulinė hipotezė), o – alternatyva (alternatyvioji hipotezė). Galimos parametro reikšmės hipotezėje ir alternatyvoje negali sutapti.
Parametrinių alternatyvų rūšys.
Alternatyvos skiriamos į dvipuses: ir vienpuses: (arba ). Pirmos rūšies klaida tikrinant hipotezes: atmetame, o ji teisinga. Antros rūšies klaida tikrinant hipotezes: priimame, o ji klaidinga.
Statistinis kriterijus. Taisyklė, pagal kurią iš imties rezultatų darome išvadą apie hipotezės teisingumą ar klaidingumą.
Kriterijaus reikšmingumo lygmuo : atmetame, o teisinga.
Kritinė sritis. Aibė į kurią patekus taikomo kriterijaus statistikos realizacijai nulinė hipotezė atmetama. Ryšys tarp kritinės srities ir reikšmingumo lygmens. Jeigu kriterijuje naudojama statistika yra absoliučiai tolydus atsitiktinis dydis, tai kritinę sritį ir reikšmingumo lygmenį sieja tokia priklausomybė: , o .
Kriterijaus galia — tai tikimybė atmesti hipotezę , kai ji klaidinga: atmetame , o klaidinga , o . Taigi antros rūšies klaida).
Galingesnis kriterijus yra tas, kurio didesnis, esant tam pačiam reikšmingumo lygmeniui.