Pastaba itin priekabiems matematikams.
Terminų žodynas parengtas pagal V.Čekanavičiaus ir G.Murausko
vadovėlį Statistika ir jos taikymai I. Jis orientuotas į nematematikus. Todėl neieškokite čia — algebrų, Borelio aibių, funkcijų matumo bei tikimybinių erdvių sandaugų.
DUOMENYS
Populiacija — objektų, kurių savybės tiriamos, aibė.
Imtis — tai populiacijos dalis, kuri naudojama statistiniame tyrime.
Imties didumas — elementų skaičius imtyje.
Imtis reprezentatyvi, jei ji teisingai atspindi tiriamo kintamojo galimų reikšmių proporcijas populiacijoje.
Imties koeficientas .
Čia — imties didumas,
— populiacijos didumas.
Imties koeficientas apibrėžiamas tik baigtinėms populiacijoms.
Kvotinė imtis: atsižvelgus į populiacijos sandarą, iš anksto numatomos imties elementų kvotos. Pavyzdžiui, numatoma, kad imtį sudarys 80 lietuvių, 10 rusų, 7 lenkai ir 3 baltarusiai.
Proginė imtis: Į imtį įtraukiami pirmi pasitaikę populiacijos elementai.
Sisteminė imtis: Jos sudarymo principas yra toks: 1) atsižvelgus į populiacijos dydį ir numatomą pačios imties dydį, parenkamas išrinkimo žingsnis, 2) visi elementai išrikiuojami į eilę, 3) iš kelių pirmųjų elementų atsitiktiniu būdu parenkamas pirmas imties elementas,4) pasirinktu žingsniu parenkami visi likę elementai.
Sluoksninė imtis: Visa populiacija suskirstoma į sluoksnius ( stratus). Kiekviename sluoksnyje naudojamas paprastosios atsitiktinės grąžintinės imties sudarymo būdas.
Lizdinė imtis: Visa populiacija suskirstoma į panašias pagal tam tikrą požymį grupes — lizdus ( klasterius). Iš visų lizdų aibės paprastosios atsitiktinės imties būdu parenkama dalis. Į imtį pakliūna visi atrinktųjų lizdų elementai.
Paprastoji atsitiktinė grąžintinė imtis: kiekvienu imties sudarymo momentu visiems populiacijos elementams patekti į imtį galimybės yra vienodos.
Klasikinė vienodas galimybes teikianti situacija yra tokia:
1) visi populiacijos elementai sunumeruojami, 2) elementų numeriai užrašomi ant rutulių, 3) rutuliai sudedami į dėžę ir gerai sumaišomi, 4) ištraukiamas pirmas pasitaikęs rutulys, 5) elementas, atitinkantis ant rutulio užrašytąjį numerį, įtraukiamas į imtį.
Atsakymo lygis atsakiusių į klausimą skaičius
visų parinktų respondentų skaičius.
Kintamasis, gautas matuojant turimos savybės kiekį (skaičiuojamąjį dydį), vadinamas kiekybiniu kintamuoju.
Kintamasis, nusakantis savybės buvimą ar nebuvimą, priklausymą vienai iš galimų kategorijų, vadinamas kokybiniu kintamuoju.
Kiekybinis kintamasis vadinamas tolydžiuoju, jei skirtumas tarp kintamojo reikšmių gali būti kiek norima mažas. Jei kiekybinio kintamojo reikšmės gali skirtis ne mažiau kaip tam tikru minimaliu pokyčiu, tai kintamasis vadinamas diskrečiuoju kintamuoju.
Kintamųjų matavimo skalės:
1) Pavadinimų skalė.
2) Rangų skalė.
3) Intervalų skalė.
4) Santykių skalė.
Pavadinimų skalė.
Pavadinimų skalė dar vadinama nominaliąja, arba klasifikacine skale. Pagal kintamojo reikšmes, gautas naudojant pavadinimų skalę objektus galima tik klasifikuoti, t.y. priskirti vienai ar kitai grupei. Šioje skalėje aritmetinės operacijos neturi prasmės. Kintamieji, kurie matuojami pavadinimų skalėje, vadinami kategoriniais kintamaisiais.
Pavyzdžiai: pašto indeksas, lytis, tautybė.
Rangų skalė.
Rangų skalė dar vadinama tvarkos skale. Ši skalė naudojama tada, kai statistikas gali nustatyti objektų tiriamo požymio, savybės skirtumus ir pagal tai juos išrikiuoti į eilę. Kintamieji, kurie matuojami rangų skalėje, vadinami ranginiais kintamaisiais. Pagal ranginių kintamųjų reikšmes objektus galima ne tik skirstyti į klases, bet ir jas sutvarkyti.
Ranginių kintamųjų pavyzdžiai:
varžybose užimtoji vieta, mokslo vardai, mokymosi lygis.
Intervalų skalė.
Matavimams naudojant šią skalę, objektus galima ne tik klasifikuoti, tvarkyti, bet ir kiekybiškai įvertinti skirtumus tarp klasių. Intervaliniai duomenys visada skaitiniai. Skirtumas (intervalas) tarp dviejų kintamojo reikšmių rodo, kiek daugiau ar mažiau matuojamojo reiškinio yra viename elemente, palyginti su kitu elementu. Nulinis taškas intervalų skalėje yra laisvai parenkamas ir nereiškia tiriamos savybės nebuvimo. Intervalų skalėje dviejų intervalų santykis nepriklauso nei nuo matavimo vienetų, nei nuo nulinio taško.
Intervalinių kintamųjų pavyzdžiai: temperatūros matavimai, kalendorinis laikas, metų skaičiavimas — nuo Romos įkūrimo, nuo Kristaus gimimo. Intervalinius duomenis galime sudėti, atimti adauginti (padalinti) iš skaičiaus (taigi ir vidurkinti).
Santykių skalė.
Ši skalė skiriasi nuo intervalų skalės tik tuo, kad joje yra apibrėžta absoliuti atskaitos pradžia, t.y. nulinis taškas, reiškiantis tiriamosios savybės nebuvimą. Santykių skalės kintamieji: ūgis,
svoris, amžius, atlyginimas, kaina, laikas.
APRAŠOMOJI STATISTIKA
Aprašomoji statistika, tai duomenų sisteminimo ir grafinio vaizdavimo metodai. Aprašomoji statistika leidžia koncentruotai užrašyti informaciją, esančią dideliuose duomenų masyvuose. Todėl ji gali būti naudojama ir visos populiacijos duomenims apdoroti.
Išdėstyta nemažėjimo tvarka kiekybinio kintamojo duomenų eilutė vadinama variacine eilute.
Taigi ,
. Kintamojo reikšmės dažnis
— tai skaičius, nusakantis, kiek kartų reikšmė
pasikartojo duomenyse. (
). Kintamojo reikšmės santykinis dažnis
— tai skaičius, nusakantis, kurią statistinės eilutės dalį sudaro
(
).
Dažnių (empirinė) pasiskirstymo funkcija:
Garantijų funkcija:
Dažnių daugiakampis gaunamas Dekarto koordinatėse atidėtas dažnių reikšmes sujungus atkarpomis. Daugiakampis braižomas ir santykiniams dažniams.
Grupuotiems duomenims dažniausiai braižoma histograma, t.y. empirinės grupuotų duomenų tankio funkcijos grafikas. Histograma braižoma taip:
1) ‘sų ašyje atidedami grupavimo intervalai,
2) kiekviename intervale braižomas stačiakampis, kurio aukštinė proporcinga pakliuvusių į intervalą reikšmių skaičiui ().
Reikalaujama, kad visų stačiakampių plotų suma būtų lygi 1. Ordinačių (‘kų) ašies mastelis dažniausiai skiriasi nuo
‘sų ašies mastelio (kitu atveju būtų sunkoka ką nors įžiūrėti).
Pagrindinės duomenų padėties charakteristikos yra vidurkis, moda ir mediana, apibūdinantys duomenų „centrą“, bei kvantiliai.
Visos charakteristikos, išskyrus modą, skaičiuojamos tik kiekybiniams duomenims.
Imties vidurkis (empirinis vidurkis) yra visų kintamojo matavimų suma padalinta iš jų skaičiaus.
. Grupuotiems duomenims vidurkio skaičiavimui naudojami intervalų viduriniai taškai.
Moda — dažniausiai duomenų aibėje pasikartojusi reikšmė. Pavyzdžiui, duomenų aibės 1; 1; 2; 3; 4; 5 moda . Jeigu visos reikšmės statistinėje eilutėje pasikartoja vienodai dažnai, sakoma, kad pasiskirstymas neturi modos. Pavyzdžiui, duomenų aibė 2,3; 2,3; 3,8; 3,8; 4,5;4,5 modos neturi. Jeigu kelios gretimos variacinės eilutės reikšmės pasirodo vienodu dažniu ir šis dažnis yra didesnis, negu bet kuris kitas dažnis, tai moda yra šių reikšmių vidurkis. Pavyzdžiui duomenų aibės 0; 1; 1; 2; 2; 2; 3; 3; 3; 4 moda
. Gali būti kelios modos. Modą galima skaičiuoti tiek kiekybiniams tiek ir kokybiniams duomenims. Grupuotiems duomenims moda yra intervalo, į kurį pateko daugiausia duomenų, vidurinė reikšmė.
Mediana yra skaičius, už kurį 50% variacinės eilutės reikšmių yra nedidesnės ir 50% nemažesnės. Tikslesnis medianos apibrėžimas skamba taip: jeigu nelyginis, tai mediana yra variacinės eilutės reikšmė, atitinkanti
poziciją. Jeigu stebėjimų skaičius
lyginis, tai mediana yra variacinės eilutės reikšmių, atitinkančių pozicijas
ir
, aritmetinis vidurkis. Mediana dažniausiai naudojama ranginiams duomenims ir intervaliniams — santykiniams duomenims, kuriuose yra išskirčių.
Kvartiliai
dalija variacinę eilutę į keturias „maždaug“ lygias dalis. Vienas iš kvartilių radimo metodų skamba taip:
sutampa su mediana ir dalija imtį į dvi dalis. Tuomet
yra apatinės dalies mediana, o
yra viršutinės dalies mediana.
Triskaitis vidurkis skaičiuojamas pagal tokią formulę:
Pagrindinės sklaidos charakteristikos yra duomenų aibės plotis, vidutinis nuokrypis, dispersija, standartinis nuokrypis, kvartilių skirtumas ir kitimo koeficientas. Šios charakteristikos skaičiuojamos kiekybiniams duomenims.
Imties dispersija: Iš apibrėžimo akivaizdu, kad dispersija visuomet neneigiama. Be to, dispersija lygi nuliui tuo ir tik tuo atveju, kai visi stebėjimai lygūs. Skaičiuojant dispersiją grupuotiems duomenims, taikoma tokia formulė:
kur – grupavimo intervalo ilgis,
– j-ojo grupavimo intervalo dažnis,
– j-ojo grupavimo intervalo vidurio taškas.
Imties standartinis nuokrypis gaunamas, ištraukus kvadratinę šaknį iš dispersijos: Standartinis nuokrypis matuojamas tais pačiais vienetais, kaip ir patys duomenys.
Kitimo koeficientas: .
Procentinis kitimo koeficientas: . Čia
— imties standartinis nuokrypis. Kitimo koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius:
. Kitimo koeficientas — bedimensinis dydis. Jis naudojamas, lyginant skirtingų duomenų aibių sklaidas.
Duomenų aibės plotis .
Kvartilių skirtumas IQR.
Vidutinis nuokrypis:
Kokybinės įvairovės indeksas . Čia
– kategorijų skaičius,
– stebėjimų skaičius,
– stebėjimų skaičius
– oje kategorijoje (
– osios kategorijos dažnis). Kokybinės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida). Dažniausiai jis taikomas kokybinių duomenų sklaidai įvertinti.
Dažnių skirstinio formos charakteristikos}– tai histogramos (dažnių daugiakampio) formos charakteristikos. Jos yra dvi — ekscesas ir asimetrijos koeficientas.
Asimetrijos koeficientas: . Čia
yra standartinis nuokrypis, o
yra centrinis empirinis 3-os eilės momentas:
. Asimetrijos koeficientas — histogramos simetrijos matas. Jeigu
, tai histograma turi teigiamą (dešiniąją) asimetriją, jeigu
— neigiamą (kairiąją) asimetriją. Histograma simetriška, kai
.
Eksceso koeficientas: . Čia
yra standartinis nuokrypis, o
yra centrinis empirinis 4-os eilės momentas:
. Eksceso koeficientas — histogramos lėkštumo matas. Jeigu
— dažnių skirstinio grafiko viršūnė yra aukštesnė, o uodegos plonesnės nei normaliosios kreivės. Jeigu
— dažnių skirstinio grafiko viršūnė yra žemesne, o uodegos storesnės nei normaliosios kreivės. Jeigu
, tai dažnių skirstinio koncentracija koncentracija apie vidurkį tokia pati, kaip ir normaliosios kreivės.
Normalioji kreivė: funkcijos grafikas. Funkcijos
grafikas yra varpo formos ir visas juo apribotas plotas lygus vienetui. Jis yra simetriškas
atžvilgiu. Nors pati funkcija apibrėžta su visais
, bet toli nuo vidurkio funkcijos reikšmės labai mažos. Intervale
plotas, apribotas
grafiku, priklauso, nuo
, bet nepriklauso nuo
ir
. Į kairę ir dešinę nuo vidurkio atidėjus du standartinius nuokrypius, gautu intervalu ir normaliąja kreive apribotas plotas lygus 0,9544…
Empirinė taisyklė:
Jeigu duomenų histograma yra varpo formos, tai:
1) apytiksliai 68% visų duomenų patenka į intervalą
2) apytiksliai 95% visų duomenų patenka į intervalą
3) beveik visi duomenys patenka į intervalą
Standartizuotoji z-reikšmė: . Čia
— empirinis vidurkis,
— standartinis nuokrypis.
Sąlygine išskirtimi vadinamas duomuo, priklausantis intervalui arba intervalui
.
Išskirtimi vadinamas duomuo, mažesnis už arba didesnis už
.
Čebyšovo taisyklė: Nemažiau kaip dalis visų stebėjimų patenka į intervalą
. Čia
imties vidurkis, o
imties standartinis nuokrypis. Atkreipiame dėmesį, kad
nebūtinai sveikas skaičius. Iš Čebyšovo taisyklės išplaukia, kad nemažiau kaip 75% visų stebėjimų paklius į intervalą
, o nemažiau kaip 88% visų stebėjimų paklius į intervalą
.
Stačiakampė diagrama grafinis suvestinės (min, , Md,
, max) vaizdas. Stačiakampėje diagramoje yra „dėžė“ – stačiakampis, brėžiamas nuo pirmojo kvartilio
iki trečiojo kvartilio
, padalytas brūkšniu į dvi dalis ties mediana Md. (Kartais dar
‘su pažymimas vidurkio taškas). Nuo stačiakampio šono brėžiami „ūsai“, besitęsiantys iki paskutinės neišsiskiriančios duomenų aibės reikšmės ir didžiausios neišsiskiriančios duomenų aibės reikšmės. Išskirčių (sąlyginių išskirčių) reikšmės pažymimos specialiais simboliais.
TIKIMYBIŲ TEORIJOS ELEMENTAI
Tikimybiniu eksperimentu vadinsime tokį eksperimentą, kurio metu gali būti keletas atsitiktinių baigčių. Atliekant tikimybinį eksperimentą, negalima iš anksto pasakyti, kuri iš galimų baigčių įvyks. Atsitiktinės eksperimento baigtys vadinamos atsitiktiniais įvykiais. Jeigu įvykiai smulkiau neskaidytini, tai jie vadinami elementariaisiais. Pvz. metamas kauliukas (tikimybinis eksperimentas), iškrito lyginis taškų skaičius — atsitiktinis įvykis, iškrito 1 taškas, 2 taškai, … — elementarieji įvykiai.
Visų elementariųjų įvykių aibė vadinama elementariųjų įvykių erdve. Elementarieji įvykiai žymimi simboliais
,
,…,
, o elementariųjų įvykių erdvė simboliu
. Aišku, kad
.
Būtinasis įvykis — įvykis, kuris įvyksta, įvykus bet kuriai eksperimento baigčiai.
Negalimas įvykis , t.y. įvykis, kuris, atliekant eksperimentą, įvykti negali. Pavyzdžiui, metant kauliuką, įvykis „iškrito nelyginis akučių skaičius, didesnis už 5“ yra negalimas.
Įvykis yra įvykio
dalis
, jeigu įvykus įvykiui
, įvyksta ir įvykis
. Tarkime, kad metamas kauliukas, tuomet įvykis
yra įvykio
iškris nelyginis taškų skaičius
dalis. Kiekvienas įvykis
yra būtinojo įvykio
dalis, t.y.
. Bendruoju tikimybių teorijos atveju (kai
turi daug sudėtingesnę struktūrą, nei baigtinė elementariųjų įvykių aibė) ne kiekvienas aibės
poaibis laikomas įvykiu.
Du įvykius vadiname lygiais , jeigu
yra
dalis, o
yra
dalis. Elementariųjų įvykių erdvėje
, jeigu juos sudarančios elementariųjų įvykių aibės sutampa. Pavyzdžiui, metant kauliuką, įvykiai
ir
iškris lyginis taškų skaičius
yra lygūs.
Įvykių ir
sąjunga
vadinsime įvykį, kai įvyksta bent vienas iš įvykių
ir
. Elementariųjų įvykių erdvėje
žymi įvykį, sudarytą iš elementariųjų įvykių, priklausančių bent vienam iš įvykių
ir
. Šnekamojoje kalboje įvykių
sąjungą atitinka teiginys: įvyks
arba
.
Įvykių ir
sankirta
vadinsime įvykį, kai kartu įvyksta abu įvykiai
ir
. Elementariųjų įvykių erdvėje įvykių
yra įvykis, sudarytas iš visų bendrųjų elementariųjų įvykių. Šnekamojoje kalboje įvykių
sankirtą atitinka teiginys: įvyks
ir
.
Įvykiai ir
vadinami nesutaikomais
, jeigu jie negali įvykti kartu. Metant kauliuką,
ir
yra nesutaikomi. Bet koks įvykis
ir negalimas įvykis
yra nesutaikomi.
Dviejų įvykių ir
skirtumu
vadinamas įvykis, kai įvyksta
, o
neįvyksta. Elementariųjų įvykių erdvėje
žymi įvykį, sudarytą iš tų
elementų, kurie nepriklauso
. Atkreipiame dėmesį, kad įvykiai
ir
vienas per kitą neišsireiškia.
Įvykis vadinamas priešingu įvykiui
. Metant monetą, įvykis
herbas
yra priešingas įvykiui
skaičius
.
Daug kartų kartodami eksperimentą, stebime, kaip dažnai pasikartoja konkreti eksperimento baigtis. Jeigu šis dažnis, augant ekperimentų skaičiui, stabilizuojasi ties kažkokiu skaičiumi, tai pastarąjį skaičių ir laikome tiriamos baigties (įvykio) statistine tikimybe. Būtina, kad: a) visi eksperimentai vyktų visiškai vienodomis sąlygomis, b) vieno eksperimento rezultatai neturėtų įtakos kito eksperimento rezultatams (eksperimentai būtų nepriklausomi). Būdingi statistinės tikimybės taikymo pavyzdžiai: Vatikane gyventojų nevedę — tikimybė, kad atsitiktinai parinktas Vatikano gyventojas bus nevedęs 1;
tam tikros rūšies operacijų sėkmingos — tikimybė, kad operacija bus sėkminga 0,65.
Klasikinis tikimybės apibrėžimas formuluojamas tik baigtinėms elementariųjų įvykių aibėms , kurios visi elementarieji įvykiai vienodai galimi. Įvykio
tikimybe laikysime įvykį
sudarančių elementariųjų įvykių skaičiaus santykį su visų elementariųjų įvykių skaičiumi. Klasikinis tikimybės apibrėžimas netinka, jeigu
nėra baigtinis arba, jeigu elementarieji įvykiai nėra vienodai galimi.
Bendrasis tikimybės apibrėžimas skamba taip: Tikimybe vadiname funkciją , kuri kiekvienam atsitiktiniam įvykiui
priskiria skaičių
ir
1) ,
2) ,
3) , jeigu
,
.
Tikimybės savybės: 1) .
2) .
3) .
4) Jeigu , tai
.
5) .
6) Bet kokiam įvykiui teisinga lygybė
.
Tikimybė, kad įvyks su sąlyga, kad įvyko
vadinama sąlygine tikimybe ir žymima
. Jeigu
nėra negalimas įvykis (
), tai sąlyginę tikimybę galima apibrėžti per besąlygines tikimybes.
. Tegul
,
— bet kokie atsitiktiniai įvykiai, o
. Tuomet
1) .
2) Jeigu , tai
.
Tikimybių daugybos teorema: .
Įvykiai ir
vadinami priklausomais, jeigu
. Evivalentus apibrėžimas: įvykiai
ir
priklausomi, jeigu
. Įvykiai
ir
nepriklausomi, jeigu
. Ekvivalentus apibrėžimas: įvykiai
ir
nepriklausomi, jeigu
. Bet koks įvykis ir būtinasis įvykis
arba negalimas įvykis
yra nepriklausomi.
Pilnosios tikimybės formulė Tegul
1),
2) ,
.
Tuomet
Bajeso formulė: Tegul
1),
2) ,
.
Tuomet
Tikimybės ,
, … vadinamos apriorinėmis. Tikimybės
,
,… vadinamos aposteriorinėmis tikimybėmis. Jos skiriasi nuo apriorinių tikimybių tuo, kad atsižvelgta į naują informaciją (
įvyko).
Bernulio eksperimentų schema nusakoma taip: vieną kartą atliekant eksperimentą, jo sėkmės tikimybė lygi . Atliekame
nepriklausomų eksperimentų. Sėkmingų Bernulio eksperimentų skaičiaus tikimybė, t.y. tikimybė, kad Bernulio schemoje eksperimentas pavyks
kartų yra lygi P(iš
bandymų
sėkmingų)=
.
Atsitiktinis dydis — tai funkcija R. Taigi atsitiktinis dydis nusako taisyklę pagal kurią kiekvienam atsitiktiniam įvykiui priskiriama skaitinė reikšmė. Pvz.: metama moneta (tikimybinis eksperimentas) ir skaičiuojame iškritusius herbus (atsitiktinis dydis — herbų skaičius). Atsitiktinis dydis gali įgyti 2 reikšmes (0 arba 1). Skaitinė reikšmė 0 atitinka įvykį „iškrito herbas“, skaitinė reikšmė 1 atitinka įvykį „iškrito herbas“. Atsitiktinis dydis — tai tam tikras matematinis modelis, o vienas ir tas pats matematinis modelis gali tikti daugeliui situacijų (eksperimentų). Tolydžioji atsitiktinio dydžio funkcija irgi yra atsitiktinis dydis. Atsitiktinio dydžio skirstinys — tai atsitiktinio dydžio įgyjamos reikšmės su jų įgijimo tikimybėmis.
Atsitiktinio dydžio pasiskirstymo funkcija:
Jos savybės:
1) .
2),
.
3) nemažėjanti, t.y.
, kai
.
4) tolydi iš dešinės.
5) .
Atsitiktiniai dydžiai ir
vadinami nepriklausomais, jeigu bet kokiems realių skaičių aibės poaibiams
ir
. Į kiekvieną skaičių (konstantą)
galima žiūrėti kaip į tam tikrą išsigimusį atsitiktinį dydį. Pažymėtina, kad bet koks atsitiktinis dydis
ir bet kokia konstanta
yra nepriklausomi.
Atsitiktinis dydis įgyjantis baigtinę arba skaičią reikšmių aibę vadinamas diskrečiuoju.
Atsitiktinis dydis , kurio patekimo į intervalą
tikimybė skaičiuojama pagal formulę
vadinamas absoliučiai tolydžiuoju} dydžiu.
Funkcija vadinama tankiu. Visos tankio funkcijos tenkina dvi savybes: jos yra neneigiamos; visas jų apribotas plotas lygus vienetui. Absoliučiai tolydžiojo atsitiktinio dydžio paiskirstymo funkcija ir tankis yra susiję:
,
. Atsitiktinio dydžio
–lygmens kvantiliu vadinsime skaičių
, tenkinantį nelygybes:
. Diskrečiajam atsitiktiniam dydžiui kvantilis, tai tokia
reikšmė
, kuriai: a) visa tikimybinė masė į kairę nuo jos yra mažesnė už
; b) prie tos tikimybinės masės pridėjus
įgijimo tikimybę, tikimybinė masė taps nemažesne už
. Absoliučiai tolydžiam atsitiktiniam dydžiui kvantilį galima apibrėžti lygybe:
. Diskrečiojo atsitiktinio dydžio
vidurkis
yra reikšmių ir jų įgijimo tikimybių sandaugų suma. E
Absoliučiai tolydžiojo atsitiktinio dydžio
su tankiu
vidurkis
apibrėžiamas kaip integralas:
Iš vidurkio apibrėžimo matyti, kad vidurkis — tai skaičius. Jis gali būti ir teigiamas ir neigiamas, ir didesnis už vienetą ir mažesnis.
Atsitiktinio dydžio vidurkio savybės: Laikysime, kad visi vidurkiai savybėse yra baigtiniai.
Atsitiktinio dydžio k-tosios eilės momentu, centriniu momentu, absoliučiuoju momentu ir centriniu absoliučiuoju momentu vadinsime:
.Galima išreikšti centrinius momentus per paprastuosius ir atvirkščiai. Pvz.
,
,
,
,
,…
Atsitiktinio dydžio dispersija
. Skaičiavimams patogiau naudoti formulę
. Diskretiesiems ir tolydiesiems dydžiams dispersija skaičiuojama pagal formules
ir
Dispersija yra skaičius. Yra atsitiktinių dydžių, kurie dispersijų neturi.
Atsitiktiniams dydžiams, turintiems baigtines dispersijas, suformuluosime kai kurias dispersijos savybes.
Teorinis standartinis nuokrypis .
Atsitiktinių dydžių ir
kovariacija:
{\bf E}
. Skaičiuoti patogiau pagal formulę:
. Svarbiausios kovariacijos savybės yra šios:
1) Jeigu ir
yra nepriklausomi, tai
.
2) .
Atsitiktinių dydžių ir
koreliacijos koeficientas:
.
Koreliacijos koeficiento savybės:
Koreliacijos koeficientas nematuoja netiesinės priklausomybės.
Skaitinis matas, atspindintis atsitiktinio dydžio atsitiktinumo laipsnį vadinamas entropija. Atsitiktinio dydžio entropija H:
, jeigu
diskretus;
, jeigu
absoliučiai tolydus. Šiame apibrėžime laikom, kad
, kai
.
Binominis skirstinys.
Tarkime, kad atliekant eksperimentą galimos tik dvi baigtys — „sėkmė“ ir „nesėkmė“. Eksperimento sėkmės tikimybė . Atliekame
nepriklausomų eksperimentų (t.y. turime Bernulio schemą). Sėkmių skaičius yra atsitiktinis dydis, kuris vadinamas binominiu atsitiktiniu dydžiu. Jis žymimas
, kur
,
– natūrinis skaičius. Binominio dydžio tikimybės nusakomos formule:
Skaitinės charakteristikos:
Geometrinis skirstinys.
Vieną kartą daromas bandymas pasiseka su tikimybe . Nepriklausomus bandymus kartojame tol, kol sulaukiame pirmos sėkmės. Atsitiktinis dydis
— bandymų skaičius iki pirmos sėkmės. Sakysime, kad
turi geometrinį skirstinį. Geometrinio skirstinio tikimybės nusakomos formule:
,
Skaitinės charakteristikos:
Puasono skirstinys dar vadinamas retų įvykių skirstiniu. Jis priklauso nuo vieno parametro ir žymimas
. Puasono skirstinio tikimybės nusakomos formule:
Skaitinės charakteristikos:
Hipergeometrinis skirstinys. Turime objektų, jų tarpe
žymėtų. Atsitiktinai išrenkame
objektų. Žymėtųjų objektų skaičius išrinktųjų tarpe yra atsitiktinis dydis, turintis hipergeometrinį skirstinį. Hipergeometrinis skirstinys žymimas
. Jo tikimybės nusakomos formule:
. Skaitinės charakteristikos:
Tolygusis skirstinys. Sakysime, kad turi tolygųjį skirstinį intervale
, jei jo tankis
. Skaitinės charakteristikos:
.
Eksponentinis skirstinys. Sakysime, kad turi eksponentinį skirstinį su parametru
, jei jo tankis
Skaitinės charakteristikos:
Standartinis normalusis skirstinys. Sakysime, kad atsitiktinis dydis turi standartinį normalųjį skirstinį, jei jo tankis
Jis žymimas
. Standartinio normaliojo atsitiktinio dydžio pasiskirstymo funkcija:
Tankis
simetrinis, todėl
. Standartinio normalaus skirstinio skaitinės charakteristikos:
Normalusis skirstinys. Sakysime, kad atsitiktinis dydis turi normalųjį skirstinį su parametrais ,
, jei jo tankis
Jis žymimas
. Normaliojo skirstinio
skaitinės charakteristikos: {\bf E}
,\quad {\bf D}
. Std. nuokrypis
. Normalusis skirstinys dar vadinamas Gauso skirstiniu. Jeigu
, tai
ir
kur
yra standartinio normaliojo dydžio pasiskirstymo funkcija. Formulėse negriežtas nelygybes galima pakeisti griežtomis.
(„chi-kvadrat“) skirstinį su
laisvės laipsnių turi atsitiktinis dydis:
, kur
yra nepriklausomi, standartinį normalųjį skirstinį turintys atsitiktiniai dydžiai,
.
skirstinio skaitinės charakteristikos:
.
Stjudento skirstinys. Stjudento t-skirstinį su laisvės laipsnių turi atsitiktinis dydis:
. Čia
yra nepriklausomi, standartinį normalųjį skirstinį turintys atsitiktiniai dydžiai,
. Skaitinės charakteristikos:
.
Fišerio skirstinys.{ Fišerio} skirstinį su ir
laisvės laipsniais turi atsitiktinis dydis:
Formulėje
,
yra nepriklausomi, standartinį normalųjį skirstinį turintys atsitiktiniai dydžiai,
. Skaitinės charakteristikos:
.
Čebyšovo nelygybė: tegul atsitiktinis dydis, turintis baigtinę dispersiją
. Tuomet kiekvienam fiksuotam
teisinga nelygybė:
Kartais naudojama ekvivalenti nelygybės forma:
. Čia
.
Didžiųjų skaičių dėsnio} variantas: Tegul ,
,…,
yra nepriklausomi vienodai pasiskirstę atsitiktiniai dydžiai, turintys vidurkį
ir dispersiją
. Tuomet kiekvienam fiksuotam
galios
Didžiųjų skaičių dėsnis iš esmės teigia, kad dideliam nepriklausomų vienodai pasiskirsčiusių dydžių skaičiui labai tikėtina, kad jų aritmetinis vidurkis mažai skirsis nuo tikrojo vidurkio (tikimybė, kad skirtumas bus didesnis už
yra maža).
Centrinė ribinė teorema. Tegul ,
,…,
yra nepriklausomi vienodai pasiskirstę atsitiktiniai dydžiai, turintys vidurkius
, ir dispersijas
. Tuomet
. Čia
yra standartinio normaliojo dydžio pasiskirstymo funkcija.
STATISTINĖS IŠVADOS
Atsitiktinė imtis. Tarkime, kad kartų matuojame atsitiktinį dydį
. Tuomet atsitiktinę imtį sudaro atsitiktinis vektorius
, kurio visi atsitiktiniai dydžiai a) nepriklausomi, b) vienodai pasiskirstę ir turintys tą patį kaip ir matuojamas dydis
skirstinį. Atsitiktinės imties funkcija vadinama statistika.
Taškinis įvertinys. Statistika, kuri naudojama nežinomam populiacijos parametrui įvertinti, vadinama
taškiniu įvertiniu ir žymima
. Nežinomas parametras yra skaičius. Parametro ivertinys yra atsitiktinis dydis. Įvertinio realizacija=ivertis yra skaičius, randamas konkrečiai imties realizacijai. Įvertinys (angl. estimator) – statistika (funkcija) naudojama populiacijos parametrams ivertinti. Įvertis (angl. estimate) — įvertinio reikšmė, gauta kaip įvertinimo rezultatas.
Parametro įvertinys vadinamas pagrįstuoju (suderintuoju) jei kiekvienam fiksuotam
.
Parametro įvertinys vadinamas nepaslinktuoju jeigu .
Tegul ir
yra nepaslinktieji
įvertiniai. Tuomet
yra efektyvesnis už
, jeigu
.
Tegul ir
dvi tokios statistikos, kad
Intervalas
vadinamas parametro
pasikliautinuoju intervalu. Skaičius
vadinamas pasikliovimo lygmeniu. Tradiciškai pasikliovimo lygmenys yra 0,9;0,95;0,99.
Statistinė (parametrinė) hipotezė. Bet koks teiginys apie populiacijos parametro(ų) reikšmę(es) vadinamas parametrine hipoteze. Statistinę parametrinę hipotezę sudaro du alternatyvūs teiginiai apie galimas parametro reikšmes. Problema formuluojama kaip spėjimas apie galimas parametro reikšmes:
, pateikiant alternatyvą,
.
Čia – parametrinė hipotezė ( nulinė hipotezė), o
– alternatyva (alternatyvioji hipotezė). Galimos parametro reikšmės hipotezėje ir alternatyvoje negali sutapti.
Parametrinių alternatyvų rūšys.
Alternatyvos skiriamos į dvipuses: ir vienpuses:
(arba
). Pirmos rūšies klaida tikrinant hipotezes:
atmetame, o ji teisinga. Antros rūšies klaida tikrinant hipotezes:
priimame, o ji klaidinga.
Statistinis kriterijus. Taisyklė, pagal kurią iš imties rezultatų darome išvadą apie hipotezės teisingumą ar klaidingumą.
Kriterijaus reikšmingumo lygmuo :
atmetame
, o
teisinga.
Kritinė sritis. Aibė į kurią patekus taikomo kriterijaus statistikos realizacijai nulinė hipotezė atmetama. Ryšys tarp kritinės srities ir reikšmingumo lygmens. Jeigu kriterijuje naudojama statistika
yra absoliučiai tolydus atsitiktinis dydis, tai kritinę sritį
ir reikšmingumo lygmenį
sieja tokia priklausomybė:
, o
.
Kriterijaus galia — tai tikimybė atmesti hipotezę
, kai ji klaidinga:
atmetame
, o
klaidinga
, o
. Taigi
antros rūšies klaida).
Galingesnis kriterijus yra tas, kurio didesnis, esant tam pačiam reikšmingumo lygmeniui.