Pradinės statistikos sąvokos

Tai kas ta statistika?

Statistika – tai mokslas apie informacijos rinkimą, sisteminimą, analizavimą ir interpretavimą.
Statistika – tai informacija apie veiklą ar procesą, išreikšta skaičiais, lentelėmis ar diagramomis.

Trumpai statistikos esmę galima apibūdinti taip:

  1. Statistika nėra paprastas atsitikimų, reiškinių ar kokių nors daiktų ar dalykų skaičiavimas; statistika yra masinių reiškinių kiekybinis aprašymas, jų grupavimas (klasifikavimas) ir apibūdinimas rodikliais, jų  indikatoriais.
  2. Statistikai pagrindą duoda didžiųjų skaičių dėsnis, nes, tik esant dideliam tyrinėjamų reiškinių skaičiui,  pasireiškia statistiniai dėsningumai ir tendencijos.
  3. Statistiniai dėsningumai rodo tų veiksnių, kurie nulemia nagrinėjamų masinių reiškinių pagrindines ypatybes, įtaką.
  4. Statistiniai dėsningumai įgalina daryti tikimybinius sprendimus, todėl bet kokio realaus reiškinio  statistinės analizės teorijos sukūrimas neįmanomas be sąsajų su tikimybių teorija, tikimybiniais skaičiavimais.

Išskiriamos trys statistikos dalys:

  • Duomenų rinkimas.
  • Aprašomoji statistika – duomenų sisteminimo metodai.
  • Statistinės išvados – analizės ir interpretavimo metodai.

Atliekant statistinį tyrimą, iš pradžių pasirenkama tyrimo objektų aibė, po to surenkama informacija apie objektus ar jų dalį, ji apdorojama ir, remiantis gautais rezultatais, daromos išvados apie vieną ar kitą tyrimo objektų požymį.

Statistinio tyrimo pavyzdys

Vaisvandenių gamykla gamina dviejų rūšių vaisvandenius. Norima nustatyti, ar kiekvienos rūšies dalis visoje vaisvandenių gamyklos gamyboje atitinka rinkos poreikius. Statistikas turi nusakyti gamyklos vaisvandenių vartotojų aibę, parinkti dalį jos tyrimui, gautą informaciją susisteminti, ją išanalizuoti ir pateikti gamyklai savo rekomendacijas.

Populiacija

Pirmasis bet kokio tyrimo žingsnis – pasirinkti tiriamą aibę. Jos objektai turi vieną ar keletą tyrėją dominančių požymių. Pavyzdžiui, ekonomistą domina visų Lietuvos įmonių pelnas. Tiriama aibė bus visos Lietuvos įmonės, požymis, kuris domina ekonomistą, pelnas.
Statistinių tyrimų nagrinėjama objektų aibė dar vadinama populiacija. Populiacija gali būti ne tik baigtinė, bet ir begalinė. Pavyzdžiui, domina vabzdžiai, kurie gali platinti pavojingas ligas. Šiuo atveju populiacija – visi vabzdžiai, kurių neįmanoma suskaičiuoti.

Norint įvertinti tiriamą objektų požymį, reikia mokėti jį išmatuoti. Tinkamai parinkti matavimo priemones – tai viena iš svarbesnių eksperimento planavimo problemų. Kalbėdami apie infliacijos didumą, neaptarinėjama kaip ji yra matuojama.
Mokėdami išmatuoti požymį, galima kelti klausimą apie jo reikšmių paplitimą visoje populiacijoje. Taigi uždavinys: Bendriausias statistikos uždavinys – nustatyti tiriamų požymių reikšmių dažnių pasiskirstymus populiacijoje.

Paprastai atliekant realius tyrimus požymių reikšmių pasiskirstymo dažniai populiacijoje nežinomi. Be to, dažnai visos populiacijos ištirti neįmanoma, kadangi:

  1. Tyrimui reikia daug laiko.
  2. Tyrimas brangus.
  3. Dažnai neįmanoma išvardinti visų populiacijos elementų.

Taigi dažniausiai tiriama tik populiacijos dalis, vadinamoji imtis.

Populiacija – objektų, kurių požymiai tiriami, aibė.
Imtis – tai populiacijos dalis, naudojama statistiniam tyrimui.

Imtis

Imties pavyzdžiai: 50 atsitiktinai atrinktų VDU studentų; 1000 apklausoje dalyvaujančių respondentų ir pan.
Elementų skaičius imtyje – imties didumas.
Imties elementų tiriamo požymio reikšmės – duomenys, arba duomenų aibė.

Imties reprezentavimas

Populiacijos elementai į imtį gali būti atrenkami įvairiais būdais. Tačiau pagrindinai nagrinėsime tik visiškai atsitiktines imtis.
Vienas iš svarbiausių imties parinkimo reikalavimų – imties reprezentatyvumas. Imtis reprezentatyvi, jei ji teisingai atspindi tiriamo kintamojo galimų reikšmių proporcijas populiacijoje. Reprezentatyvumas lemia, ar ištyrus imtį galima padaryti patikimas išvadas apie visą populiaciją.
Reprezentatyvumas glaudžiai susijęs su imties didumu. Jeigu imtis apima beveik visą populiaciją, tai ji labai reprezentatyvi. Kuri populiacijos dalis pateko į imtį, nurodo koeficientas K, kuris apibrėžiamas tik baigtinėms populiacijoms:

K = (n/N) · 100%

Populiacija ir imtis

Didinant imtį, galima padaryti patikimesnes išvadas, bet taip būna ne visada. Retai naudojamos labai didelės imtys, nes panašaus patikimumo informaciją galima gauti ir iš vidutinio didumo imčių.
Apibrėžus populiaciją ir iš jos parinkus imtį, toliau gauti duomenys sisteminami, pavyzdžiui, nustatomas didžiausias tikrintų įmonių pelnas ir pan. Susisteminti duomenys – informacijos “koncentratas”, leidžiantis ne tik lengviau suvokti situaciją, bet ir padedantis iškelti reikalingas hipotezes.

Išvados

Susisteminus duomenis toliau atliekama sudėtingesnė statistinė analizė. Dažniausiai į imtį elementai patenka atsitiktinai. Todėl ir visi duomenys ir gauti rezultatai taip pat yra atsitiktiniai. Todėl reikia atsitiktinumą skaitiškai įvertinti ir į gautą įvertį atsižvelgti. Tam yra parenkamas duomenis atitinkantis matematinis modelis, kurio pagalba ir padaromos išvados apie visą populiaciją.

Statistinio tyrimo eiga

Populiacijos parinkimas

Imties sudarymas

Pasirinkto požymio matavimas

Duomenų sisteminimas

Statistinio modelio parinkimas

Išvados apie visą populiaciją

Imčių sudarymo būdai

Populiacijos elementai tyrimui parenkami ne bet kaip, o iš anksto pasirinktu imties sudarymo būdu. Atliekant statistinius tyrimus, domina išvados apie visą populiaciją, todėl galima teigti, kad svarbiausia kiekvienos imties savybė yra jos reprezentatyvumas. Tačiau, kaip jau minėta, praktiniams tyrimams yra svarbi ir imties kaina, elementų atrankos į imtį paprastumas, laikas, reikalingas imčiai sudaryti.

Parenkant kiekvienos imties elementus, egzistuoja tam tikras atsitiktinumas. Tačiau kartais šis atsitiktinumas visiškai subjektyvus. Taip sudarytos imtys vadinamos netikimybinėmis imtimis.
Kitoms imtims atsitiktinumas yra griežtai apibrėžtas – kiekvieno elemento galimybė patekti į imtį nusakoma tam tikra tikimybe. Tokios imtys vadinamos tikimybinėmis imtimis.

Netikimybinės imtys. Ekspertinė imtis

Ekspertinė arba tikslinė imtis: elementai į imtį įtraukiami atsižvelgus į ekspertų nuomonę. Taip sudarytos imtys yra labai subjektyvios, todėl nelabai galima palyginti keleto taip sudarytų imčių. Tokios imtys yra nereprezentatyvios ir jų rezultatų neįmanoma apibendrinti visai populiacijai.
Imtis sudaro ekspertų parinkti „tipiniai“ populiacijos elementai. Pavyzdžiui, parenkamas tipinis miestas ir kaimas, norint ištirti visos šalies miesto ir kaimo gyventojus. Tokio tyrimo rezultatai bus subjektyvūs, nes ekspertų nuomonės dažnai skiriasi dėl to, kokius populiacijos elementus laikyti tipiniais. Būtent tikslinės imtys buvo imamos 1952–1991 m. atliekant pirmąjį oficialiosios statistikos imčių tyrimą Lietuvoje namų ūkių biudžetų tyrimą.

Netikimybinės imtys. Kvotinė imtis

Kvotinė imtis: populiacija suskaidoma į dalis pagal kuriuos nors tyrėjų pasirinktus požymius, tarkime, pagal demografinius rodiklius: amžių, lytį, gyvenamąją vietą, tautybę. Imtis sudaroma taip, kad dalis imties elementų, turinčių požymį, būtų lygi daliai visos populiacijos elementų, turinčių tą patį požymį.
Pavyzdžiui, numatoma, kad imtį sudarys 86 lietuviai, 7 lenkai, 5 rusai, 1 baltarusis ir 1 ukrainietis.

1935 m. kvotinę imtį pradėjo taikyti amerikiečių sociologas George Gallup, atlikdamas sociologinius tyrimus. Kvotinis ėmimas – tai bandymas sudaryti imtį, kuri atitiktų visos populiacijos sudėtį pagal tam tikrus požymius: gyventojų imtyje turi būti tam tikras skaičius moterų ir vyrų, jaunų ir senų žmonių, išsilavinusių ir mažamokslių, gyvenančių mieste ir kaime ir pan. Kiekvienos grupės narių imama tiek, kad būtų išlaikytos tokios pat proporcijos, kokios yra visoje gyventojų populiacijoje. Tai populiacijos charakteristikai, į kurią buvo atsižvelgta, renkant imtį, kvotinė imtis gali būti tinkama, ir įverčiai visai populiacijai bus tikslus.
Tačiau niekas tikrai nežino, kurios ir kiek populiacijos charakteristikų yra svarbios. Todėl parametrui, priklausančiam nuo požymio, į kurį nebuvo atsižvelgta renkant imtį, įvertis gali būti nepatikimas.
Sociologinių tyrimų patirtis rodo, kad gyventojų nuomonės tyrimuose kvotinių imčių taikymas duoda panašius rezultatus kaip ir tikimybinių. Tačiau, pavyzdžiui, tiriant gyventojų pajamas, kvotinės imtys nepasiteisina.

Netikimybinės imtys. Proginė imtis

Proginė arba patogioji imtis: Į imtį įtraukiami pirmi pasitaikę populiacijos elementai arba lengviausiai prieinama populiacijos dalis. Sudarant tokią imtį, daug lemia atsitiktinumas, kurio negalima aprašyti paprastais matematiniais modeliais ir kaip nors juos įvertinti. Remiantis iš tokios imties gautais rezultatais, negalima daryti statistinių išvadų apie visą populiaciją.
Tokia imtis visiškai nereprezentatyvi. Pavyzdys: anglies mėginių imtis iš atviro vagono gali būti paimta nuo vagono viršaus.

Netikimybinės imtys

Pagavimo, paleidimo ir pakartotinio pagavimo principu pagrįsta imtis. Tai tokia imtis, kai judantys populiacijos elementai (pavyzdžiui, žuvys, paukščiai) pagaunami, pažymimi, paleidžiami ir pakartotinai gaudomi. Imtį sudaro tiesiog pakartotinai pagauti elementai. Tokioje imtyje skaičiuojami žymėtieji elementai ir, remiantis šios imties duomenimis, vertinami populiacijos parametrai.
Savanoriškoji imtis gali būti taikoma, pavyzdžiui, kai tiriamajam tyrimas gali būti nemalonus ar reikia tam tikrų pastangų, norint atsakyti į klausimus.

Tinkamai taikomas bet kuris iš minėtų metodų gali duoti gerus rezultatus. Tačiau jie nėra tikimybiniai, ir iš netikimybinių imčių gautų įverčių paklaidos negali būti statistiškai įvertintos. Vienintelis būdas įsitikinti, ar tinkami šie metodai, yra rasti tokią situaciją, kuriai esant žinomi visos populiacijos duomenys, ir juos palyginti su tyrimo rezultatais. Tačiau net ir patikrinę metodo tinkamumą vienam tokiam tyrimui, negalime būti tikri, kad jis bus tinkamas ir kitam tyrimui.

Sistemingoji imtis

Sisteminis ėmimas tai toks ėmimas, kai iš kuria nors tvarka sudaryto populiacijos elementų sąrašo, atsitiktinai pasirinkus pradžią, kiekvienas q-asis elementas yra išrenkamas į imtį. Pavyzdžiui, daugelis gyventojų sąrašų būna sudaryti, išrikiavus pavardes abėcėlės tvarka. Sudarant sisteminę imtį pirmasis imties elementas išrenkamas atsitiktinai iš pirmųjų q sąrašo elementų, o likusieji imties elementai vienareikšmiškai nustatomi vis pridedant po q prie pirmuoju išrinkto elemento numerio iki pat sąrašo pabaigos. Tokią imtį išrinkti nesunku.

Sisteminis ėmimas kartais gali būti net efektyvesnis už paprastąjį atsitiktinį ėmimą, jei gerai žinoma populiacijos struktūra ir jei yra ryšys tarp ėmimo sąrašo eilės tvarkos ir tyrimo kintamojo.
Kartais tiriamos populiacijos elementai gali judėti arba, laikui bėgant, kisti. Gali būti, kad populiacijos elementai atsiranda ir išnyksta. Tada sudaryti ėmimo sąrašą sunku, o kartais net neįmanoma. Pvz, tiriamą populiaciją gali sudaryti pacientai, atvykę į greitosios pagalbos ligoninės priimamąjį; užsienio piliečiai, atvykę į Lietuvą per tam tikrą laikotarpį; telefonų skambučiai, ateinantys į telefonų stotį per tam tikrą laikotarpį. Tokioms populiacijoms tirti negalima naudoti tradicinių imčių planų, tokių kaip paprastoji atsitiktinė ar sluoksninė imtis. Net lizdinio ėmimo gali būti neįmanoma taikyti, nes elementai lizde būna trumpiau, negu reikia laiko informacijai iš jų surinkti. Sisteminis ėmimas ir įvairios jo modifikacijos – tai imties planai, kurie gali tikti panašiose situacijose.

Sluoksninė imtis

Sluoksninė imtis. Visa populiacija suskirstoma į sluoksnius. Kiekviename sluoksnyje naudojamas paprastosios atsitiktinės grąžintinės imties sudarymo būdas.

Pavyzdys. Žinoma, kad populiacijos tyrimo kintamojo reikšmės tam tikrose populiacijos dalyse yra skirtingo dydžio. Iš patirties žinoma, kad vyrai vidutiniškai uždirba daugiau už moteris, teisėjai daugiau negu mokytojai ir pan.

Tarkime, kad tiriama ūkininkų populiacija susideda iš 8 elementų, kurių grūdinių kultūrų pasėlių plotai nežinomi, ir norima atlikti tyrimą, siekiant įvertinti grūdinių kultūrų pasėlių plotų sumą populiacijoje. Renkant paprastąją atsitiktinę keturių elementų imtį iš visos populiacijos, gali atsitikti taip, kad į ją pateks pirmieji keturi mažieji ūkiai, ir pasėlių plotų sumos įvertis bus gerokai mažesnis negu jo tikroji reikšmė. Tikslesnio įverčio galima tikėtis išrinkus tokią tikimybinę imtį, kurioje yra ir mažų, ir didelių ūkių. Todėl galima bandyti suskaidyti populiaciją pagal žemės ūkio naudmenas į dvi dalis – į mažuosius bei didžiuosius ūkius – ir kiekvienoje iš šių dalių nepriklausomai viena nuo kitos išrinkti dvi imtis ir įvertinti šiose dalyse grūdinių kultūrų pasėlių plotų sumas atskirai. Šiuos įverčius sudėję gautume visos populiacijos grūdinių kultūrų pasėlių ploto įvertį.

Koks tokio ėmimo tikslas? Kiekvieną kartą, atliekant imčių tyrimą, yra siekiama kuo mažesnėmis išlaidomis gauti kuo tikslesnę informaciją. Gauti kuo tikslesnę informaciją reiškia gauti tokį įvertinį, kurio galimų reikšmių sklaida, kintant galimoms imtims, būtų kuo mažesnė, t. y. įvertinio dispersija būtų kuo mažesnė.
Kartais reikia atskirų populiacijos sričių parametrų įverčių. Sakykime, norime sužinoti gyventojų nuomonę apie išlaidų sveikatos priežiūrai padidinimą kiekviename iš keturių miestų atskirai. Pasiūlyta sluoksninė imtis leistų taip parinkti imties dydžius miestuose, kad būtų galima gauti reikiamo tikslumo įverčius. Gali prireikti ir kaimo vietovių atskirų dalių įverčių, o nepagalvojus apie tai iš anksto, vėliau gali pasirodyti, kad iš viso nėra tos dalies imties elementų. Vadinasi, tokiu atveju, jau planuojant tyrimą, dar ir kaimo vietoves būtų galima taip suskaidyti į sluoksnius, kad turėtume imties elementų visose populiacijos srityse, kur tik bus reikalingi įverčiai.

Sluoksninė imtis sudaro galimybę išvengti visiškai blogų imčių, kurios gali pasitaikyti, naudojant paprastąją atsitiktinę imtį visoje populiacijoje.
Pagrindinės priežastys, skatinančios taikyti sluoksninį ėmimą:

  1. Populiacijos skaidymas į sluoksnius, kuriuos sudaro panašūs elementai, leidžia išvengti visiškai blogų imčių ir tikėtis tikslesnių įverčių.
  2. Tinkamai parinkus sluoksnius, galima sumažinti tyrimo išlaidas.
  3. Jei reikia gauti įverčius populiacijos srityse, tai skaidant populiaciją į sluoksnius, galima sritis laikyti  sluoksniais, taip užtikrinant jose reikiamo dydžio imtį ir reikiamą įverčių tikslumą.
  4. Supaprastėja tyrimo organizavimas ir vykdymas. Bendras reikalavimas sluoksninėms imtims: populiacija turi būti nevienalytė (heterogeniška) sluoksnių atžvilgiu ir vienalytė (homogeniška) sluoksnių viduje.

Lizdinė imtis

Lizdinė imtis. Visa populiacija suskirstoma į panašias pagal tam tikrą požymį grupes – lizdus (klasterius). Iš visų lizdų aibės paprastosios atsitiktinės imties būdu parenkama dalis lizdų. Į imtį pakliūna visi atrinktųjų lizdų elementai.

Tiriant gyventojų populiaciją, lizdais gali būti laikomi miestai, miestų rajonai, daugiabučiai namai, kaimai, vieno namų ūkio nariai, mokyklos, mokyklų klasės.
Pavyzdžiui, yra tiriama šalies kaimo gyventojų populiacija. Tarkime, turime visų kaimų sąrašą ir žinome, kuriame kaime gyvena kiekvienas populiacijos elementas. Iš šio kaimų sąrašo renkama kurios nors rūšies kaimų imtis ir apklausiami visi išrinktų kaimų gyventojai. Tarkime, kad norime įvertinti žvėrių skaičių miške. Tyrimas gali būti planuojamas taip: miškas suskirstomas į sektorius, pagal kokį nors imties planą išrenkama sektorių imtis ir mus dominantys žvėrys skaičiuojami išrinktuose sektoriuose.

Lizdinis ėmimas gali būti taikomas, kai nėra populiacijos elementų sąrašo arba kai juo pasinaudoti per brangu, tačiau galima sudaryti kuriuo nors būdu sukonstruotų lizdų sąrašą.
Lizdinė imtis gali būti renkama, siekiant sumažinti tyrimo kainą, klausėjų transporto išlaidas ir palengvinti jų darbą. Lizdinis ėmimas taikomas atliekant visuomenės nuomonės, rinkos tyrimus.
Bendras reikalavimas lizdinėms imtims: populiacija lizdų atžvilgiu turi būti homogeniška, o lizdų viduje heterogeniška.

Lizdinė imtis gali būti renkama, siekiant sumažinti tyrimo kainą, klausėjų transporto išlaidas ir palengvinti jų darbą. Pavyzdžiui, norint atlikti Lietuvos kaimo gyventojų paprastosios atsitiktinės imties apklausą, reikėtų daugiau lėšų, negu apklausiant tokį pat skaičių žmonių, kurie gyvena keliuose, nors ir toli vienas nuo kito esančiuose kaimuose.
Neturint Lietuvos moksleivių sąrašo arba turint netikslų sąrašą galima naudotis mokyklų, klasių sąrašais ir rinkti lizdinę imtį. Tokie ir panašūs imčių planai naudojami atliekant edukologijos tyrimus. Lizdinis ėmimas taikomas atliekant visuomenės nuomonės, rinkos tyrimus.

Esminis sluoksninio ir lizdinio ėmimo skirtumas yra tas, kad sluoksninio ėmimo atveju imtis renkama iš kiekvieno sluoksnio (kiekvienos populiacijos dalies), o lizdinio ėmimo atveju – renkama lizdų (populiacijų dalių) imtis ir imties elementais laikomi visų išrinktų populiacijos dalių elementai.

Paprastoji atsitiktinė imtis

Paprastoji atsitiktinė imtis, arba paprastoji atsitiktinė negrąžintinė imtis – tai tokia n skirtingų elementų imtis iš N dydžio baigtinės populiacijos, kai bet kuris n skirtingų elementų rinkinys turi vienodą tikimybę būti išrinktas.

Paprastoji atsitiktinė grąžintinė imtis

Paprastoji atsitiktinė grąžintinė imtis. Kiekvienu imties sudarymo momentu visiems populiacijos elementams patekti į imtį galimybės yra vienodos.
Klasikinė vienodas galimybes teikianti situacija yra tokia:
1) visi populiacijos elementai sunumeruojami;
2) elementų numeriai užrašomi ant rutulių;
3) rutuliai sudedami į dėžę ir gerai sumaišomi;
4) ištraukiamas pirmas pasitaikęs rutulys;
5) elementas, atitinkantis ant rutulio užrašytąjį numerį, įtraukiamas į imtį.

Paprastoji atsitiktinė imtis

Paprastosios atsitiktinės imties išrinkimo būdų, arba schemų, yra daug. Nuoseklus išrinkimas. Paprastąją atsitiktinę imtį galima išrinkti taip: iš N dydžio populiacijos atsitiktinai su tikimybėmis, lygiomis 1/N, išrenkamas vienas populiacijos elementas ir į populiaciją nebegrąžinamas. Iš likusių N-1 populiacijos elementų su tikimybėmis, lygiomis 1/(N-1), vėl atsitiktinai išrenkamas populiacijos elementas ir atgal nebegrąžinamas. Procesą pakartojus n kartų, bus išrinkta n dydžio imtis. Taip išrinktas n elementų rinkinys yra paprastoji atsitiktinė imtis.

Paprastosios atsitiktinės imties išrinkimas, naudojant atsitiktinių skaičių lentelę. Naudodamiesi atsitiktinių skaičių lentele, išrenkame skaičius, žyminčius paprastosios atsitiktinės imties elementų numerius. Pasirenkama bet kuri lentelės vieta ir nuo jos žemyn imami skaičiai. Naudojantis lentele, gauti pasikartojimai ir skaičiai, didesni už N, yra ignoruojami. Skaičiai renkami tol, kol gaunama n skirtingų imties elementų numerių.
Paprastąją atsitiktinę imtį tokiu pat būdu galima išrinkti skaičius lentelėje imant nuo pasirinktosios vietos ir einant į viršų, kairę arba dešinę.

Imties išrinkimas, naudojant atsitiktinių skaičių generatorių. Atsitiktinių skaičių generatorius – tai kompiuterio programa, kuri modeliuoja tolygiai intervale [0,1) pasiskirsčiusio atsitiktinio dydžio ξ reikšmes. Tokias programas turi daugelis programavimo sistemų.
Norėdami su vienodomis tikimybėmis atsitiktinai išrinkti vieną elementą iš N dydžio populiacijos, intervalą [0,1) suskaidome į N lygių nesikertančių dalių. Sunumeruojame jas nuo 1 iki N ir kiekvienai iš jų priskiriame populiacijos elementą su tuo pačiu numeriu. Modeliuojama tolygiai intervale [0,1) pasiskirsčiusio atsitiktinio dydžio ξ reikšmė ξ1. Jei ξ1 priklauso i-ajam intervalui [(i-1)/N, i/N), tai i-ąjį populiacijos elementą laikome išrinktu su rinkimo tikimybe l/N.

Tikimybinės imtys

Paprastoji atsitiktinė imtis, kai elementai negrąžinami, vadinama negrąžintinė imtis. Praktiškai beveik visada imtys sudaromos be grąžinimų, bet taikomi grąžintinių imčių tyrimo metodai. Jeigu populiacija didelė, tai vieno ar kelių elementų pašalinimas tiriamam reiškiniui įtakos neturi, tuo pačiu esminių klaidų nepadaroma.

Imties paklaidos

Imtys neapima visos populiacijos. Dažniausiai, naudodamiesi imties duomenų aibe, skaitiškai įvertiname nežinomą populiacijos elementą. Skirtumas tarp tikrosios parametro reikšmės ir apskaičiuotosios iš imties duomenų vadinamas atsitiktine imties paklaida. Tarkime, pasirinkome tikimybinį imties sudarymo būdą. Elementai į tokias imtis patenka atsitiktinai. Todėl tuo pačiu metodu sudarę kelias vienodo dydžio tikimybines imtis, galima tikėtis, kad jų elementai nesutaps. Toks imties kintamumas sąlygoja ir atsitiktinę rezultatų paklaidą.

Atsitiktinė paklaida priklauso nuo imties didumo. Kuo didesnė imtis, tuo mažesnė atsitiktinė paklaida. Tačiau pasiekus tam tikrą imties didumą, atsitiktinė paklaida pradeda mažėti labai lėtai. Yra ir kitokių imties paklaidų, iškreipiančių rezultatus, kartu ir statistines išvadas. Tai paklaidos susijusios su “matavimo instrumento” netobulumu vadinamos sistemingosiomis paklaidomis. Svarbiausias šių paklaidų šaltinis – atsakymų stoka.

Socialiniuose moksluose nustatant klausimo “neatsakymo laipsnį”, naudojamasi vadinamuoju atsakymo lygiu. Jeigu atsakymų lygiai maži, tai galima įtarti, kad netinkamai sudarytas klausimynas.

Sistemingosios paklaidos šaltiniai:

  1. Respondentai meluoja.
  2. Duomenų rinkėjo asmenybė turi įtakos rezultatams.
  3. Klausimai nevienareikšmiškai suformuluoti, t.y. jie skirtingai suprantami.
  4. Respondentai nežino, ko jų klausia.
  5. Klausimas lemia norimą atsakymą.

Sistemingoji paklaida nepriklauso nuo imties didumo.

Ėmimo sąrašo klaidos

Imčiai išrinkti dažnai naudojami ėmimo sąrašai – tiriamos populiacijos elementų sąrašai. Ėmimo sąrašas gali būti netikslus: jis gali būti nepilnas arba (ir) perteklinis, t.y. jame gali trūkti kai kurių tiriamos populiacijos elementų arba gali būti tokių elementų, kurie tiriamai populiacijai nepriklauso. Tokiais atvejais statistiniai įverčiai apibūdina ne tą populiaciją, kurią norime tirti. Pavyzdžiui, visuomenės nuomonės apklausai naudodami telefonų sąrašus, negalėsime ištirti neturinčių telefonų gyventojų dalies. Ėmimo sąraše gali būti ir techninių klaidų. Dėl jų kai kurie populiacijos elementai gali būti tiesiog nepasiekiami. Dėl neteisingai nurodyto įmonės ar gyventojo adreso galbūt negalėsime jų surasti, ir šie į imtį išrinkti elementai nebus apklausti.

Neatsakymai į apklausas

Jų priežastys būna įvairios. Į imtį išrinktas populiacijos elementas gali būti nepasiekiamas dėl ėmimo sąrašo klaidų, pavyzdžiui, klaidingai nurodyto adreso. Respondentas gali nenorėti dalyvauti apklausoje, o gali ir negalėti (žmogus gali sirgti ir gulėti ligoninėje, atostogauti, būti išvykęs ir pan.). Užpildytą klausimyną klausėjas gali netyčia pamesti arba klausimynas gali būti netinkamas tolesnei analizei dėl jame esančių klaidų. Neatsakę į apklausą imties elementai dažniausiai skiriasi nuo tų, kurie dalyvavo apklausoje. Pavyzdžiui, atliekant socialinę apklausą gyventojų namuose, sunkiau juose bus rasti aktyvų ir judrų gyvenimą mėgstančius žmones, mažesnių šeimų narius, bet juose dažniau aptinkami pensinio amžiaus žmonės arba mažus vaikus auginančios moterys. Apklausiant įmones, sėkmingai dirbančios įmonės dažniau užpildo klausimynus negu mažos ir ūkinių problemų turinčios įmonės.

Matavimo klaidos

Tai klaidos, kurias padaro klausėjas ar respondentas, taip pat tokios klaidos, kurios atsiranda dėl klausimyno trūkumų ar apklausos vykdymo būdo. Tyrimo duomenų kokybei gali turėti įtakos klausėjo kvalifikacija, klausiamojo būdo ypatybės, jo nenoras atsakyti į klausimą, sveikatos būklė. Svarbi klausimyno kokybė. Atsakymui gali turėti įtakos pasirinkta klausimo formuluotė, klausimų pateikimo eilės tvarka. Statistinio tyrimo rezultatai gali priklausyti ir nuo pasirinkto apklausos būdo (apklausa telefonu, paštu, internetu, pasitelkiant klausėjus).

Techninės, arba duomenų apdorojimo, klaidos

Tai duomenų įvedimo, kodavimo, redagavimo klaidos. Paklaidų stengiamasi išvengti arba bent jau jas sumažinti, atidžiai planuojant ir tvarkingai atliekant tyrimą. Paprastai galima tik įtarti esant šių rūšių sistemingąją paklaidą, bet jos objektyviai įvertinti, skirtingai nuo ėmimo paklaidos, dažniausiai negalima. Imčių teorijoje šios paklaidos nagrinėjamos kaip įvertinio poslinkio šaltinis, t.y. sistemingosios paklaidos šaltinis.

Porinės imtys

Tai dvi imtys, kurių elementai nesusiję (nepriklausomi), bet kiekvienas pirmos imties elementas turi savo priklausomą “porininką” antrojoje imtyje. Būdingas eksperimentas: imties elementus tiriame skirtingais laiko momentais. Pavyzdžiui, viena imtis – žmonių grupė iki dietos, o antroji – tie patys žmonės po dietos.
Dažnai porinės imtys sudaromos tuo pačiu laiko momentu. Tuomet pirmajai, atsitiktinei imčiai, sudaroma antroji imtis. Kiekvienam pirmosios imties elementui parenkamas kaip nors su juo susijęs “porininkas”. Tiriant sutuoktinių poras, vieną imtį sudarys vyrai, antrą – jų žmonos. Priklausomybė tarp abiejų imčių gali būti tiek labai stipri, tiek vidutinė.

Kintamieji

Duomenų analizės metodo parinkimas labai priklauso nuo jų prigimties. Kaip klasifikuojami duomenys?
Populiacijos, kartu ir imties, elementus vienija tiriamasis požymis. Matuodami šį požymį, gauname tam tikrą dydį, kuris kinta kartu su imties nariais. Šį dydį vadiname kintamuoju. Imties duomenų aibė – kintamojo reikšmių aibė (visų galimų kintamojo reikšmių poaibis). Išmatavę visą populiaciją, gautume visas kintamojo reikšmes.

Pagal matuojamojo reiškinio prigimtį kintamieji skirstomi į kiekybinius ir kokybinius:

Kiekybiniai Kokybiniai
kiek tiriamo požymio turi
populiacijos elementas
koks objektas, kokia savybe jis
pasižymi
Laikas, aukštis, metinė infliacija,
sesijos pažymių vidurkis ir pan.
Spalva, lytis, rasė, automobilio
markė ir pan.

Kiekybiniai kintamieji dar savo ruožtu skirstomi į tolydžiuosius ir diskrečiuosius. Kiekybinis kintamasis vadinamas tolydžiuoju, jei jo reikšmių skirtumas yra kiek norima mažas. Pvz. laikas, masė, aukštis.
Kiekybinis kintamasis vadinamas diskrečiuoju, jei jo reikšmių skirtumas yra ne mažesnis už tam tikrą minimalų pokytį. Pvz. šeimos gausumas, banko klientų skaičius. Kokybinių ir kiekybinių kintamųjų analizės metodai traktuojami skirtingai. Pavyzdžiui, kokybiniai kintamieji negali būti sudedami, dauginami, vidurkinami.

Matavimų skalės

Duomenys, kartu ir kintamieji, yra klasifikuojami ir atsižvelgiant į naudotą matavimų skalę. Yra išskiriamos keturios kintamųjų matavimo skalės:

  • Pavadinimų.
  • Rangų.
  • Intervalų.
  • Santykių.

Pavadinimų skalė

Kintamieji, kurie matuojami pavadinimų skalėje, vadinami nominaliaisiais kintamaisiais. Pagal kintamojo reikšmes, gautas naudojant pavadinimų skalę, imties objektus galima tik klasifikuoti. Kiekvienas imties (populiacijos) elementas turi turėti jam tinkamą kategoriją. Kategorijos turi aiškiai skirtis tarpusavyje. Matavimas susijęs su objektų klasifikacija – vyras/moteris, sveikas/sergantis, ekonomistas/informatikas/istorikas. Kategorijas dažnai žymime skaičiais, bet šie skaičiai turi tik “etikečių” prasmę:
pvz.: ekonomistas – 1, informatikas – 2, istorikas – 3.
Kategorijas galima tik sulyginti: 1 = 1, 2 = 2, 3  1 ir t.t.
Aritmetiniai veiksmai ir palyginimai „mažiau“, „daugiau“ neturi prasmės pvz.:
1 + 2 = ?, 2 < 3 ?

Rangų skalė

Ši skalė dar vadinama tvarkos skale. Ji naudojama tada, kai galima nustatyti objektų tiriamo požymio skirtumus ir pagal tai objektus išrikiuoti į eilę. Kintamieji, kurie matuojami rangų skalėje, vadinami ranginiais kintamaisiais. Pagal ranginių kintamųjų reikšmes objektai gali būti sugrupuoti matuojamos savybės didėjimo ar mažėjimo tvarka: sporto varžybose – galutinė sportininkų rikiuotė.
Kartais ranginių kintamųjų reikšmės įvardijamos kaip kategorijos. Jas žymime skaičiais. Skaičiai yra ne tik etiketės, bet žymi savybės intensyvumo pakopą, pvz.: bakalauras – 1, magistras – 2, mokslų daktaras – 3.
Kategorijas galima sulyginti ir palyginti pagal dydį: 1 = 1, 2 < 3, 3 > 1 ir t.t. Aritmetiniai veiksmai neturi prasmės, nes neaiškūs atstumai tarp kategorijų (1 + 1 = ? 3 – 2 = 2 – 1).

Kategoriniai kintamieji

Ranginiai ir nominalieji kintamieji dar vadinami kategoriniais. Sąvokos “kokybinis” ir “kategorinis” yra ekvivalenčios.

Intervalų skalė

Objektus galima ne tik klasifikuoti, tvarkyti, bet ir kiekybiškai įvertinti skirtumus tarp klasių. Intervaliniai duomenys visada yra skaitiniai. Kiekybinis matavimas, bet nėra absoliutaus nulio Intelekto testo rezultatas, kalendorinis laikas; Temperatūra Celsijaus arba Farenheito laipsniais.
To paties ilgio intervalai yra lygūs matuojamos savybės atžvilgiu: pvz.: 8ºC – 6ºC = 4ºC – 2ºC = 2ºC
Su kintamojo reikšmėmis galima atlikti aritmetinius veiksmus (sudėti, atimti, skaičiuoti vidurkį, dauginti).

Santykių skalė

Turi absoliutų (objektyvų) nulį, paprastai reiškiantį visišką matuojamos savybės nebuvimą. Tokiu būdu rezultatai visuomet neneigiami skaičiai.

  • dauguma fizikinių skalių (ilgis, masė, greitis ir t.t.);
  • atlyginimas litais.

Skaičių, gautų matuojant požymius, santykis parodo kiekybinį matuojamojo požymio santykį, pvz.: 8 kg / 4 kg = 6 kg / 3 kg = 2 (kartai) Galimi visi aritmetiniai veiksmai su skalės reikšmėmis.

Kintamieji ir skalės

Kiekybiniams kintamiesiems matuoti naudojama intervalų arba santykių skalė. Kokybiniams kintamiesiems matuoti naudojama pavadinimų arba rangų skalė. Iš kiekybinių tolydžiųjų kintamųjų galima gauti ranginius, o iš šių – nominaliuosius kintamuosius. Tačiau taip transformuojant duomenis prarandama dalis informacijos.

Informatyvumas ir tikslumas

Matavimas santykių skale yra informatyviausias ir naudingiausias. Gauti matavimo rezultatai turi visas skaičių savybes. Galime naudoti visą realiųjų skaičių matematiką. Matavimas intervalų skale nedaug kuo skiriasi nuo matavimo santykių skale. Pvz., statistiškai apdorojant duomenis beveik visi metodai, tinkami santykių skalei, tinka ir intervalų skalei. Rangų ir, ypač pavadinimų, skalės aiškiai nusileidžia naudingumu intervalų ir santykių skalėms. Tačiau dažnai nėra kito pasirinkimo. Aukštesnio lygio matavimo rezultatą visada galima pervesti į žemesnio lygio matavimą, bet atvirkščiai padaryti neįmanoma.

Post navigation

  1 comment for “Pradinės statistikos sąvokos

  1. Ricardas
    gruodžio 19, 2016 at 2:09 pm

    Jei reprezantyvumo koeficientas tarkim – 4,1 (220000/900).
    Tai ka reiskia? Kad tai atitinka 4,1% populiacijos nuomone?
    Tada ka tai reiskia tyrimo kontekste? Informatyvu ar ne? Tyrimas ivykes ar neivykes?
    Ka su tuo daryti, kaip interpretuoti?

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *