Duomenų sklaidos charakteristikos

Pagrindinės sklaidos charakteristikos yra:

  1. Duomenų aibės plotis,
  2. Vidutinis nuokrypis,
  3. Dispersija,
  4. Standartinis nuokrypis,
  5. Kvartilių skirtumas,
  6. Kitimo koeficientas.

Šios charakteristikos skaičiuojamos tik kiekybiniams duomenims.

Dispersija

Imties dispersija (variance) parodo duomenų sklaidą apie vidurkį.

Imties dispersija

statistika

Populiacijos dispersija

statistika

Dispersija – viena populiariausių sklaidos charakteristikų. Jos privalumas yra tas, kad atsižvelgiama į visus duomenis ir pateikiamas vidutinis skirtumų nuo vidurkio kvadratas.

Iš apibrėžimo matyti, kad dispersija visuomet neneigiama. Dispersija lygi 0, kai visi stebiniai lygūs.

Sugrupuotiems duomenims dispersija skaičiuojama pagal formulę:

statistika

Dėmuo h2/12 vadinamas Šepardo pataisa.

Dispersijos savybės

 

statistika

Pridėjus (atėmus) prie kiekvieno stebėjimo tą patį skaičių, dispersija nesikeičia:

statistika

Visas stebėjimo reikšmes padauginus iš to paties skaičiaus, pradinių reikšmių dispersija yra dauginama iš šio skaičiaus kvadrato:

statistika

Standartinis nuokrypis

Standartinis nuokrypis (standard deviation) yra dažniausiai taikomas sklaidos matas. Jis gaunamas ištraukus kvadratinę šaknį iš dispersijos.

Imties standartinis nuokrypis

statistika

Populiacijos standartinis nuokrypis

statistika

Kadangi standartinis nuokrypis matuojamas tokiais pačiais vienetais kaip ir patys duomenys, tai jį lengviau interpretuoti ir lyginti su duomenimis.

Kita svarbi standartinio nuokrypio naudojimo priežastis yra duomenų koncentracijos apie vidurkį tiesioginė priklausomybė nuo standartinio nuokrypio.

Kitimo koeficientas

Kitimo (variacijos) koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius (x > 0). Kitimo koeficientas yra bedimensis (neturintis matavimo vienetų) dydis.

Naudojamas lyginant skirtingų duomenų aibių sklaidas. Gali būti matuojamas procentais, tada gauta reikšmė pagal formulę dauginama iš 100 %.

Imties kitimo koeficientas

statistika

Procentinis imties kitimo koeficientas

statistika

Populiacijos kitimo koeficientas

statistika

Procentinis populiacijos kitimo koeficientas

statistika

Kitimo koeficiento pavyzdys

Svarbi akcijų charakteristika yra kainos stabilumas. Tarkime, tris mėnesius stebėjus akcijų kainų kitimą, buvo nustatyta vidutinė firmos A akcijų kaina – 200 Lt ir jų standartinis nuokrypis – 40 Lt. Firmos B vidutinė akcijų kaina – 48 Lt, standartinis nuokrypis – 12 Lt.

Firmos A akcijų kainos sklaida didesnė nei firmos B. Tačiau labai skirtingi kainų vidurkiai. Galima paskaičiuoti abiejų firmų kainų kitimo koeficientus:

statistika

Taigi vidurkio atžvilgiu firmos A akcijos stabilesnės už firmos B akcijas.

Duomenų aibės plotis

Paprasčiausia sklaidos charakteristika yra duomenų aibės plotis (range):

statistika

Kvartilių skirtumas

Duomenų aibės plotis yra labai jautri išskirtims (jei yra labai didelių ar labai mažų reikšmių), todėl dažniau skaičiuojamas kvartilių skirtumas (interquartile range):

statistika

Kokybės įvairovės indeksas

Kategoriniams kintamiesiems naudojamas kokybės įvairovės indeksas:

statistika

čia k – kategorijų skaičius, n – stebėjimų skaičius, fj – j-tosios kategorijos stebėjimų skaičius (dažnis). Kokybės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida).

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *