Pagrindinės sklaidos charakteristikos yra:
- Duomenų aibės plotis,
- Vidutinis nuokrypis,
- Dispersija,
- Standartinis nuokrypis,
- Kvartilių skirtumas,
- Kitimo koeficientas.
Šios charakteristikos skaičiuojamos tik kiekybiniams duomenims.
Dispersija
Imties dispersija (variance) parodo duomenų sklaidą apie vidurkį.
Imties dispersija
Populiacijos dispersija
Dispersija – viena populiariausių sklaidos charakteristikų. Jos privalumas yra tas, kad atsižvelgiama į visus duomenis ir pateikiamas vidutinis skirtumų nuo vidurkio kvadratas.
Iš apibrėžimo matyti, kad dispersija visuomet neneigiama. Dispersija lygi 0, kai visi stebiniai lygūs.
Sugrupuotiems duomenims dispersija skaičiuojama pagal formulę:
Dėmuo h2/12 vadinamas Šepardo pataisa.
Dispersijos savybės
Pridėjus (atėmus) prie kiekvieno stebėjimo tą patį skaičių, dispersija nesikeičia:
Visas stebėjimo reikšmes padauginus iš to paties skaičiaus, pradinių reikšmių dispersija yra dauginama iš šio skaičiaus kvadrato:
Standartinis nuokrypis
Standartinis nuokrypis (standard deviation) yra dažniausiai taikomas sklaidos matas. Jis gaunamas ištraukus kvadratinę šaknį iš dispersijos.
Imties standartinis nuokrypis
Populiacijos standartinis nuokrypis
Kadangi standartinis nuokrypis matuojamas tokiais pačiais vienetais kaip ir patys duomenys, tai jį lengviau interpretuoti ir lyginti su duomenimis.
Kita svarbi standartinio nuokrypio naudojimo priežastis yra duomenų koncentracijos apie vidurkį tiesioginė priklausomybė nuo standartinio nuokrypio.
Kitimo koeficientas
Kitimo (variacijos) koeficientas skaičiuojamas tik santykių skalės kintamiesiems, turintiems teigiamus vidurkius (x > 0). Kitimo koeficientas yra bedimensis (neturintis matavimo vienetų) dydis.
Naudojamas lyginant skirtingų duomenų aibių sklaidas. Gali būti matuojamas procentais, tada gauta reikšmė pagal formulę dauginama iš 100 %.
Imties kitimo koeficientas
Procentinis imties kitimo koeficientas
Populiacijos kitimo koeficientas
Procentinis populiacijos kitimo koeficientas
Kitimo koeficiento pavyzdys
Svarbi akcijų charakteristika yra kainos stabilumas. Tarkime, tris mėnesius stebėjus akcijų kainų kitimą, buvo nustatyta vidutinė firmos A akcijų kaina – 200 Lt ir jų standartinis nuokrypis – 40 Lt. Firmos B vidutinė akcijų kaina – 48 Lt, standartinis nuokrypis – 12 Lt.
Firmos A akcijų kainos sklaida didesnė nei firmos B. Tačiau labai skirtingi kainų vidurkiai. Galima paskaičiuoti abiejų firmų kainų kitimo koeficientus:
Taigi vidurkio atžvilgiu firmos A akcijos stabilesnės už firmos B akcijas.
Duomenų aibės plotis
Paprasčiausia sklaidos charakteristika yra duomenų aibės plotis (range):
Kvartilių skirtumas
Duomenų aibės plotis yra labai jautri išskirtims (jei yra labai didelių ar labai mažų reikšmių), todėl dažniau skaičiuojamas kvartilių skirtumas (interquartile range):
Kokybės įvairovės indeksas
Kategoriniams kintamiesiems naudojamas kokybės įvairovės indeksas:
čia k – kategorijų skaičius, n – stebėjimų skaičius, fj – j-tosios kategorijos stebėjimų skaičius (dažnis). Kokybės įvairovės indeksas kinta nuo 0 (nėra reikšmių sklaidos) iki 1 (maksimali reikšmių sklaida).