Sklaida yra paprasta. Dispersijų rūšys

Dispersijos tipai:

Bendra dispersija apibūdina visos populiacijos bruožo kitimą veikiant visiems veiksniams, kurie sukėlė šį kitimą. Ši vertė nustatoma pagal formulę

kur yra visos tiriamosios populiacijos bendrasis aritmetinis vidurkis.

Vidutinė dispersija grupės viduje nurodo atsitiktinį pokytį, kuris gali atsirasti veikiant bet kokiems neatsižvelgtiems veiksniams ir kuris nepriklauso nuo būdingo veiksnio, kuriuo grindžiamas grupavimas. Ši dispersija apskaičiuojama taip: pirmiausia apskaičiuojami atskirų grupių nuokrypiai (), tada apskaičiuojama vidutinė dispersija grupės viduje:

kur n i yra vienetų skaičius grupėje

Tarpgrupinė dispersija(grupinių reikšmių dispersija) apibūdina sistemingą variaciją, t.y. tiriamojo požymio vertės skirtumai, atsirandantys veikiant bruožui-veiksniui, kuris yra grupavimo pagrindas.

kur yra vidutinė atskiros grupės reikšmė.

Visi trys dispersijos tipai yra tarpusavyje susiję: bendra dispersija yra lygi vidutinės grupės vidaus dispersijos ir tarpgrupinės dispersijos sumai:

Savybės:

25 Santykiniai kitimo laipsniai

Virpesių koeficientas

Santykinis tiesinis nuokrypis

Variacijos koeficientas

Koef. Osc. apie atspindi santykinį atributo kraštutinių verčių svyravimą aplink vidurkį. Rel. lin. išjungti. apibūdina absoliučių nuokrypių nuo vidutinės reikšmės ženklo vidutinės reikšmės dalį. Koef. Variacija yra labiausiai paplitęs variacijos matas, naudojamas vidurkių tipiškumui įvertinti.

Statistikoje populiacijos, kurių variacijos koeficientas didesnis nei 30–35%, laikomos nevienalytėmis.

    Paskirstymo serijų reguliarumas. paskirstymo momentai. Paskirstymo formos rodikliai

Variacinėse serijose yra ryšys tarp dažnių ir kintamojo atributo reikšmių: didėjant požymiui, dažnio reikšmė pirmiausia padidėja iki tam tikros ribos, o paskui mažėja. Tokie pokyčiai vadinami paskirstymo modelius.

Pasiskirstymo forma tiriama naudojant asimetrijos ir kurtozės rodiklius. Skaičiuojant šiuos rodiklius, naudojami pasiskirstymo momentai.

K-osios eilės momentas yra atributo reikšmių variantų k-ųjų nuokrypių nuo kokios nors pastovios vertės vidurkis. Momento eiliškumas nustatomas pagal reikšmę k. Analizuodami variacines eilutes, jie apsiriboja pirmųjų keturių užsakymų momentų apskaičiavimu. Skaičiuojant momentus, dažniai arba dažniai gali būti naudojami kaip svoriai. Priklausomai nuo pastovios reikšmės pasirinkimo, yra pradiniai, sąlyginiai ir centriniai momentai.

Paskirstymo formos rodikliai:

Asimetrija(As) rodiklis, apibūdinantis pasiskirstymo asimetrijos laipsnį .

Todėl su (kairiaranke) neigiamu iškrypimu . Su (dešinės pusės) teigiama asimetrija .

Centriniai momentai gali būti naudojami asimetrijai apskaičiuoti. Tada:

,

kur μ 3 yra trečiosios eilės centrinis momentas.

- kurtosis (E į ) charakterizuoja funkcijos grafiko statumą, lyginant su normaliuoju skirstiniu, kurio kitimo stiprumas yra toks pat:

,

kur μ 4 yra centrinis 4 eilės momentas.

    Normalaus paskirstymo dėsnis

Normalaus skirstinio (Gauso skirstinio) pasiskirstymo funkcija yra tokia:

Lūkesčiai – standartinis nuokrypis

Normalus skirstinys yra simetriškas ir jam būdingas toks ryšys: Xav=Me=Mo

Normaliojo skirstinio kurtozė yra 3, o pasvirimas yra 0.

Normalaus pasiskirstymo kreivė yra daugiakampis (simetriška varpo formos tiesi linija)

    Dispersijų rūšys. Nukrypimų pridėjimo taisyklė. Empirinio determinacijos koeficiento esmė.

Jei pradinė populiacija yra suskirstyta į grupes pagal tam tikrą esminį požymį, tada skaičiuojami šie dispersijų tipai:

    Bendra pradinės populiacijos dispersija:

kur yra bendra pradinės populiacijos vidutinė vertė; f yra pradinės populiacijos dažnis. Bendra dispersija apibūdina atskirų požymio verčių nuokrypį nuo bendros pradinės populiacijos vidutinės vertės.

    Skirtumas tarp grupių:

čia j yra grupės skaičius; yra kiekvienos j-osios grupės vidutinė vertė; yra j-osios grupės dažnis. Vidinės grupės dispersijos apibūdina kiekvienos grupės bruožo individualios vertės nuokrypį nuo grupės vidurkio. Iš visų grupės viduje esančių dispersijų vidurkis apskaičiuojamas pagal formulę:, kur yra kiekvienos j-osios grupės vienetų skaičius.

    Tarpgrupinis dispersija:

Tarpgrupinė dispersija apibūdina grupių vidurkių nuokrypį nuo bendro pradinės populiacijos vidurkio.

Nuokrypių pridėjimo taisyklė yra tai, kad bendra pradinės populiacijos dispersija turėtų būti lygi tarpgrupių sumai ir grupės viduje esančių dispersijų vidurkiui:

Empirinis determinacijos koeficientas parodo tiriamo požymio kitimo proporciją dėl grupavimo požymio kitimo ir apskaičiuojama pagal formulę:

    Atskaitos metodas nuo sąlyginio nulio (momentų metodas) vidurkiui ir dispersijai apskaičiuoti

Dispersijos apskaičiavimas momentų metodu pagrįstas formulės ir 3 bei 4 dispersijos savybių panaudojimu.

(3. Jei visos atributo (parinkčių) reikšmės padidinamos (sumažinamos) kokiu nors pastoviu skaičiumi A, tai naujos populiacijos dispersija nepasikeis.

4. Jei visos atributo (parinkčių) reikšmės padidinamos (padauginamos) iš K kartų, kur K yra pastovus skaičius, tai naujos populiacijos dispersija padidės (sumažės) K 2 kartus.

Momentų metodu gauname formulę variacijų eilučių su vienodais intervalais dispersijai apskaičiuoti:

A - sąlyginis nulis, lygus pasirinkimui su didžiausiu dažniu (intervalo su didžiausiu dažniu vidurys)

Vidurkio apskaičiavimas momentų metodu taip pat pagrįstas vidurkio savybių panaudojimu.

    Atrankinio stebėjimo samprata. Ekonominių reiškinių tyrimo atrankiniu metodu etapai

Imtis – tai stebėjimas, kurio metu tiriami ir tiriami ne visi pradinės visumos vienetai, o tik dalis vienetų, o dalies visumos tyrimo rezultatas išplečiamas iki visos pradinės visumos. Aibė, iš kurios iškviečiamas vienetų parinkimas tolesniam tyrimui ir studijoms bendras ir vadinami visi šią aibę apibūdinantys rodikliai bendras.

Vadinamos galimos imties vidurkio nukrypimų nuo bendrojo vidurkio ribos atrankos klaida.

Pasirinktų vienetų rinkinys vadinamas atrankinis ir vadinami visi šią aibę apibūdinantys rodikliai atrankinis.

Atrankinis tyrimas apima šiuos veiksmus:

Tyrimo objekto charakteristika (masiniai ekonominiai reiškiniai). Jei bendra populiacija nedidelė, tada imti nerekomenduojama, būtinas nuolatinis tyrimas;

Mėginio dydžio apskaičiavimas. Svarbu nustatyti optimalų tūrį, kuris leistų mažiausiomis sąnaudomis gauti atrankos paklaidą priimtino diapazono ribose;

Stebėjimo vienetų parinkimo vykdymas, atsižvelgiant į atsitiktinumo, proporcingumo reikalavimus.

Reprezentatyvumo įrodymas, pagrįstas imties paklaidos įvertinimu. Atsitiktinės imties atveju paklaida apskaičiuojama naudojant formules. Tikslinei imčiai reprezentatyvumas vertinamas kokybiniais metodais (lyginimas, eksperimentas);

Mėginio analizė. Jeigu suformuota imtis atitinka reprezentatyvumo reikalavimus, tuomet ji analizuojama naudojant analitinius rodiklius (vidutinį, santykinį ir kt.)

Atsitiktinio dydžio dispersija yra šio kintamojo reikšmių sklaidos matas. Mažas dispersija reiškia, kad reikšmės yra sugrupuotos arti viena kitos. Didelė dispersija rodo stiprią reikšmių sklaidą. Statistikoje vartojama atsitiktinio dydžio sklaidos sąvoka. Pavyzdžiui, jei lyginate dviejų dydžių verčių dispersiją (pvz., pacientų vyrų ir moterų stebėjimų rezultatus), galite patikrinti kai kurių kintamųjų reikšmę. Nuokrypis taip pat naudojamas kuriant statistinius modelius, nes maža dispersija gali būti ženklas, kad pervertinate vertes.

Žingsniai

Imties dispersijos apskaičiavimas

  1. Užrašykite pavyzdines vertes. Daugeliu atvejų statistikams prieinami tik tam tikrų populiacijų pavyzdžiai. Pavyzdžiui, statistikai paprastai neanalizuoja visų Rusijos automobilių populiacijos išlaikymo išlaidų – jie analizuoja atsitiktinę kelių tūkstančių automobilių imtį. Toks pavyzdys padės nustatyti vidutines automobilio išlaidas, tačiau greičiausiai gauta vertė bus toli nuo tikrosios.

    • Pavyzdžiui, paanalizuokime per 6 dienas kavinėje parduotų bandelių skaičių atsitiktine tvarka. Imtis yra tokios formos: 17, 15, 23, 7, 9, 13. Tai yra imtis, o ne visuma, nes neturime duomenų apie parduotas bandeles už kiekvieną kavinės darbo dieną.
    • Jei jums pateikiama populiacija, o ne reikšmių pavyzdys, pereikite prie kito skyriaus.
  2. Užrašykite imties dispersijos apskaičiavimo formulę. Sklaida yra tam tikro dydžio verčių sklaidos matas. Kuo dispersijos reikšmė arčiau nulio, tuo arčiau reikšmės sugrupuojamos. Dirbdami su reikšmių pavyzdžiu, dispersijai apskaičiuoti naudokite šią formulę:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) yra dispersija. Sklaida matuojama kvadratiniais vienetais.
    • x i (\displaystyle x_(i))- kiekviena imties reikšmė.
    • x i (\displaystyle x_(i)) reikia atimti x̅, kvadratą ir pridėti rezultatus.
    • x̅ – imties vidurkis (imties vidurkis).
    • n yra imties verčių skaičius.
  3. Apskaičiuokite imties vidurkį. Jis žymimas x̅. Imties vidurkis apskaičiuojamas kaip įprastas aritmetinis vidurkis: sudėkite visas imties reikšmes ir padalykite rezultatą iš imtyje esančių reikšmių skaičiaus.

    • Mūsų pavyzdyje pridėkite vertes pavyzdyje: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Dabar padalykite rezultatą iš imties verčių skaičiaus (mūsų pavyzdyje yra 6): 84 ÷ 6 = 14.
      Imties vidurkis x̅ = 14.
    • Imties vidurkis yra centrinė vertė, aplink kurią pasiskirsto imties reikšmės. Jei imties klasterio reikšmės aplink imtį yra vidutinės, tada dispersija yra maža; kitu atveju dispersija yra didelė.
  4. Iš kiekvienos imties vertės atimkite imties vidurkį. Dabar apskaičiuokite skirtumą x i (\displaystyle x_(i))- x̅, kur x i (\displaystyle x_(i))- kiekviena imties reikšmė. Kiekvienas rezultatas nurodo tam tikros reikšmės nuokrypio nuo imties vidurkio laipsnį, tai yra, kiek ši vertė yra nuo imties vidurkio.

    • Mūsų pavyzdyje:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Gautų rezultatų teisingumą patikrinti nesunku, nes jų suma turi būti lygi nuliui. Tai susiję su vidutinės vertės nustatymu, nes neigiamos reikšmės (atstumai nuo vidutinės vertės iki mažesnių verčių) yra visiškai kompensuojamos teigiamomis reikšmėmis (atstumai nuo vidutinės vertės iki didesnių verčių).
  5. Kaip minėta aukščiau, skirtumų suma x i (\displaystyle x_(i))- x̅ turi būti lygus nuliui. Tai reiškia, kad vidutinė dispersija visada yra lygi nuliui, o tai nesuteikia jokio supratimo apie tam tikro dydžio verčių sklaidą. Norėdami išspręsti šią problemą, kiekvieną skirtumą padalykite kvadratu x i (\displaystyle x_(i))- x̅. Taip gausite tik teigiamus skaičius, kuriuos sudėjus niekada nebus iki 0.

    • Mūsų pavyzdyje:
      (x 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2)))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Jūs radote skirtumo kvadratą - x̅) 2 (\displaystyle ^(2)) kiekvienai imties vertei.
  6. Apskaičiuokite skirtumų kvadratu sumą. Tai yra, suraskite formulės dalį, kuri parašyta taip: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Čia ženklas Σ reiškia kiekvienos reikšmės skirtumų kvadratu sumą x i (\displaystyle x_(i)) pavyzdyje. Jau radote skirtumus kvadratu (x i (\displaystyle (x_(i))-x̅) 2 (\displaystyle ^(2)) kiekvienai vertei x i (\displaystyle x_(i)) mėginyje; dabar tiesiog pridėkite šiuos kvadratus.

    • Mūsų pavyzdyje: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Padalinkite rezultatą iš n - 1, kur n yra imties verčių skaičius. Prieš kurį laiką, norėdami apskaičiuoti imties dispersiją, statistikai tiesiog padalijo rezultatą iš n; šiuo atveju gausite kvadratinės dispersijos vidurkį, kuris idealiai tinka tam tikros imties dispersijai apibūdinti. Tačiau atminkite, kad bet kuri imtis yra tik nedidelė bendrosios vertybių visumos dalis. Jei paimsite kitą pavyzdį ir atliksite tuos pačius skaičiavimus, gausite kitokį rezultatą. Kaip paaiškėjo, padalijus iš n – 1 (o ne tik iš n), gaunamas geresnis populiacijos dispersijos įvertis, ko ir siekiate. Dalijimas iš n - 1 tapo įprastas, todėl įtrauktas į imties dispersijos skaičiavimo formulę.

    • Mūsų pavyzdyje pavyzdyje yra 6 reikšmės, ty n = 6.
      Imties dispersija = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Skirtumas tarp dispersijos ir standartinio nuokrypio. Atkreipkite dėmesį, kad formulėje yra eksponentas, todėl dispersija matuojama analizuojamos reikšmės kvadratiniais vienetais. Kartais tokią vertę gana sunku valdyti; tokiais atvejais naudojamas standartinis nuokrypis, kuris yra lygus dispersijos kvadratinei šaknei. Štai kodėl imties dispersija žymima kaip s 2 (\displaystyle s^(2)), o imties standartinis nuokrypis kaip s (\displaystyle s).

    • Mūsų pavyzdyje imties standartinis nuokrypis yra: s = √33,2 = 5,76.

    Populiacijos dispersijos skaičiavimas

    1. Išanalizuokite kai kurias vertybes. Rinkinyje yra visos nagrinėjamo kiekio reikšmės. Pavyzdžiui, jei tiriate Leningrado srities gyventojų amžių, tada į gyventojų skaičių įtraukiamas visų šio regiono gyventojų amžius. Dirbant su agregatu, rekomenduojama sukurti lentelę ir į ją įvesti agregato reikšmes. Apsvarstykite šį pavyzdį:

      • Tam tikroje patalpoje yra 6 akvariumai. Kiekviename akvariume yra toks žuvų skaičius:
        x 1 = 5 (\displaystyle x_(1) = 5)
        x 2 = 5 (\displaystyle x_(2) = 5)
        x 3 = 8 (\displaystyle x_(3) = 8)
        x 4 = 12 (\displaystyle x_(4) = 12)
        x 5 = 15 (\displaystyle x_(5) = 15)
        x 6 = 18 (\displaystyle x_(6) = 18)
    2. Užsirašykite populiacijos dispersijos apskaičiavimo formulę. Kadangi populiacija apima visas tam tikro dydžio reikšmes, ši formulė leidžia gauti tikslią populiacijos dispersijos reikšmę. Norėdami atskirti populiacijos dispersiją nuo imties dispersijos (tai tik apytikslis), statistikai naudoja įvairius kintamuosius:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))– populiacijos dispersija (skaitoma kaip „sigmos kvadratas“). Sklaida matuojama kvadratiniais vienetais.
      • x i (\displaystyle x_(i))– kiekviena bendra reikšmė.
      • Σ yra sumos ženklas. Tai yra, kiekvienai vertei x i (\displaystyle x_(i)) atimkite μ, kvadratą ir pridėkite rezultatus.
      • μ yra gyventojų vidurkis.
      • n yra reikšmių skaičius bendroje populiacijoje.
    3. Apskaičiuokite gyventojų vidurkį. Dirbant su bendrąja populiacija, jos vidutinė reikšmė žymima μ (mu). Visuomenės vidurkis apskaičiuojamas kaip įprastas aritmetinis vidurkis: sudėkite visas populiacijos reikšmes ir padalykite rezultatą iš populiacijos reikšmių skaičiaus.

      • Atminkite, kad vidurkiai ne visada skaičiuojami kaip aritmetinis vidurkis.
      • Mūsų pavyzdyje populiacijos reikšmė: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Iš kiekvienos populiacijos vertės atimkite populiacijos vidurkį. Kuo skirtumo reikšmė arčiau nulio, tuo konkreti reikšmė artimesnė populiacijos vidurkiui. Raskite skirtumą tarp kiekvienos populiacijos reikšmės ir jos vidurkio, ir pirmą kartą pamatysite reikšmių pasiskirstymą.

      • Mūsų pavyzdyje:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Kiekvieno gauto rezultato kvadratas. Skirtumo reikšmės bus teigiamos ir neigiamos; jei šias reikšmes įtrauksite į skaičių eilutę, tada jos bus dešinėje ir kairėje nuo populiacijos vidurkio. Tai nėra gerai skaičiuojant dispersiją, nes teigiami ir neigiami skaičiai panaikina vienas kitą. Todėl kiekvieną skirtumą padalykite kvadratu, kad gautumėte tik teigiamus skaičius.

      • Mūsų pavyzdyje:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) kiekvienai populiacijos vertei (nuo i = 1 iki i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), kur x n (\displaystyle x_(n)) yra paskutinė populiacijos reikšmė.
      • Norėdami apskaičiuoti gautų rezultatų vidutinę reikšmę, turite rasti jų sumą ir padalyti iš n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Dabar parašykime aukščiau pateiktą paaiškinimą naudodami kintamuosius: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n ir gaukite populiacijos dispersijos apskaičiavimo formulę.

Sprendimas.

Kaip atsitiktinio dydžio reikšmių sklaidos matą naudojame dispersija

Dispersija (žodis dispersija reiškia „išsklaidymas“) yra atsitiktinio dydžio reikšmių sklaidos matas apie jo matematinį lūkestį. Dispersija yra matematinis atsitiktinio kintamojo nuokrypio nuo jo matematinio lūkesčio kvadratas.

Jei atsitiktinis kintamasis yra diskretus su begaliniu, bet skaičiuojamu reikšmių rinkiniu, tada

jei eilutės dešinėje lygybės pusėje susilieja.

Dispersijos savybės.

  • 1. Pastovios reikšmės sklaida lygi nuliui
  • 2. Atsitiktinių dydžių sumos dispersija lygi dispersijų sumai
  • 3. Iš dispersijos kvadrato ženklo galima paimti pastovų koeficientą

Atsitiktinių dydžių skirtumo dispersija yra lygi dispersijų sumai

Ši savybė yra antrosios ir trečiosios savybių pasekmė. Nuokrypiai gali tik didėti.

Dispersija patogiai apskaičiuojama pagal formulę, kurią lengva gauti naudojant dispersijos savybes

Sklaida visada teigiama.

Sklaida turi matmuo paties atsitiktinio dydžio matmens kvadratas, o tai ne visada patogu. Todėl kiekis

Standartinis nuokrypis atsitiktinio dydžio (standartinis nuokrypis arba standartas) vadinamas jo dispersijos kvadratinės šaknies aritmetine reikšme

Išmeskite dvi monetas, kurių nominalai yra 2 ir 5 rubliai. Jei moneta nukrenta su herbu, tada suteikiamas nulis taškų, o jei tai skaičius, tai taškų skaičius lygus monetos vertei. Raskite matematinį taškų skaičių ir dispersiją.

Sprendimas. Pirmiausia suraskime atsitiktinio dydžio X pasiskirstymą – taškų skaičių. Visi deriniai (2; 5), (2; 0), (0; 5), (0; 0) yra vienodai tikėtini, o pasiskirstymo dėsnis:

Tikėtina vertė:

Sklaidą randame pagal formulę

kodėl skaičiuojame

2 pavyzdys

Raskite nežinomą tikimybę R, matematinė tikimybė ir diskretinio atsitiktinio dydžio dispersija, pateikta tikimybių pasiskirstymo lentele

Mes randame matematinį lūkestį ir dispersiją:

M(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Norėdami apskaičiuoti dispersiją, naudojame formulę (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

3 pavyzdys Du lygiaverčiai sportininkai surengia turnyrą, kuris tęsiasi arba iki vienos iš jų pirmosios pergalės, arba iki sužaistos penkios partijos. Tikimybė laimėti per vieną partiją kiekvienam iš sportininkų yra 0,3, o lygiųjų tikimybė yra 0,4. Raskite paskirstymo dėsnį, matematinius lūkesčius ir žaidžiamų žaidimų skaičiaus dispersiją.

Sprendimas. Atsitiktinė vertė X- žaidžiamų žaidimų skaičius, reikšmes nuo 1 iki 5, t.y.

Nustatykime rungtynių pabaigos tikimybę. Rungtynės baigsis pirmajame sete, jei vienas iš sportininkų laimės. Tikimybė laimėti yra

R(1) = 0,3+0,3 =0,6.

Jei buvo lygiosios (lygių tikimybė yra 1 - 0,6 = 0,4), tada rungtynės tęsiasi. Rungtynės baigsis antroje partijoje, jei pirmasis bus lygios, o kas nors laimėjo antrąjį. Tikimybė

R(2) = 0,4 0,6=0,24.

Panašiai rungtynės baigsis trečiame geime, jei bus dvi lygiosios iš eilės ir vėl kažkas laimės

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

Penktoji šalis bet kuriame variante yra paskutinė.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Viską apibendrinkime lentelėje. Atsitiktinio dydžio „laimėtų žaidimų skaičius“ pasiskirstymo dėsnis turi tokią formą

Tikėtina vertė

Sklaida apskaičiuojama pagal formulę (19.4)

Standartiniai diskretieji skirstiniai.

Binominis skirstinys. Leiskite įgyvendinti Bernulio eksperimento schemą: n identiški nepriklausomi eksperimentai, kurių kiekviename yra įvykis A gali pasirodyti su pastovia tikimybe p ir neatsiras su tikimybe

(žr. 18 paskaitą).

Įvykio atvejų skaičius Ašiuose n eksperimentuose yra diskretusis atsitiktinis kintamasis X, kurių galimos reikšmės yra:

0; 1; 2; ... ;m; ... ; n.

Išvaizdos tikimybė mįvykiai A konkrečioje serijoje nuo n eksperimentai ir tokio atsitiktinio dydžio pasiskirstymo dėsnis pateikiamas Bernulio formule (žr. 18 paskaitą)

Atsitiktinio dydžio skaitinės charakteristikos X paskirstytas pagal dvinario dėsnį:

Jeigu n yra didelis (), tada, at, formulė (19.6) patenka į formulę

ir Gauso funkcija lentelėse (Gauso funkcijos reikšmių lentelė pateikta 18 paskaitos pabaigoje).

Praktikoje dažnai ne pati tikimybė yra svarbi. mįvykius A tam tikroje serijoje n patirtį ir tikimybę, kad įvykis BET pasirodys bent

kartų ir ne daugiau kartų, t. y. tikimybė, kad X paims reikšmes

Norėdami tai padaryti, turime susumuoti tikimybes

Jeigu n yra didelis (), tada, at, formulė (19.9) pereina į apytikslę formulę

lentelės funkcija. Lentelės pateiktos 18 paskaitos pabaigoje.

Naudodami lenteles atminkite tai

1 pavyzdys. Automobilis, artėdamas prie sankryžos, gali ir toliau važiuoti bet kuriuo iš trijų kelių: A, B arba C su tokia pačia tikimybe. Prie sankryžos artėja penki automobiliai. Raskite vidutinį automobilių, kurie važiuos A keliu, skaičių ir tikimybę, kad keliu B važiuos trys automobiliai.

Sprendimas. Kiekvienu keliu pravažiuojančių automobilių skaičius yra atsitiktinis dydis. Jei darysime prielaidą, kad visi automobiliai, artėjantys prie sankryžos, keliauja nepriklausomai vienas nuo kito, tai šis atsitiktinis dydis pasiskirsto pagal dvinarį dėsnį su

n= 5 ir p = .

Todėl vidutinis automobilių skaičius, kuris važiuos keliu A, yra pagal formulę (19.7)

ir norima tikimybė ties

2 pavyzdysĮrenginio gedimo tikimybė kiekviename bandyme yra 0,1. Atlikta 60 įrenginio bandymų. Kokia tikimybė, kad įrenginys suges: a) 15 kartų; b) ne daugiau kaip 15 kartų?

a. Kadangi testų skaičius yra 60, naudojame formulę (19.8)

Pagal 18 paskaitos priedo 1 lentelę randame

b. Naudojame formulę (19.10).

Pagal 18 paskaitos priedo 2 lentelę

  • - 0,495
  • 0,49995

Puasono pasiskirstymas) retų reiškinių dėsnis). Jeigu n puiku ir R mažai (), o produktas ir tt išlaiko pastovią reikšmę, kurią žymime l,

tada formulė (19.6) pereina į Puasono formulę

Puasono paskirstymo įstatymas turi tokią formą:

Akivaizdu, kad Puasono dėsnio apibrėžimas yra teisingas, nes pagrindinė platinimo serijos savybė

įvykdyta, nes eilutės suma

Funkcijų serijos išplėtimas yra parašytas skliausteliuose

Teorema. Atsitiktinio dydžio, paskirstyto pagal Puasono dėsnį, matematinė lūkestis ir dispersija sutampa ir yra lygi šio dėsnio parametrui, t.y.

Įrodymas.

Pavyzdys. Siekdama reklamuoti savo gaminius rinkoje, įmonė į pašto dėžutes išdeda skrajutes. Ankstesnė patirtis rodo, kad maždaug vienu atveju iš 2000 seka užsakymas. Raskite tikimybę, kad pateikus 10 000 skrajučių bus gautas bent vienas užsakymas, vidutinį gautų užsakymų skaičių ir gautų užsakymų skaičiaus dispersiją.

Sprendimas. čia

Tikimybę, kad ateis bent vienas užsakymas, randame per priešingo įvykio tikimybę, t.y.

Atsitiktinis įvykių srautas.Įvykių srautas yra įvykių seka, vykstanti atsitiktiniu laiku. Tipiški srautų pavyzdžiai – gedimai kompiuterių tinkluose, skambučiai telefono stotyse, užklausų dėl įrangos remonto srautas ir kt.

Srautasįvykiai vadinami stacionarus, jei tikimybė pataikyti į vieną ar kitą įvykių skaičių laiko intervale priklauso tik nuo intervalo ilgio ir nepriklauso nuo laiko intervalo vietos laiko ašyje.

Stacionarumo sąlygą tenkina programų srautas, kurio tikimybinės charakteristikos nepriklauso nuo laiko. Visų pirma, stacionariam srautui būdingas pastovus tankis (vidutinis užklausų skaičius per laiko vienetą). Praktikoje dažnai atsiranda programų, kurios (bent jau ribotą laiką) gali būti laikomos nejudančiomis. Pavyzdžiui, skambučių srautas miesto telefono stotyje laiko intervalu nuo 12 iki 13 valandų gali būti laikomas stacionariu. Tas pats srautas visą dieną nebegali būti laikomas stacionariu (naktį iškvietimų tankis yra daug mažesnis nei dieną).

Srautasįvykiai vadinami srautu be jokio poveikio, jei bet kuriuose nepersidengiančiuose laiko segmentuose įvykių, patenkančių į vieną iš jų, skaičius nepriklauso nuo įvykių, patenkančių į kitus, skaičiaus.

Sąlyga be poveikio, kuri yra pati reikšmingiausia paprasčiausiam srautui, reiškia, kad pretenzijos patenka į sistemą nepriklausomai viena nuo kitos. Pavyzdžiui, keleivių srautas, įvažiuojantis į metro stotį, gali būti laikomas srautu be pasekmių, nes priežastys, lėmusios atskiro keleivio atvykimą tuo konkrečiu momentu, o ne kito, paprastai nėra susijusios su panašiomis priežastimis dėl kitų priežasčių. keleiviai. Tačiau atsiradus tokiai priklausomybei, gali būti nesunkiai pažeista sąlyga, kad poveikio nėra. Pavyzdžiui, iš metro stoties išvykstančių keleivių srautas nebegali būti laikomas srautu be pasekmių, nes tuo pačiu traukiniu atvykstančių keleivių išvažiavimo laikas priklauso vienas nuo kito.

Srautasįvykiai vadinami įprastas, jei tikimybė pataikyti į du ar daugiau įvykių per nedidelį laiko intervalą t yra nereikšminga, lyginant su tikimybe pataikyti į vieną įvykį (šiuo atžvilgiu Puasono dėsnis vadinamas retų įvykių dėsniu).

Įprastumo sąlyga reiškia, kad programos pateikiamos po vieną, o ne poromis, trynukais ir pan. dispersijos nuokrypis Bernulio skirstinys

Pavyzdžiui, klientų, įeinančių į kirpyklą, srautą galima laikyti kone įprastu. Jei nepaprastame sraute aplikacijos ateina tik poromis, tik trynukais ir pan., tai nepaprastą srautą galima nesunkiai sumažinti iki įprasto; tam užtenka atsižvelgti į porų, trigubų ir tt srautą, o ne į atskirų programų srautą.Bus sunkiau, jei kiekviena paraiška atsitiktinai gali pasirodyti dviguba, triguba ir tt Tada jau reikia susidoroti su ne vienarūšių, bet nevienalyčių įvykių srautu.

Jei įvykių srautas turi visas tris savybes (t.y. jis yra stacionarus, įprastas ir neturi poveikio), tada jis vadinamas paprasčiausiu (arba stacionariu Puasono) srautu. Pavadinimas „Poisson“ atsirado dėl to, kad, laikantis aukščiau nurodytų sąlygų, įvykių, patenkančių į bet kurį fiksuotą laiko intervalą, skaičius bus paskirstytas Puasono dėsnis

Čia yra vidutinis įvykių skaičius A pasirodo per laiko vienetą.

Šis dėsnis yra vienparametrinis, t.y. tam reikia žinoti tik vieną parametrą. Galima parodyti, kad Puasono dėsnio matematinis lūkestis ir dispersija yra skaitiškai lygūs:

Pavyzdys. Tegul vidury darbo dienos vidutinis užklausų skaičius yra 2 per sekundę. Kokia tikimybė, kad 1) per sekundę nebus gauta jokių užklausų, 2) per dvi sekundes bus gauta 10 užklausų?

Sprendimas. Kadangi Puasono dėsnio taikymo pagrįstumas nekelia abejonių ir nustatytas jo parametras (= 2), uždavinio sprendimas redukuojamas iki Puasono formulės (19.11) taikymo.

1) t = 1, m = 0:

2) t = 2, m = 10:

Didelių skaičių dėsnis. Matematinis pagrindas tam, kad atsitiktinio dydžio reikšmės yra sugrupuotos pagal kai kurias pastovias reikšmes, yra didelių skaičių dėsnis.

Istoriškai pirmoji didelių skaičių dėsnio formuluotė buvo Bernulio teorema:

„Neribotai didėjant identiškų ir nepriklausomų eksperimentų n skaičiui, įvykio A pasireiškimo dažnis tikimybe suartėja su jo tikimybe“, t.y.

kur yra įvykio A pasireiškimo dažnis n eksperimentų,

Kalbant apie reikšmę, išraiška (19.10) reiškia, kad atliekant daug eksperimentų, įvykio pasireiškimo dažnis A gali pakeisti nežinomą šio įvykio tikimybę, ir kuo daugiau eksperimentų, tuo p* arčiau p. Įdomus istorinis faktas. K. Pearsonas monetą išmetė 12000 kartų, o jo herbas nukrito 6019 kartų (dažnis 0,5016). Tą pačią monetą išmetęs 24 000 kartų gavo 12 012 herbo lašų, ​​t.y. dažnis 0,5005.

Svarbiausia didelių skaičių dėsnio forma yra Čebyševo teorema: neribotai padidėjus nepriklausomų, turinčių baigtinę dispersiją ir atliekamų tomis pačiomis eksperimentų sąlygomis, skaičiui, atsitiktinio dydžio stebimų verčių aritmetinis vidurkis suartėja su jo matematiniais lūkesčiais.. Analitine forma šią teoremą galima parašyti taip:

Čebyševo teorema, be esminės teorinės reikšmės, turi ir svarbų praktinį pritaikymą, pavyzdžiui, matavimų teorijoje. Po n tam tikro dydžio matavimų X, gaukite skirtingas nesutampančių verčių X 1, X 2, ..., xn. Dėl apytikslės išmatuotos vertės vertės X imkite stebimų reikšmių aritmetinį vidurkį

kur, kuo daugiau eksperimentų bus atlikta, tuo tikslesnis bus rezultatas. Faktas yra tas, kad vertės dispersija mažėja didėjant atliktų eksperimentų skaičiui, nes

D(x 1) = D(x 2)=…= D(xn) D(x), tada

Ryšys (19.13) rodo, kad net ir esant dideliam matavimo priemonių netikslumui (didelė reikšmė), padidinus matavimų skaičių, galima gauti savavališkai didelio tikslumo rezultatą.

Naudojant (19.10) formulę, galima rasti tikimybę, kad statistinis dažnis nukryps nuo tikimybės ne daugiau kaip

Pavyzdys.Įvykio tikimybė kiekviename bandyme yra 0,4. Kiek testų reikia atlikti, kad su ne mažesne nei 0,8 tikimybe būtų galima tikėtis, kad santykinis įvykio dažnis nukryps nuo tikimybės modulio, mažesnio nei 0,01?

Sprendimas. Pagal formulę (19.14)

todėl pagal lentelę yra dvi paraiškos

Vadinasi, n 3932.

Jei populiacija suskirstyta į grupes pagal tiriamą požymį, tai šiai populiacijai galima skaičiuoti tokius sklaidos tipus: suminė, grupė (intragrupė), grupės vidurkis (vidutinis grupės vidinis), tarpgrupinis.

Iš pradžių apskaičiuojamas determinacijos koeficientas, kuris parodo, kokia visos tiriamo požymio kitimo dalis yra tarpgrupinė variacija, t.y. dėl grupavimo:

Empirinis koreliacijos santykis apibūdina grupavimo (faktorinio) ir efektinių ženklų ryšio sandarumą.

Empirinis koreliacijos santykis gali būti nuo 0 iki 1.

Norėdami įvertinti santykių glaudumą pagal empirinį koreliacijos santykį, galite naudoti Chaddock ryšius:

4 pavyzdys Yra šie duomenys apie įvairių nuosavybės formų projektavimo ir tyrimo organizacijų atliktus darbus:

Apibrėžkite:

1) visuminė dispersija;

2) grupinės dispersijos;

3) grupių dispersijų vidurkis;

4) tarpgrupinė sklaida;

5) bendroji dispersija, pagrįsta dispersijų sudėjimo taisykle;


6) determinacijos koeficientas ir empirinė koreliacija.

Padarykite išvadas patys.

Sprendimas:

1. Nustatykime vidutinę dviejų nuosavybės formų įmonių atliekamų darbų apimtį:

Apskaičiuokite bendrą dispersiją:

2. Apibrėžkite grupės vidurkius:

milijonas rublių;

mln rub.

Grupės skirtumai:

;

3. Apskaičiuokite grupių dispersijų vidurkį:

4. Nustatykite tarpgrupinę dispersiją:

5. Apskaičiuokite bendrą dispersiją pagal dispersijų pridėjimo taisyklę:

6. Nustatykite determinacijos koeficientą:

.

Taigi projektavimo ir tyrimo organizacijų atliekamų darbų kiekis 22% priklauso nuo įmonių nuosavybės formos.

Empirinis koreliacijos santykis apskaičiuojamas pagal formulę

.

Apskaičiuoto rodiklio reikšmė rodo, kad darbo kiekio priklausomybė nuo įmonės nuosavybės formos yra nedidelė.

5 pavyzdys Atlikus gamybos vietų technologinės disciplinos tyrimą buvo gauti šie duomenys:

Nustatykite determinacijos koeficientą

Sklaida statistikoje apibrėžiama kaip atskirų bruožo verčių standartinis nuokrypis nuo aritmetinio vidurkio kvadratu. Įprastas būdas apskaičiuoti pasirinkimų kvadratinius nuokrypius nuo vidurkio ir tada juos suvesti.

Atliekant ekonominę ir statistinę analizę, požymio kitimą įprasta vertinti dažniausiai naudojant standartinį nuokrypį, kuris yra kvadratinė šaknis nuo dispersijos.

(3)

Jis apibūdina absoliutų kintamojo atributo verčių svyravimą ir išreiškiamas tais pačiais vienetais kaip ir variantai. Statistikoje dažnai tenka lyginti įvairių ypatybių variaciją. Tokiems palyginimams naudojamas santykinis variacijos rodiklis – variacijos koeficientas.

Dispersijos savybės:

1) jei iš visų parinkčių atimsite bet kurį skaičių, tada dispersija nepasikeis;

2) jei visas varianto reikšmes padalinsime iš kažkokio skaičiaus b, tai dispersija sumažės b^2 kartus, t.y.

3) jei apskaičiuosite vidutinį nuokrypių kvadratą nuo bet kurio skaičiaus su nelygiu aritmetiniu vidurkiu, tai jis bus didesnis už dispersiją. Šiuo atveju, tiksliai apibrėžta skirtumo tarp vidutinės pozicijos vertės kvadratui verte.

Dispersiją galima apibrėžti kaip skirtumą tarp vidurkio kvadrato ir vidutinio kvadrato.

17. Grupinės ir tarpgrupinės variacijos. Nuokrypių pridėjimo taisyklė

Jei statistinė populiacija skirstoma į grupes arba dalis pagal tiriamą požymį, tai tokiai populiacijai galima skaičiuoti tokius sklaidos tipus: grupinė (privati), grupės vidutinė (privati) ir tarpgrupinė.

Bendra dispersija- atspindi bruožo kitimą dėl visų sąlygų ir priežasčių, veikiančių tam tikroje statistinėje populiacijoje.

Grupės dispersija- yra lygus atskirų atributo reikšmių nuokrypių nuo šios grupės aritmetinio vidurkio, vadinamo grupės vidurkiu, vidutiniam kvadratui. Šiuo atveju grupės vidurkis nesutampa su bendru visos populiacijos vidurkiu.

Grupės dispersija atspindi bruožo kitimą tik dėl sąlygų ir priežasčių, veikiančių grupėje.

Vidutinės grupės dispersijos- apibrėžiamas kaip svertinis aritmetinis grupių dispersijų vidurkis, o svoriai yra grupių tūriai.

Tarpgrupinė dispersija- yra lygus grupės vidurkių nuokrypių nuo bendrojo vidurkio vidutiniam kvadratui.

Tarpgrupinė dispersija apibūdina gauto požymio kitimą dėl grupavimo požymio.

Tarp nagrinėjamų dispersijų tipų yra tam tikras ryšys: bendra dispersija yra lygi vidutinės grupės ir tarpgrupinės dispersijos sumai.

Šis ryšys vadinamas dispersijos pridėjimo taisykle.

18. Dinaminė eilutė ir ją sudarantys elementai. Dinaminių serijų tipai.

Serija statistikoje- tai skaitmeniniai duomenys, rodantys reiškinio kitimą laike ar erdvėje ir leidžiantys atlikti statistinį reiškinių palyginimą tiek jų raidos procese laike, tiek įvairiomis formomis ir procesų tipais. Dėl to galima aptikti reiškinių tarpusavio priklausomybę.

Socialinių reiškinių judėjimo laike raidos procesas statistikoje paprastai vadinamas dinamika. Dinamikai parodyti sudaromos dinamikos (chronologinės, laiko) eilutės, kurios yra laiko atžvilgiu kintančių statistinio rodiklio (pavyzdžiui, nuteistųjų per 10 metų skaičius) reikšmių serijos, išdėstytos chronologine tvarka. Jų sudedamosios dalys yra tam tikro rodiklio skaitinės reikšmės ir laikotarpiai arba laiko momentai, su kuriais jie susiję.

Svarbiausia laiko eilučių charakteristika- jų dydis (apimtis, vertė) to ar kito reiškinio, pasiekto tam tikru laikotarpiu ar tam tikru momentu. Atitinkamai, dinamikos serijos terminų dydis yra jos lygis. Išskirti pradinis, vidurinis ir galutinis dinaminės serijos lygiai. Pirmas lygis rodo pirmojo, galutinio – paskutinio serijos nario reikšmę. Vidutinis lygis reiškia vidutinį chronologinį kitimo diapazoną ir apskaičiuojamas atsižvelgiant į tai, ar laiko eilutė yra intervalinė, ar momentinė.

Kita svarbi dinaminės serijos savybė- laikas, praėjęs nuo pradinio iki galutinio stebėjimo, arba tokių stebėjimų skaičius.

Laiko eilučių yra įvairių tipų, jas galima klasifikuoti pagal šiuos kriterijus.

1) Priklausomai nuo lygių išreiškimo būdo, dinamikos eilutės skirstomos į absoliučių ir išvestinių rodiklių eilutes (santykinės ir vidutinės reikšmės).

2) Priklausomai nuo to, kaip eilučių lygiai išreiškia reiškinio būseną tam tikrais laiko momentais (mėnesio, ketvirčio, ​​metų pradžioje ir pan.) arba jo reikšmę tam tikrais laiko intervalais (pavyzdžiui, per dieną, mėnuo, metai ir kt.) n.), atitinkamai atskirkite momentines ir intervalines dinamikos eilutes. Momentų serijos teisėsaugos institucijų analitiniame darbe naudojamos palyginti retai.

Statistikos teorijoje dinamika išskiriama ir pagal eilę kitų klasifikavimo požymių: priklausomai nuo atstumo tarp lygių – su vienodais atstumais ir nevienodais laike lygiais; priklausomai nuo pagrindinės tiriamo proceso tendencijos buvimo – stacionarus ir nestacionarus. Analizuojant dinamines eilutes, kaip komponentai pateikiami šie serijų lygiai:

Y t \u003d TP + E (t)

kur TR yra deterministinis komponentas, kuris lemia bendrą pokyčio tendenciją laikui bėgant arba tendenciją.

E (t) yra atsitiktinis komponentas, sukeliantis lygio svyravimus.