Статистикийн сонгодог аргууд: хи-квадрат тест. Хоёр давтамжийн тархалтын харьцуулалт

Хи-квадрат тест хийхдээ болзошгүй байдлын хүснэгтийн хоёр хувьсагчийн харилцан бие даасан байдлыг шалгаж, үүнээс үүдэн хоёр хувьсагчийн хамаарлыг шууд бусаар илрүүлдэг. Нүдэнд ажиглагдсан давтамж (f 0) нь хүлээгдэж буй давтамжтай (fe) таарч байвал хоёр хувьсагчийг бие биенээсээ хамааралгүй гэж нэрлэдэг.

SPSS ашиглан хи-квадрат тестийг ажиллуулахын тулд дараах алхмуудыг дагана уу.

  • Цэсээс командуудыг сонгоно уу Шинжилгээ хийх(Шинжилгээ) > Тайлбарлах статистик(Тодорхойлох статистик) › Хөндлөн таб...(Болзошгүй байдлын хүснэгтүүд)
  • товч дахин тохируулах(Дахин тохируулах) боломжит тохиргоог арилгах.
  • Хувьсагчийн хүйсийг мөрийн жагсаалт руу, хувьсагчийн сэтгэлгээг баганын жагсаалт руу шилжүүл.
  • товчийг дарна уу Эсүүд…(эсүүд). Харилцах цонхонд өгөгдмөл хайрцгаас гадна тэмдэглэнэ үү Ажигласан, илүү олон шалгах нүд хүлээгдэж буйТэгээд стандартчилагдсан. Сонголтыг товчлуураар баталгаажуулна уу Үргэлжлүүлэх.
  • товчийг дарна уу Статистик…(Статистик).

Дээр дурдсан харилцах цонх нээгдэнэ. Хөндлөн дэвжээ: Статистик.

  • Хайрцагыг шалгана уу Хи-квадрат(Хи-дөрвөлжин). товчийг дарна уу Үргэлжлүүлэх, мөн үндсэн харилцах цонхонд - to БОЛЖ БАЙНА УУ.

Та дараах болзошгүй ослын хүснэгтийг хүлээн авах болно.

Хүйс * Сэтгэцийн байдал. Болзошгүй байдлын хүснэгт.

Сэтгэцийн байдал Нийт
Маш тогтворгүй тогтворгүй тогтвортой Маш тогтвортой
Шал эмэгтэй Тоол 16 18 9 1 44
Хүлээгдэж буй тоо 7.9 16.6 17.0 2.5 44.0
Std. Үлдэгдэл 2.9 0.3 -1.9 -0.9
Эрэгтэй Тоол 3 22 32 5 62
Хүлээгдэж буй тоо 11.1 23.4 24.0 3.5 62.0
Std. Үлдэгдэл -2.4 -0.3 1.6 0.8
Нийт Тоол 19 40 41 6 106
Хүлээгдэж буй тоо 19.0 40.0 41.0 6.0 106.0

Нэмж дурдахад хи-квадрат тестийн үр дүнг үзэгчийн цонхонд харуулах болно.

Хи-квадрат тестүүд

  • гэхдээ. 2 нүд (25.0%) хүлээгдэж буй тоо 5-аас бага байна. Хүлээгдэж буй хамгийн бага тоо нь 2.49 байна

Хи-квадрат тестийг тооцоолоход гурван өөр аргыг ашигладаг: Пирсоны томъёо, магадлалын тохируулга, Мантел-Хаэнсзел тест. Хэрэв хөндлөн хүснэгт нь дөрвөн талбартай бөгөөд хүлээгдэж буй магадлал 5-аас бага бол Фишерийн нарийн тестийг нэмэлтээр хийнэ.

Пирсоны хи-квадрат тест

Хи-квадрат тестийг тооцоолохдоо ихэвчлэн Пирсоны томъёог ашигладаг.

Энд болзошгүй байдлын хүснэгтийн бүх талбар дээрх стандартчилагдсан үлдэгдэлийн квадратуудын нийлбэрийг тооцоолно. Тиймээс стандартчилагдсан үлдэгдэл өндөртэй талбарууд нь хи-квадрат утгад илүү их хувь нэмэр оруулж, улмаар утга учиртай үр дүнд хүргэдэг. 8.7.2-т өгөгдсөн дүрмийн дагуу стандартчилагдсан үлдэгдэл 2 ба түүнээс дээш байх нь ажиглагдсан болон хүлээгдэж буй давтамжуудын хооронд ихээхэн зөрүүтэй байгааг илтгэнэ.

Бидний авч үзэж буй жишээн дээр Пирсоны томъёо нь хи-квадрат тестийн хамгийн чухал утгыг өгдөг.<0.001). Если рассмотреть стандартизованные остатки в отдельных полях таблицы сопряженности, то на основе вышеприведенного правила можно сделать вывод, что эта значимость в основном определяется полями, в которых переменная psyche имеет значение "крайне неустойчивое". У женщин это значение сильно повышено, а у мужчин - понижено.

Хи-квадрат тестийн зөв эсэхийг хоёр нөхцөлөөр тодорхойлно: нэгдүгээрт, хүлээгдэж буй давтамжууд< 5 должны встречаться не более чем в 20% полей таблицы; во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.

Гэсэн хэдий ч авч үзэж буй жишээнд энэ нөхцөл бүрэн хангагдаагүй байна. Хи-квадрат тестийн хүснэгтийн дараах тэмдэглэлээс харахад талбайн 25% нь хүлээгдэж буй давтамж нь 5-аас бага байна. Гэсэн хэдий ч 20% -ийн зөвшөөрөгдөх хязгаар нь бага зэрэг давсан тул эдгээр талбарууд нь маш бага стандартчилагдсан тул үлдэгдэл, хи-квадрат тестийн утгад маш бага хувь нэмэр оруулдаг квадрат, энэ зөрчлийг ач холбогдолгүй гэж үзэж болно.

магадлалыг тохируулсан хи-квадрат тест

Хи-квадрат тестийг тооцоолох Пирсоны томъёоны өөр хувилбар бол магадлалын тохируулга юм.

Том түүврийн хэмжээтэй бол Пирсоны томъёо болон зассан томъёо нь маш ойрхон үр дүнг өгдөг. Бидний жишээн дээр магадлалын тохируулсан хи-квадрат тест 23.688 байна.

Mantel-Haensel тест

Нэмж дурдахад зориулалтын дагуу болзошгүй ослын хүснэгтэд шугаман шугаман("шугаман-шугаман") Mantel-Haenszel тестийн утга (20.391) харагдана. Mantel-Haenszel хи-квадрат тестийн энэ хэлбэр нь хөндлөн хүснэгтийн мөр ба баганын хоорондох шугаман хамаарлын өөр нэг хэмжүүр юм. Энэ нь ажиглалтын тооноос нэгийг хассан Пирсон корреляцийн коэффициентийн үржвэрээр тодорхойлогддог.

Ийнхүү олж авсан шалгуур нь нэг зэрэглэлийн эрх чөлөөтэй байна. Харилцах цонх гарч ирэхэд Mantel-Haenszel аргыг үргэлж ашигладаг Хөндлөн дэвжээ: Статистикшалгасан Хи-квадрат. Гэсэн хэдий ч нэрлэсэн масштабтай холбоотой өгөгдлийн хувьд энэ шалгуурыг хэрэглэхгүй.

Бие даасан байдлын хи-квадрат тестийг хоёр категориал хувьсагчийн хоорондын хамаарлыг тодорхойлоход ашигладаг. Категорийн хувьсагчийн хосын жишээ нь: Гэр бүлийн байдал vs. Хариуцагчийн ажил эрхлэлтийн түвшин; Нохойн үүлдэр vs. Хөтлөгч мэргэжил, Цалингийн түвшин vs. Инженерийн мэргэшсэн байдал гэх мэт Бие даасан байдлын шалгуур үзүүлэлтийг тооцохдоо хувьсагчдын хооронд холбоо байхгүй гэсэн таамаглалыг шалгадаг. Бид MS EXCEL 2010 XI2.TEST () функц болон ердийн томьёо ашиглан тооцоо хийх болно.

Бидэнд байгаа гэж бодъё дээж 500 хүний ​​дунд явуулсан санал асуулгын үр дүнг харуулсан өгөгдөл. Хүмүүсээс гэр бүлийн байдал (гэрлэсэн, иргэний гэр бүл, харилцаанд ороогүй) болон ажил эрхлэлтийн түвшин (бүтэн цагийн, хагас цагийн, түр ажилгүй, өрхийн, тэтгэвэрт гарсан, сурч байгаа) гэсэн 2 асуулт асуусан. Бүх хариултыг хүснэгтэд байрлуулсан:

Энэ хүснэгтийг нэрлэдэг шинж тэмдгийн гэнэтийн хүснэгт(эсвэл хүчин зүйлийн хүснэгт, Англи хэлний болзошгүй хүснэгт). Хүснэгтийн мөр, баганын огтлолцол дээрх элементүүд нь ихэвчлэн O ij (англи хэлнээс. Ажигласан, өөрөөр хэлбэл ажиглагдсан, бодит давтамжийг) илэрхийлдэг.

Бид "Гэр бүлийн байдал нь хөдөлмөр эрхлэлтэд нөлөөлдөг үү?" Гэсэн асуултыг сонирхож байна. ангиллын хоёр аргын хооронд хамаарал байгаа эсэх дээж?

At таамаглалыг шалгахэнэ төрлийн, энэ нь ихэвчлэн гэж үздэг тэг таамаглалангилах аргуудын хамаарал байхгүй гэж заасан.

Хязгаарлалтын тохиолдлыг авч үзье. Хоёр категорийн хувьсагчийн бүрэн хамаарлын жишээ нь дараах судалгааны үр дүн юм.

Энэ тохиолдолд гэр бүлийн байдал нь ажил эрхлэлтийг хоёрдмол утгагүй тодорхойлдог (харьц. Жишээ файлын хуудасны тайлбар). Үүний эсрэгээр, өөр нэг судалгааны үр дүн нь бүрэн бие даасан байдлын жишээ юм:

Энэ тохиолдолд ажил эрхлэлтийн хувь нь гэр бүлийн байдлаас хамаарахгүй гэдгийг анхаарна уу (гэрлэсэн болон гэрлээгүй хүмүүст адилхан). Энэ нь үг хэллэгтэй яг адилхан юм тэг таамаглал. Хэрэв тэг таамаглалүнэн бол судалгааны үр дүнг гэр бүлийн байдлаас үл хамааран ажилчдын эзлэх хувь ижил байхаар хүснэгтэд тараасан байх ёстой. Үүнийг ашиглан бид тохирох санал асуулгын үр дүнг тооцдог тэг таамаглал(см. жишээ файлын хуудас Жишээ).

Эхлээд бид элементийн магадлалыг тооцоолно дээжтодорхой ажилтай байх болно (u i баганыг харна уу):

хаана -аас- "Гэр бүлийн байдал" хувьсагчийн түвшний тоотой тэнцүү баганын тоо (багана).

Дараа нь бид магадлалын тооцоолсон элементийг тооцоолно дээжтодорхой гэр бүлийн статустай байх болно (v j мөрийг үзнэ үү).

хаана r– "Хөдөлмөр эрхлэлт" хувьсагчийн түвшний тоотой тэнцүү мөр (мөр) тоо.

Бие даасан хувьсагчийн хувьд E ij нүд бүрийн онолын давтамжийг (Англи хэлнээс Хүлээгдэж буй давтамжаас) дараах томъёогоор тооцоолно.
E ij =n* u i * v j

Том n-ийн хувьд X 2 0 статистик нь ойролцоогоор (r-1) (c-1) эрх чөлөөний зэрэгтэй (df - эрх чөлөөний зэрэг) байдаг нь мэдэгдэж байна.

үндэслэн тооцсон бол дээжЭнэ статистикийн утга нь "хэт том" (босго хэмжээнээс их) байвал тэг таамаглалтатгалзсан. Босго утгыг жишээлбэл =XI2.INV.RT(0.05; df) томъёог ашиглан тооцоолно.

Анхаарна уу: Ач холбогдолын түвшинихэвчлэн 0.1-тэй тэнцүү авдаг; 0.05; 0.01.

At таамаглалыг шалгахЭнэ нь бас тооцоолоход тохиромжтой бөгөөд бид үүнийг харьцуулж үздэг ач холбогдлын түвшин. х-утга c (r-1)*(c-1)=df эрх чөлөөний зэргийг ашиглан тооцоолсон.

Хэрэв санамсаргүй хэмжигдэхүүн нь c (r-1)(c-1) байх магадлал эрх чөлөөний зэрэгтооцоолсон статистик X 2 0-ээс их утгыг авдаг, өөрөөр хэлбэл. P(X 2 (r-1)*(c-1) >X 2 0 ), бага ач холбогдлын түвшин, дараа нь тэг таамаглалтатгалзсан байна.

MS EXCEL дээр p-утгатомъёог ашиглан тооцоолж болно =XI2.DIST.PX(X 2 0 ;df)Мэдээжийн хэрэг, X 2 0 статистикийн утгыг шууд өмнө нь тооцоолсон (энэ нь жишээ файлд хийгдсэн). Гэхдээ XI2.TEST() функцийг ашиглах нь хамгийн тохиромжтой. Энэ функцийн аргумент болгон бодит (Ажигласан) болон тооцоолсон онолын давтамж (Хүлээж буй) агуулсан мужуудын лавлагааг зааж өгсөн болно.

Хэрэв ач холбогдлын түвшин > х- үнэ цэнэ, тэгвэл энэ нь шударга байдлын таамаглалаас тооцсон бодит ба онолын давтамж юм. тэг таамаглал, ноцтой ялгаатай. Тийм ч учраас, тэг таамаглалтатгалзах ёстой.

CH2.TEST() функцийг ашигласнаар процедурыг хурдасгах боломжтой таамаглалыг шалгах, учир нь үнэ цэнийг тооцоолох шаардлагагүй статистик. Одоо XI2.TEST () функцийн үр дүнг өгөгдсөнтэй харьцуулахад хангалттай ач холбогдлын түвшин.

Анхаарна уу: CHISQ.TEST() функц, англи нэр нь CHISQ.TEST нь MS EXCEL 2010 дээр гарч ирсэн. Түүний өмнөх хувилбар нь MS EXCEL 2007 дээр гарсан CHI2TEST() нь ижил функцтэй. Гэхдээ CHI2.TEST()-ийн хувьд онолын давтамжийг бие даан тооцоолох ёстой.

Энэ нийтлэл нь Чи квадратын шалгуурыг хэрхэн тооцоолох талаар хариулдаггүй бөгөөд зорилго нь таныг хэрхэн автоматжуулахыг харуулах явдал юм. excel дээр хи квадратын тооцоо, Чи квадрат шалгуурыг тооцоолох ямар функцууд байдаг. SPSS эсвэл R програмын хувьд үргэлж бэлэн байдаггүй.
Нэг ёсондоо, энэ бол Хүний нөөцийн аналитик семинарт оролцогчдод сануулга, зөвлөгөө юм. Та эдгээр аргуудыг ажилдаа ашиглаарай гэж найдаж байна, энэ нийтлэл нь бас нэг зөвлөгөө байх болно.
Би файлд татаж авах холбоосыг өгөөгүй ч та миний өгсөн жишээ хүснэгтүүдийг хуулж аваад миний өгсөн өгөгдөл, томьёог гүйлгэж болно.

танилцуулга

Жишээлбэл, бид аж ахуйн нэгжийн санал асуулгын үр дүнгийн хуваарилалтын бие даасан байдлыг (санамсаргүй / санамсаргүй бус) шалгахыг хүсч байна, үүнд санал асуулгын аль ч асуултын хариултыг мөрөнд, баганад уртаар хуваарилах болно. үйлчилгээний.

Таны өгөгдлийг нэгтгэх хүснэгтэд, жишээлбэл, энэ хэлбэрээр хураангуйлах үед та хи квадратын тооцоог пивот хүснэгтээр оруулна.
Хүснэгт №1

1 жилээс бага

Мөрөөр нийлбэр

Баганын нийлбэр

Excel дээр Chi квадратыг тооцоолохын тулд дараах томьёо байдаг

HI2.TEST

CHI2.TEST томьёо нь тархалтын бие даасан (санамсаргүй/санамсаргүй) магадлалыг тооцдог.

Синтакс нь

CHI2.TEST(бодит_интервал, хүлээгдэж буй_интервал)

Манай тохиолдолд бодит интервал нь хүснэгтийн агуулга, i.e.

Тэдгээр. Эмпирик ба хүлээгдэж буй (эсвэл онолын давтамж) гэсэн хоёр хүснэгтийг хүлээн авснаар бид ялгааг олж авах, квадрат болон бусад тооцоолол хийх, түүнчлэн чухал утгуудын хүснэгттэй эвлэрэх ажлаас өөрсдийгөө чөлөөлдөг.

Манай тохиолдолд, CH2.TEST жишээн дээрх шиг CH2.DIST.RT = 0.000466219908895455

Анхаарна уу

Excel дээр Chi-квадратыг тооцоолох энэхүү томъёо нь 2X2 хүснэгтийг тооцоолоход тохиромжтой, учир нь та өөрөө Хи квадратыг эмпирик гэж үздэг бөгөөд тооцоололд тасралтгүй байдлын залруулга оруулж болно.

Тайлбар 2

Мөн HI2.DIS томъёо байдаг (та үүнийг excel дээр зайлшгүй харах болно) - энэ нь зүүн гартай магадлалыг тооцоолдог (хэрэв энэ нь энгийн бол зүүн гарыг 1 гэж үзнэ - баруун гартай, өөрөөр хэлбэл бид зүгээр л эргүүлнэ. томьёо, тиймээс би үүнийг Chi квадратын тооцоонд өгөөгүй, бидний жишээнд CHI2.DIST = 0.999533780091105.
Нийт CH2.DIST + CH2.DIST.RT = 1.

chi2.ex.ph

Чи-квадрат тархалтын баруун гар талын магадлалын эсрэг хариуг буцаана (эсвэл өгөгдсөн магадлалын түвшин болон эрх чөлөөний зэрэглэлийн тооны хи-квадрат утга)

Синаксис

XI2.INV.RT(магадлал, эрх чөлөөний_зэрэг)

Дүгнэлт

Үнэнийг хэлэхэд үр дүн нь яг яаж гарсныг би мэдэхгүй excel дээр хи квадратын тооцоо SPSS дээр Хи-квадратыг тооцоолох үр дүнгээс ялгаатай. Би яг ойлгож байна. Энэ нь өөр, учир нь зөвхөн Chi-г бие даан тооцоолох үед квадрат утгууд нь дугуйрч, тодорхой тооны аравтын орон алга болдог. Гэхдээ шүүмжлэлтэй биш гэж бодож байна. Хи квадратын тархалтын магадлал 0.05 босго (p-утга) ойрхон байгаа тохиолдолд л даатгуулахыг зөвлөж байна.

Тасралтгүй байдлын засварыг тооцохгүй байгаа нь тийм ч сайн зүйл биш юм - бид 2X2 хүснэгтэд маш их тооцоолдог. Тиймээс бид 2X2 хүснэгтийг тооцоолохдоо оновчлолд бараг хүрдэггүй

Гэсэн хэдий ч дээрх мэдлэг нь илүү чухал зүйлд цаг хэмнэхийн тулд excel дээр Chi квадратын тооцоог бага зэрэг хурдан хийхэд хангалттай гэж бодож байна.

Биологийн судалгааны практикт ихэвчлэн тодорхой таамаглалыг турших шаардлагатай байдаг, тухайлбал, туршилт хийгчийн олж авсан баримт материал нь онолын таамаглалыг хэр зэрэг баталж, дүн шинжилгээ хийсэн өгөгдөл нь онолын хувьд хүлээгдэж буй мэдээлэлтэй хэр зэрэг давхцаж байгааг олж мэдэх явдал юм. Бодит өгөгдөл ба онолын хүлээлтийн хоорондын зөрүүг статистикийн хувьд үнэлж, ямар тохиолдолд, ямар магадлалаар энэ ялгааг найдвартай гэж үзэж болох, харин эсрэгээр, хэзээ ач холбогдолгүй, ач холбогдолгүй гэж үзэх ёстойг тогтоох асуудал гарч ирдэг. боломж. Сүүлчийн тохиолдолд таамаглалыг хэвээр үлдээж, үүний үндсэн дээр онолын хувьд хүлээгдэж буй өгөгдөл эсвэл үзүүлэлтүүдийг тооцдог. арга хи-квадрат (χ 2). Энэ хэмжигдэхүүнийг ихэвчлэн Пирсоны "тохирох тест" эсвэл "тохирох тест" гэж нэрлэдэг. Түүний тусламжтайгаар эмпирик байдлаар олж авсан өгөгдөл болон онолын хувьд хүлээгдэж буй өгөгдөл хоорондын захидал харилцааны түвшинг янз бүрийн магадлалаар шүүж болно.

Албан ёсны үүднээс авч үзвэл хоёр вариацын цуврал, хоёр популяцийг харьцуулж үздэг: нэг нь эмпирик тархалт, нөгөө нь ижил параметртэй түүвэр ( n, М, Сболон бусад) нь эмпирик боловч түүний давтамжийн хуваарилалт нь сонгосон онолын хуульд (хэвийн, Пуассон, бином гэх мэт) чанд нийцүүлэн баригдсан бөгөөд энэ нь судалж буй санамсаргүй хэмжигдэхүүний зан төлөвт захирагддаг.

Ерөнхийдөө тохирох шалгуурын томъёог дараах байдлаар бичиж болно.

хаана а -бодит ажиглалтын давтамж,

А-тухайн ангийн онолын хувьд хүлээгдэж буй давтамж.

Тэг таамаглал нь харьцуулсан тархалтын хооронд мэдэгдэхүйц ялгаа байхгүй гэж үздэг. Эдгээр ялгааны ач холбогдлыг үнэлэхийн тулд эгзэгтэй хи-квадрат утгуудын тусгай хүснэгтэд хандах хэрэгтэй (Хүснэгт 9). П) болон тооцоолсон утгыг харьцуулах χ 2-р хүснэгтийн дагуу эмпирик тархалт нь онолынхоос ихээхэн хазайсан эсэхийг шийднэ. Тиймээс эдгээр ялгаа байхгүй гэсэн таамаглалыг үгүйсгэх эсвэл батлах болно. Хэрэв тооцоолсон утга χ 2 нь хүснэгттэй тэнцүү буюу хэтэрсэн байна χ ² ( α , df), эмпирик тархалт нь онолынхоос эрс ялгаатай болохыг шийднэ. Тиймээс эдгээр ялгаа байхгүй гэсэн таамаглал няцаагдах болно. Хэрэв χ ² < χ ² ( α , df), тэг таамаглал хүчинтэй хэвээр байна. Ач холбогдлын хүлээн зөвшөөрөгдсөн түвшинг харгалзан үзэхийг ерөнхийд нь хүлээн зөвшөөрдөг α = 0.05, учир нь энэ тохиолдолд тэг таамаглал зөв байх магадлал ердөө 5%, тиймээс үүнийг үгүйсгэх хангалттай шалтгаан (95%) байна.


Тодорхой асуудал бол эрх чөлөөний зэрэглэлийн тоог зөв тодорхойлох явдал юм ( df), шалгуур үзүүлэлтийн утгыг хүснэгтээс авсан болно. Нийт ангиудын тооноос эрх чөлөөний зэрэглэлийн тоог тодорхойлох кта хязгаарлалтын тоог (өөрөөр хэлбэл онолын давтамжийг тооцоолоход ашигласан параметрийн тоог) хасах хэрэгтэй.

Судалж буй шинж чанарын тархалтын төрлөөс хамааран эрх чөлөөний зэрэглэлийн тоог тооцоолох томъёо өөрчлөгдөнө. Учир нь хувилбархуваарилалт ( к= 2) тооцоонд зөвхөн нэг параметр (түүврийн хэмжээ) оролцдог тул эрх чөлөөний зэрэг нь df= к−1=2−1=1. Учир нь олон гишүүнттүгээлтийн томъёо ижил байна: df= к-1. Вариацын цувралын тархалттай нийцэж байгаа эсэхийг шалгах Пуассонхоёр параметрийг аль хэдийн ашигласан - түүврийн хэмжээ ба дундаж утга (тоон хувьд хэлбэлзэлтэй давхцах); эрх чөлөөний зэрэглэлийн тоо df= к−2. Эмпирик тархалтын захидал харилцааг шалгахдаа хувилбар хэвийнэсвэл биномХуулийн дагуу эрх чөлөөний зэрэглэлийн тоог бодит ангиудын тооноос цуваа байгуулах гурван нөхцөлийг хасч авна - түүврийн хэмжээ, дундаж ба дисперс, df= к−3. χ² шалгуур нь зөвхөн дээж дээр ажилладаг гэдгийг нэн даруй тэмдэглэх нь зүйтэй хамгийн багадаа 25 сонголтын эзэлхүүн, мөн бие даасан ангиудын давтамж байх ёстой дор хаяж 4.

Нэгдүгээрт, бид дүн шинжилгээний жишээн дээр хи-квадрат тестийн хэрэглээг тайлбарлав альтернатив хэлбэлзэл. Улаан лоолийн удамшлыг судлах туршилтын нэгэнд 3629 улаан, 1176 шар жимс олджээ. Хоёр дахь эрлийз үеийн шинж чанарыг хуваах давтамжийн онолын харьцаа нь 3: 1 (75% -иас 25%) байх ёстой. Хэрэгжиж байгаа юу? Өөрөөр хэлбэл, энэ түүврийг давтамжийн харьцаа 3:1 эсвэл 0,75:0,25 байх ижил ерөнхий популяциас авсан уу?

Эмпирик давтамжийн утгууд болон онолын давтамжийг тооцоолох үр дүнг томъёогоор дүүргэж хүснэгтийг (Хүснэгт 4) байгуулцгаая.

A = n∙p,

хаана х- онолын давтамж (өгөгдсөн төрлийн хувилбарын хувь хэмжээ),

n-дээжийн хэмжээ.

Жишээлбэл, А 2 = n∙p 2 = 4805∙0.25 = 1201.25 ≈ 1201.

χ 2 шалгуурын зорилго - Пирсоны шалгуур χ 2 шалгуурыг хоёр зорилгоор ашигладаг: 1) шинж чанарын эмпирик тархалтыг онолын шинжтэй харьцуулах - жигд, хэвийн эсвэл бусад; 2) ижил шинж чанарын хоёр, гурав ба түүнээс дээш эмпирик тархалтыг харьцуулах. Шалгуурын тодорхойлолт χ 2 шалгуур нь эмпирик ба онолын тархалтад ижил давтамжтай эсвэл хоёр ба түүнээс дээш эмпирик тархалтад шинж чанарын өөр утгууд тохиолддог уу гэсэн асуултад хариулдаг. Аргын давуу тал нь нэрсийн масштабаас эхлээд ямар ч масштабаар танилцуулсан шинж чанаруудын тархалтыг харьцуулах боломжийг олгодог. Альтернатив хуваарилалтын хамгийн энгийн тохиолдолд "тийм - үгүй", "гэрлэсэн - гэрлэлтийг зөвшөөрөөгүй", "асуудлыг шийдсэн - асуудлыг шийдээгүй" гэх мэт, бид аль хэдийн χ 2 шалгуурыг хэрэглэж болно. Харьцуулж болох хоёр тархалтын хоорондын зөрүү их байх тусам эмпирик утга нь χ 2 байна. χ 2 - Пирсоны шалгуурыг автоматаар тооцоолох χ 2 - Пирсоны шалгуурыг автоматаар тооцоолохын тулд хоёр алхам хийх шаардлагатай: 1-р алхам. Эмпирик тархалтын тоог зааж өгөх (1-ээс 10 хүртэл); Алхам 2. Эмпирик давтамжийг хүснэгтэд оруулна уу; Алхам 3. Хариултаа аваарай.

Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: үүнийг янз бүрийн тархалтын хуулиудын талаархи таамаглалыг шалгахад ашиглаж болно.

1. Хэвийн тархалтын таамаглалыг шалгах.

Хангалттай том хэмжээтэй дээж авъя Пмаш олон янзын хувилбарын утгатай. Боловсруулахад тав тухтай байхын тулд бид интервалыг хувилбарын утгуудын хамгийн багаас хамгийн том хүртэл хуваана. стэнцүү хэсгүүд байх ба интервал тус бүрт хамаарах сонголтуудын утгууд нь интервалын дундыг заасан тоотой ойролцоогоор тэнцүү байна гэж бид таамаглах болно. Интервал бүрт унасан сонголтуудын тоог тоолсны дараа бид бүлэглэсэн түүврийг хийх болно.

сонголтууд ……….. X 1 X 2 … х с

давтамж …………. П 1 П 2 … н с ,

хаана x iинтервалуудын дунд цэгүүдийн утгууд ба n iҮүнд багтсан сонголтуудын тоо юм би th интервал (эмпирик давтамж).



Хүлээн авсан өгөгдөл дээр үндэслэн түүврийн дундаж болон түүврийн стандарт хазайлтыг тооцоолох боломжтой σ Б. Нийт хүн ам хэвийн хуулийн дагуу тархсан гэсэн таамаглалыг параметрүүдээр шалгая М(X) = , Д(X) =. Дараа нь та эзлэхүүний дээжээс тооны тоог олох боломжтой П, энэ таамаглалын дагуу интервал бүрт байх ёстой (өөрөөр хэлбэл онолын давтамж). Үүнийг хийхийн тулд Лаплас функцийн утгуудын хүснэгтийг ашиглан бид цохих магадлалыг олно би-р интервал:

,

хаана a iТэгээд б би- хил би--р интервал. Үүссэн магадлалыг түүврийн хэмжээ n-ээр үржүүлээд бид онолын давтамжийг олно. p i =n p i.Бидний зорилго бол мэдээжийн хэрэг өөр хоорондоо ялгаатай эмпирик болон онолын давтамжийг харьцуулж, эдгээр ялгаа нь ач холбогдолгүй, судалж буй санамсаргүй хэмжигдэхүүний хэвийн тархалтын таамаглалыг үгүйсгэхгүй, эсвэл тэдгээр нь өөр хоорондоо ялгаатай эсэхийг олж мэдэх явдал юм. маш том тул энэ таамаглалтай зөрчилдөж байна. Үүний тулд санамсаргүй хэмжигдэхүүн хэлбэрээр шалгуурыг ашигладаг

. (20.1)

Үүний утга нь тодорхой байна: эмпирик давтамжийн онолын давтамжаас харгалзах онолын давтамжаас хазайсан квадратууд болох хэсгүүдийг нэгтгэн дүгнэв. Нийт хүн амын бодит тархалтын хуулиас үл хамааран санамсаргүй хэмжигдэхүүний (20.1) тархалтын хууль нь эрх чөлөөний зэрэгтэй тархалтын хуульд (12-р лекцийг үзнэ үү) чиглэдэг болохыг баталж болно. k = s - 1 – r, хаана rтүүврийн өгөгдлөөр тооцоолсон тооцоолсон тархалтын параметрийн тоо. Хэвийн тархалт нь хоёр параметрээр тодорхойлогддог тул k = s - 3. Сонгосон шалгуурын хувьд нөхцөлөөр тодорхойлогдсон баруун гар талын чухал бүсийг байгуулна

(20.2)

хаана α - ач холбогдлын түвшин. Тиймээс эгзэгтэй мужийг тэгш бус байдлаар өгнө ба таамаглалыг хүлээн авах талбар нь .

Тиймээс тэг таамаглалыг шалгах Х 0: популяци хэвийн тархсан - та түүврээс шалгуур үзүүлэлтийн ажиглагдсан утгыг тооцоолох хэрэгтэй.

, (20.1`)

χ 2 тархалтын эгзэгтэй цэгүүдийн хүснэгтийн дагуу α ба 2-ын мэдэгдэж буй утгуудыг ашиглан эгзэгтэй цэгийг ол. k = s - 3. Хэрэв - тэг таамаглалыг хүлээн зөвшөөрнө, үгүйсгэвэл.

2. Нэг төрлийн тархалтын таамаглалыг шалгах.

Таамагласан нягтрал бүхий нийт хүн амын жигд тархалтын таамаглалыг шалгахын тулд Пирсон тестийг ашиглахдаа

боломжтой дээжээс утгыг тооцоолсны дараа параметрүүдийг тооцоолох шаардлагатай гэхдээТэгээд бтомъёоны дагуу:

хаана гэхдээ*Тэгээд б*- тооцоолол гэхдээТэгээд б. Үнэхээр жигд хуваарилалтын төлөө М(X) = , , тодорхойлох системийг хаанаас авч болно гэхдээ*Тэгээд б*: , шийдэл нь илэрхийллүүд (20.3).

Дараа нь тэгж тооцвол , та томъёог ашиглан онолын давтамжийг олох боломжтой

Энд снь дээжийг хуваах интервалын тоо юм.

Пирсоны шалгуурын ажиглагдсан утгыг (20.1`) томъёогоор, эгзэгтэй утгыг эрх чөлөөний зэрэглэлийн тоог харгалзан хүснэгтээс тооцно. k = s - 3. Үүний дараа эгзэгтэй мужийн хил хязгаарыг хэвийн тархалтын таамаглалыг шалгахтай адил тодорхойлно.

3. Экспоненциал тархалтын талаарх таамаглалыг шалгах.

Энэ тохиолдолд одоо байгаа дээжийг ижил урттай интервалд хуваахдаа бид бие биенээсээ ижил зайд байгаа сонголтуудын дарааллыг авч үзэх болно (бид үүнд хамаарах бүх сонголтууд гэж үздэг. би-р интервал, дунд нь давхцаж буй утгыг авна), тэдгээрийн харгалзах давтамжийг авна n i(түүний сонголтуудын тоо би- th интервал). Эдгээр өгөгдлүүдээс бид тооцоолж, параметрийн тооцооллыг авдаг λ үнэ цэнэ. Дараа нь онолын давтамжийг томъёогоор тооцоолно

Дараа нь эрх чөлөөний зэрэглэлийн тоог харгалзан Пирсоны шалгуурын ажиглагдсан ба чухал утгыг харьцуулна. k = s - 2.