Tiesinė porinė regresinė analizė. Eksperimentinių duomenų aproksimacija

Mažiausių kvadratų metodo esmė yra ieškant trendo modelio parametrų, geriausiai apibūdinančių bet kurio atsitiktinio reiškinio raidos tendenciją laike ar erdvėje (trendas – šios raidos tendenciją apibūdinanti linija). Mažiausių kvadratų metodo (OLS) užduotis yra rasti ne tik kokį nors tendencijų modelį, bet ir rasti geriausią ar optimalų modelį. Šis modelis bus optimalus, jei stebimų faktinių verčių ir atitinkamų apskaičiuotų tendencijų verčių kvadratinių nuokrypių suma yra minimali (mažiausia):

kur yra standartinis nuokrypis tarp stebimos tikrosios vertės

ir atitinkama apskaičiuota tendencijos vertė,

Tikroji (stebėta) tiriamo reiškinio vertė,

Numatoma tendencijų modelio vertė,

Tiriamo reiškinio stebėjimų skaičius.

MNC retai naudojamas atskirai. Paprastai koreliacijos tyrimuose jis dažniausiai naudojamas tik kaip būtina technika. Reikia atsiminti, kad LSM informacinė bazė gali būti tik patikima statistinė eilutė, o stebėjimų skaičius neturėtų būti mažesnis nei 4, priešingu atveju LSM išlyginimo procedūros gali prarasti sveiką protą.

OLS įrankių rinkinys yra sumažintas iki šių procedūrų:

Pirmoji procedūra. Pasirodo, ar apskritai yra tendencija keisti gautą atributą, kai pasikeičia pasirinktas veiksnys-argumentas, arba, kitaip tariant, ar yra ryšys tarp " adresu "ir" X ».

Antroji procedūra. Nustatoma, kuri linija (trajektorija) geriausiai gali apibūdinti ar charakterizuoti šią tendenciją.

Trečia procedūra.

Pavyzdys. Tarkime, kad turime informaciją apie vidutinį saulėgrąžų derlių tiriamame ūkyje (9.1 lentelė).

9.1 lentelė

Stebėjimo numeris

Produktyvumas, k/ha

Kadangi saulėgrąžų gamybos technologijos lygis mūsų šalyje per pastaruosius 10 metų beveik nepasikeitė, tai reiškia, kad greičiausiai derliaus svyravimai analizuojamu laikotarpiu labai priklausė nuo oro ir klimato sąlygų svyravimų. Ar tai tiesa?

Pirmoji MNC procedūra. Tikrinama hipotezė apie saulėgrąžų derliaus kitimo tendencijos egzistavimą, priklausomai nuo oro ir klimato sąlygų pokyčių per analizuojamus 10 metų.

Šiame pavyzdyje „ y » patartina imti saulėgrąžų derlių, o « x » yra stebimų metų skaičius analizuojamu laikotarpiu. Hipotezės apie bet kokį ryšį tarp " x "ir" y » galima atlikti dviem būdais: rankiniu būdu ir kompiuterinių programų pagalba. Žinoma, esant kompiuterinėms technologijoms, ši problema išsprendžiama savaime. Tačiau norint geriau suprasti OLS įrankių rinkinį, patartina patikrinti hipotezę apie ryšį tarp " x "ir" y » rankiniu būdu, kai po ranka tik rašiklis ir paprastas skaičiuotuvas. Tokiais atvejais tendencijos egzistavimo hipotezę vizualiai geriausia patikrinti analizuojamos laiko eilutės grafinio vaizdo vieta – koreliacijos laukas:

Mūsų pavyzdyje koreliacijos laukas yra aplink lėtai kylančią liniją. Tai savaime rodo, kad egzistuoja tam tikra saulėgrąžų derliaus kitimo tendencija. Neįmanoma kalbėti apie bet kokios tendencijos buvimą tik tada, kai koreliacijos laukas atrodo kaip apskritimas, apskritimas, griežtai vertikalus ar griežtai horizontalus debesis arba susideda iš atsitiktinai išsibarsčiusių taškų. Visais kitais atvejais būtina patvirtinti hipotezę, kad egzistuoja ryšys tarp " x "ir" y ir tęsti tyrimus.

Antroji MNC procedūra. Nustatoma, kuri linija (trajektorija) geriausiai gali apibūdinti ar charakterizuoti saulėgrąžų derliaus kitimo tendenciją analizuojamu laikotarpiu.

Esant kompiuterinėms technologijoms, optimalios tendencijos pasirinkimas vyksta automatiškai. Naudojant „rankinį“ apdorojimą, optimalios funkcijos pasirinkimas, kaip taisyklė, atliekamas vizualiai - pagal koreliacijos lauko vietą. Tai yra, pagal diagramos tipą pasirenkama linijos lygtis, kuri geriausiai atitinka empirinę tendenciją (faktinę trajektoriją).

Kaip žinia, gamtoje egzistuoja didžiulė funkcinių priklausomybių įvairovė, todėl vizualiai išanalizuoti net nedidelę jų dalį itin sunku. Laimei, realioje ekonominėje praktikoje daugumą santykių galima tiksliai apibūdinti arba parabole, arba hiperbole, arba tiesia linija. Šiuo atžvilgiu naudodamiesi „rankiniu“ geriausios funkcijos pasirinkimu, galite apsiriboti tik šiais trimis modeliais.

Hiperbolė:

Antrosios eilės parabolė: :

Nesunku pastebėti, kad mūsų pavyzdyje saulėgrąžų derliaus kitimo tendenciją per analizuojamus 10 metų geriausiai apibūdina tiesia linija, todėl regresijos lygtis bus tiesioji lygtis.

Trečia procedūra. Apskaičiuojami šią tiesę apibūdinančios regresijos lygties parametrai, kitaip tariant, nustatoma analitinė formulė, apibūdinanti geriausią tendencijos modelį.

Regresijos lygties parametrų reikšmių radimas, mūsų atveju, parametrai ir , yra LSM šerdis. Šis procesas sumažinamas iki normalių lygčių sistemos sprendimo.

(9.2)

Ši lygčių sistema gana lengvai išsprendžiama Gauso metodu. Prisiminkite, kad dėl sprendimo mūsų pavyzdyje randamos ir parametrų reikšmės. Taigi rasta regresijos lygtis turės tokią formą:

Kuris randa plačiausią pritaikymą įvairiose mokslo ir praktikos srityse. Tai gali būti fizika, chemija, biologija, ekonomika, sociologija, psichologija ir t. t. ir taip toliau. Likimo valia man dažnai tenka susidurti su ekonomika, todėl šiandien pasirūpinsiu jums bilietu į nuostabią šalį, vadinamą Ekonometrija=) ... Kaip tu to nenori?! Ten labai gerai – tereikia apsispręsti! …Tačiau tikriausiai tikrai norite išmokti spręsti problemas mažiausių kvadratų. O ypač stropūs skaitytojai išmoks juos išspręsti ne tik tiksliai, bet ir LABAI GREITAI ;-) Bet pirmiausia bendras problemos išdėstymas+ susijęs pavyzdys:

Tegul rodikliai tiriami kokioje nors dalykinėje srityje, kuri turi kiekybinę išraišką. Tuo pačiu yra pagrindo manyti, kad rodiklis priklauso nuo rodiklio. Ši prielaida gali būti ir mokslinė hipotezė, ir pagrįsta elementariu sveiku protu. Tačiau palikime mokslą nuošalyje ir tyrinėkime patrauklesnes sritis – būtent bakalėjos parduotuves. Žymėti:

– maisto prekių parduotuvės prekybinės patalpos, kv.m.
- maisto prekių parduotuvės metinė apyvarta, milijonai rublių.

Visiškai aišku, kad kuo didesnis parduotuvės plotas, tuo daugeliu atvejų didesnė jos apyvarta.

Tarkime, atlikę stebėjimus / eksperimentus / skaičiavimus / šokius su tamburinu, turime skaitinius duomenis:

Su bakalėjos parduotuvėmis, manau, viskas aišku: - tai 1-os parduotuvės plotas, - jos metinė apyvarta, - 2-os parduotuvės plotas, - jos metinė apyvarta ir t.t. Beje, prieiti prie įslaptintos medžiagos visai nebūtina – gana tikslų apyvartos įvertinimą galima gauti naudojant matematinė statistika. Tačiau nesiblaškykite, komercinio šnipinėjimo kursas jau mokamas =)

Lentelinius duomenis taip pat galima rašyti taškų forma ir pavaizduoti mums įprastu būdu. Dekarto sistema .

Atsakykime į svarbų klausimą: kiek balų reikia kokybiniam tyrimui?

Kuo didesnis, tuo geriau. Minimalus leistinas rinkinys susideda iš 5-6 balų. Be to, esant nedideliam duomenų kiekiui, „nenormalūs“ rezultatai neturėtų būti įtraukti į imtį. Taigi, pavyzdžiui, maža elitinė parduotuvė gali padėti daug daugiau nei „jų kolegos“, taip iškraipydami bendrą modelį, kurį reikia rasti!

Jei tai gana paprasta, turime pasirinkti funkciją, tvarkaraštį kuri eina kuo arčiau taškų . Tokia funkcija vadinama apytikslis (apytikslis - apytikslis) arba teorinė funkcija . Paprastai tariant, čia iš karto atsiranda akivaizdus „apsimetiklis“ - aukšto laipsnio daugianario, kurio grafikas eina per VISUS taškus. Tačiau ši parinktis yra sudėtinga ir dažnai tiesiog neteisinga. (nes diagrama „vėjas“ visą laiką ir prastai atspindės pagrindinę tendenciją).

Taigi norima funkcija turi būti pakankamai paprasta ir tuo pačiu adekvačiai atspindėti priklausomybę. Kaip jau galima spėti, vienas iš būdų rasti tokias funkcijas vadinamas mažiausių kvadratų. Pirmiausia bendrai panagrinėkime jo esmę. Tegul kuri nors funkcija apytiksliai atitinka eksperimentinius duomenis:


Kaip įvertinti šio aproksimavimo tikslumą? Taip pat apskaičiuokime skirtumus (nukrypimus) tarp eksperimentinių ir funkcinių verčių (mes studijuojame piešinį). Pirma mintis, kuri ateina į galvą, yra įvertinti, kokia suma yra didelė, tačiau problema ta, kad skirtumai gali būti neigiami. (pavyzdžiui, ) ir nukrypimai dėl tokio sumavimo panaikins vienas kitą. Todėl, kaip aproksimacijos tikslumo įvertinimą, ji siūlo paimti sumą moduliai nukrypimai:

arba sulankstyta forma: (staiga, kas nežino: yra sumos piktograma ir yra pagalbinis kintamasis - "skaitiklis", kuris paima reikšmes nuo 1 iki ).

Apytiksliai eksperimentinius taškus su skirtingomis funkcijomis gausime skirtingas reikšmes ir akivaizdu, kad kur ši suma mažesnė, ta funkcija tikslesnė.

Toks metodas egzistuoja ir vadinamas mažiausio modulio metodas. Tačiau praktikoje jis tapo daug plačiau paplitęs. mažiausių kvadratų metodas, kuriame galimos neigiamos reikšmės pašalinamos ne pagal modulį, o padalijus nuokrypius kvadratu:

, po kurio pastangos nukreipiamos į tokios funkcijos parinkimą, kad kvadratinių nuokrypių suma buvo kuo mažesnis. Tiesą sakant, iš čia ir kilo metodo pavadinimas.

Ir dabar grįžtame prie kito svarbaus dalyko: kaip minėta aukščiau, pasirinkta funkcija turėtų būti gana paprasta, tačiau tokių funkcijų taip pat yra daug: linijinis , hiperbolinis, eksponentinis, logaritminis, kvadratinis ir tt Ir, žinoma, čia iš karto norėčiau „sumažinti veiklos sritį“. Kokią funkcijų klasę pasirinkti tyrimui? Primityvi, bet efektyvi technika:

- Lengviausias būdas traukti taškus brėžinyje ir išanalizuokite jų vietą. Jei jie linkę būti tiesia linija, tuomet turėtumėte ieškoti tiesios linijos lygtis su optimaliomis reikšmėmis ir . Kitaip tariant, užduotis yra rasti TOKIUS koeficientus – kad kvadratinių nuokrypių suma būtų mažiausia.

Jei taškai yra, pavyzdžiui, išilgai hiperbolė, tada aišku, kad tiesinė funkcija duos prastą aproksimaciją. Šiuo atveju mes ieškome „palankiausių“ hiperbolės lygties koeficientų - tie, kurie duoda mažiausią kvadratų sumą .

Dabar atkreipkite dėmesį, kad abiem atvejais kalbame apie dviejų kintamųjų funkcijos, kurio argumentai yra ieškojo priklausomybės parinkčių:

Ir iš esmės reikia išspręsti standartinę problemą – surasti mažiausiai dviejų kintamųjų funkcijos.

Prisiminkite mūsų pavyzdį: tarkime, kad „parduotuvės“ taškai paprastai yra tiesioje linijoje ir yra pagrindo tikėti, kad yra tiesinė priklausomybė apyvartos iš prekybos zonos. Raskime TOKIUS koeficientus "a" ir "būti", kad kvadratinių nuokrypių suma buvo mažiausias. Viskas kaip įprasta – pirma I eilės daliniai vediniai. Pagal tiesiškumo taisyklė galite atskirti tiesiai po sumos piktograma:

Jei norite šią informaciją panaudoti rašiniui ar kursiniam darbui, būsiu labai dėkingas už nuorodą šaltinių sąraše, tokių detalių skaičiavimų niekur nerasite:

Sukurkime standartinę sistemą:

Kiekvieną lygtį sumažiname „dviem“ ir, be to, „išskaidome“ sumas:

Pastaba : savarankiškai analizuokite, kodėl „a“ ir „be“ galima išimti iš sumos piktogramos. Beje, formaliai tai galima padaryti su suma

Perrašykime sistemą „taikoma“ forma:

po kurio pradedamas brėžti mūsų problemos sprendimo algoritmas:

Ar žinome taškų koordinates? Mes žinome. Sumos ar galime rasti? Lengvai. Mes sudarome paprasčiausią dviejų tiesinių lygčių su dviem nežinomaisiais sistema(„a“ ir „beh“). Mes išsprendžiame sistemą, pvz. Cramerio metodas, todėl susidaro stacionarus taškas . Tikrinama pakankama sąlyga ekstremumui, galime patikrinti, ar šiuo metu funkcija tiksliai pasiekia minimumas. Patikrinimas yra susijęs su papildomais skaičiavimais, todėl paliksime jį užkulisiuose. (jei reikia, trūkstamą kadrą galima peržiūrėti). Padarome galutinę išvadą:

Funkcija geriausias būdas (bent jau lyginant su bet kuria kita tiesine funkcija) priartina eksperimentinius taškus . Grubiai tariant, jo grafikas eina kuo arčiau šių taškų. Pagal tradiciją ekonometrija taip pat vadinama gauta aproksimacinė funkcija suporuota tiesinės regresijos lygtis .

Nagrinėjama problema turi didelę praktinę reikšmę. Mūsų pavyzdyje – lygtis leidžia numatyti, kokia apyvarta ("yig") bus parduotuvėje su vienokia ar kitokia pardavimo ploto verte (viena ar kita "x" reikšmė). Taip, gauta prognozė bus tik prognozė, tačiau daugeliu atvejų ji pasirodys gana tiksli.

Išanalizuosiu tik vieną problemą su „tikraisiais“ skaičiais, nes joje nėra jokių sunkumų - visi skaičiavimai yra 7-8 klasių mokyklos programos lygiu. 95 procentais atvejų jūsų bus paprašyta rasti tiesiog tiesinę funkciją, tačiau pačioje straipsnio pabaigoje parodysiu, kad optimalios hiperbolės, eksponento ir kai kurių kitų funkcijų lygtis rasti nėra sunkiau.

Tiesą sakant, belieka išdalinti žadėtas gėrybes – kad išmoktumėte tokius pavyzdžius išspręsti ne tik tiksliai, bet ir greitai. Atidžiai studijuojame standartą:

Užduotis

Ištyrus ryšį tarp dviejų rodiklių, gautos šios skaičių poros:

Naudodami mažiausių kvadratų metodą, raskite tiesinę funkciją, kuri geriausiai atitinka empirinę funkciją (Patyręs) duomenis. Padarykite brėžinį, kuriame Dekarto stačiakampėje koordinačių sistemoje nubraižykite eksperimentinius taškus ir aproksimacinės funkcijos grafiką . Raskite kvadratinių nuokrypių tarp empirinių ir teorinių verčių sumą. Sužinokite, ar funkcija geresnė (pagal mažiausiųjų kvadratų metodą) apytiksliai eksperimentiniai taškai.

Atkreipkite dėmesį, kad „x“ reikšmės yra natūralios vertybės, ir tai turi būdingą prasmingą reikšmę, apie kurią pakalbėsiu šiek tiek vėliau; bet jie, žinoma, gali būti trupmeniniai. Be to, priklausomai nuo konkrečios užduoties turinio, „X“ ir „G“ reikšmės gali būti visiškai arba iš dalies neigiamos. Na, mes gavome „beveidę“ užduotį, ir mes ją pradedame sprendimas:

Kaip sistemos sprendimą randame optimalios funkcijos koeficientus:

Kad žymėjimas būtų kompaktiškesnis, kintamąjį „skaitiklis“ galima praleisti, nes jau aišku, kad sumavimas atliekamas nuo 1 iki .

Patogiau reikiamas sumas apskaičiuoti lentelės forma:


Skaičiavimai gali būti atliekami naudojant mikroskaičiuotuvą, tačiau daug geriau naudoti „Excel“ - ir greičiau, ir be klaidų; žiūrėkite trumpą vaizdo įrašą:

Taigi gauname štai ką sistema:

Čia galite padauginti antrą lygtį iš 3 ir iš 1-osios lygties atimkite 2-ąjį dėmenį. Bet tai yra sėkmė – praktikoje sistemos dažnai nėra padovanotos, ir tokiais atvejais tai gelbsti Cramerio metodas:
, todėl sistema turi unikalų sprendimą.

Patikrinkime. Suprantu, kad nenoriu, bet kam praleisti klaidas ten, kur jų tikrai negalima praleisti? Rastą sprendimą pakeiskite kiekvienos sistemos lygties kairėje pusėje:

Gaunamos tinkamos atitinkamų lygčių dalys, o tai reiškia, kad sistema išspręsta teisingai.

Taigi norima aproksimacinė funkcija: – nuo visos tiesinės funkcijos eksperimentinius duomenis geriausiai atitinka jis.

Skirtingai nei tiesiai parduotuvės apyvartos priklausomybė nuo jos ploto, nustatyta priklausomybė yra atvirkščiai (principas "kuo daugiau - tuo mažiau"), ir šį faktą iš karto atskleidžia neigiamas kampo koeficientas. Funkcija informuoja, kad padidėjus tam tikram rodikliui 1 vienetu, priklausomo rodiklio reikšmė mažėja vidutinis 0,65 vnt. Kaip sakoma, kuo didesnė grikių kaina, tuo mažiau parduodama.

Norėdami nubraižyti apytikslę funkciją, randame dvi jos reikšmes:

ir atlikite piešinį:


Sukonstruota linija vadinama tendencijų linija (būtent linijinė tendencijos linija, t. y. bendruoju atveju tendencija nebūtinai yra tiesi linija). Visiems žinomas posakis „būti tendencijoje“, ir manau, kad šiam terminui papildomų komentarų nereikia.

Apskaičiuokite kvadratinių nuokrypių sumą tarp empirinių ir teorinių vertybių. Geometriškai tai yra „raudonųjų“ atkarpų ilgių kvadratų suma (iš kurių du tokie maži, kad net nesimatote).

Apibendrinkime skaičiavimus lentelėje:


Jie vėl gali būti atliekami rankiniu būdu, tik tuo atveju, jei pateiksiu 1 punkto pavyzdį:

bet daug efektyviau daryti jau žinomu būdu:

Pakartokime: kokia rezultato prasmė?visos tiesinės funkcijos funkcija eksponentas yra mažiausias, tai yra, jis yra geriausias aproksimacija savo šeimoje. Ir čia, beje, galutinis problemos klausimas neatsitiktinis: o jeigu siūloma eksponentinė funkcija ar bus geriau apytiksliai eksperimento taškus?

Raskime atitinkamą kvadratinių nuokrypių sumą – kad juos atskirčiau, pažymėsiu raide „epsilon“. Technika lygiai tokia pati:


Ir vėl kiekvienam gaisro skaičiavimui 1 taškui:

Programoje „Excel“ naudojame standartinę funkciją EXP (Sintaksę galite rasti „Excel“ žinyne).

Išvada: , todėl eksponentinė funkcija eksperimentinius taškus aproksimuoja blogiau nei tiesė .

Bet čia reikia pažymėti, kad „blogiau“ yra dar nereiškia, kas blogai. Dabar sukūriau šios eksponentinės funkcijos grafiką – ji taip pat eina arti taškų - tiek, kad be analitinio tyrimo sunku pasakyti, kuri funkcija tikslesnė.

Tai užbaigia sprendimą, o aš grįžtu prie ginčo gamtinių vertybių klausimo. Įvairiuose tyrimuose, kaip taisyklė, ekonominiai ar sociologiniai mėnesiai, metai ar kiti vienodi laiko intervalai numeruojami natūraliu „X“. Apsvarstykite, pavyzdžiui, tokią problemą.

Jei koks nors fizinis dydis priklauso nuo kito dydžio, tai šią priklausomybę galima ištirti išmatuojant y esant skirtingoms x reikšmėms. Atlikus matavimus gaunama verčių serija:

x 1 , x 2 , ..., x i , ... , x n ;

y 1 , y 2 , ..., y i , ... , y n .

Remiantis tokio eksperimento duomenimis, galima nubraižyti priklausomybę y = ƒ(x). Gauta kreivė leidžia spręsti apie funkcijos ƒ(x) formą. Tačiau pastovūs koeficientai, kurie patenka į šią funkciją, lieka nežinomi. Juos galima nustatyti mažiausių kvadratų metodu. Eksperimentiniai taškai, kaip taisyklė, nėra tiksliai ant kreivės. Mažiausių kvadratų metodas reikalauja, kad eksperimentinių taškų nuokrypių nuo kreivės kvadratų suma, t.y. 2 buvo mažiausias.

Praktikoje šis metodas dažniausiai (ir paprasčiausiai) taikomas tiesinio ryšio atveju, t.y. kada

y=kx arba y = a + bx.

Tiesinė priklausomybė fizikoje yra labai paplitusi. Ir net tada, kai priklausomybė yra netiesinė, jie dažniausiai bando sudaryti grafiką taip, kad gautų tiesią liniją. Pavyzdžiui, jei daroma prielaida, kad stiklo lūžio rodiklis n yra susijęs su šviesos bangos bangos ilgiu λ santykiu n = a + b/λ 2 , tai n priklausomybė nuo λ -2 vaizduojama grafike. .

Apsvarstykite priklausomybę y=kx(tiesi linija, einanti per pradžią). Sudarykite reikšmę φ - mūsų taškų nuokrypių nuo tiesės kvadratu sumą

φ reikšmė visada yra teigiama ir pasirodo, kad kuo mažesnė, tuo arčiau mūsų taškai yra tiesės. Mažiausių kvadratų metodas teigia, kad k reikia pasirinkti tokią reikšmę, kuriai esant φ turi minimumą


arba
(19)

Skaičiavimas rodo, kad vidutinė kvadratinė paklaida nustatant k reikšmę yra lygi

, (20)
kur – n yra matavimų skaičius.

Dabar panagrinėkime kiek sunkesnį atvejį, kai taškai turi atitikti formulę y = a + bx(tiesi linija, nekertanti per pradžią).

Užduotis yra rasti geriausias a ir b reikšmes iš pateiktos reikšmių aibės x i , y i .

Vėlgi sudarome kvadratinę formą φ, lygią taškų x i , y i nuokrypių nuo tiesės kvadratų sumai.

ir raskite reikšmes a ir b, kurių φ turi minimumą

;

.

.

Bendras šių lygčių sprendimas duoda

(21)

A ir b nustatymo vidutinės kvadratinės paklaidos yra lygios

(23)

.  (24)

Šiuo metodu apdorojant matavimo rezultatus, patogu visus duomenis apibendrinti lentelėje, kurioje preliminariai suskaičiuotos visos sumos, įtrauktos į (19)–(24) formules. Šių lentelių formos pateiktos toliau pateiktuose pavyzdžiuose.

1 pavyzdys Ištirta pagrindinė sukamojo judėjimo dinamikos lygtis ε = M/J (tiesė, einanti per pradžią). Esant įvairioms momento M reikšmėms, buvo išmatuotas tam tikro kūno kampinis pagreitis ε. Būtina nustatyti šio kūno inercijos momentą. Jėgos momento ir kampinio pagreičio matavimų rezultatai pateikiami antrame ir trečiame stulpeliuose 5 lentelės.

5 lentelė
n M, N m ε, s-1 M2 M ε ε - kM (ε – kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Pagal (19) formulę nustatome:

.

Norėdami nustatyti vidurkio kvadrato paklaidą, naudojame formulę (20)

0.005775kilogramas-vienas · m -2 .

Pagal (18) formulę turime

; .

SJ = (2,996 0,005775) / 0,3337 = 0,05185 kg m2.

Atsižvelgiant į patikimumą P = 0,95, pagal Stjudento koeficientų lentelę, kai n = 5, randame t = 2,78 ir nustatome absoliučią paklaidą ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Rezultatus rašome formoje:

J = (3,0 ± 0,2) kg m2;


2 pavyzdys Apskaičiuojame metalo atsparumo temperatūros koeficientą mažiausių kvadratų metodu. Atsparumas priklauso nuo temperatūros pagal tiesinį dėsnį

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

Laisvasis terminas nustato varžą R 0 esant 0 ° C temperatūrai, o kampinis koeficientas yra temperatūros koeficiento α ir varžos R 0 sandauga.

Matavimų ir skaičiavimų rezultatai pateikti lentelėje ( žr. 6 lentelę).

6 lentelė
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Pagal (21), (22) formules nustatome

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Om.

Raskime α apibrėžimo klaidą. Nuo tada pagal formulę (18) turime:

.

Naudodami (23), (24) formules turime

;

0.014126 Om.

Atsižvelgiant į patikimumą P = 0,95, pagal Stjudento koeficientų lentelę, kai n = 6, randame t = 2,57 ir nustatome absoliučią paklaidą Δα = 2,57 0,000132 = 0,000338 laipsnis -1.

α = (23 ± 4) 10 -4 kruša-1, kai P = 0,95.


3 pavyzdys Iš Niutono žiedų reikia nustatyti lęšio kreivio spindulį. Išmatuoti Niutono žiedų spinduliai r m ir nustatyti šių žiedų skaičiai m. Niutono žiedų spindulys yra susijęs su lęšio kreivio spinduliu R ir žiedo skaičiumi pagal lygtį

r 2 m = mλR - 2d 0 R,

čia d 0 yra tarpo tarp lęšio ir plokštumos lygiagrečios plokštės storis (arba lęšio deformacija),

λ yra krintančios šviesos bangos ilgis.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

tada lygtis įgaus formą y = a + bx.

.

Įvedami matavimų ir skaičiavimų rezultatai 7 lentelė.

7 lentelė
n x = m y \u003d r 2, 10 -2 mm 2 m-¯m (m–¯m) 2 (m-¯m)m y-bx-a, 10-4 (y – bx – a) 2, 10 –6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Mažiausių kvadratų metodas (LSM) leidžia įvertinti įvairius dydžius naudojant daugelio matavimų, kuriuose yra atsitiktinių paklaidų, rezultatus.

Būdingas MNC

Pagrindinė šio metodo idėja yra ta, kad klaidų kvadratų suma yra laikoma problemos sprendimo tikslumo kriterijumi, kurį siekiama sumažinti. Naudojant šį metodą, galima taikyti tiek skaitinius, tiek analitinius metodus.

Visų pirma, kaip skaitmeninis įgyvendinimas, mažiausių kvadratų metodas reiškia, kad reikia atlikti kuo daugiau nežinomo atsitiktinio dydžio matavimų. Be to, kuo daugiau skaičiavimų, tuo tikslesnis bus sprendimas. Remiantis šiuo skaičiavimų rinkiniu (pradiniais duomenimis), gaunamas kitas siūlomų sprendimų rinkinys, iš kurio atrenkamas geriausias. Jei sprendinių rinkinys yra parametrizuotas, mažiausių kvadratų metodas bus sumažintas iki optimalios parametrų reikšmės.

Kaip analitinis požiūris į LSM įgyvendinimą pradinių duomenų (matavimų) ir siūlomų sprendimų aibėje, apibrėžiami kai kurie (funkciniai), kuriuos galima išreikšti formule, gauta kaip tam tikra hipotezė, kurią reikia patvirtinti. . Šiuo atveju mažiausių kvadratų metodas sumažinamas iki šios funkcijos minimumo suradimo pradinių duomenų kvadratinių klaidų aibėje.

Atkreipkite dėmesį, kad ne pačios klaidos, o klaidų kvadratai. Kodėl? Faktas yra tas, kad dažnai matavimų nukrypimai nuo tikslios vertės yra teigiami ir neigiami. Nustatant vidurkį, paprastas sumavimas gali lemti neteisingą išvadą apie įvertinimo kokybę, nes abipusis teigiamų ir neigiamų verčių panaikinimas sumažins matavimų rinkinio atrankos galią. Ir, atitinkamai, vertinimo tikslumas.

Kad taip neatsitiktų, kvadratiniai nuokrypiai sumuojami. Dar daugiau, siekiant suvienodinti išmatuotos vertės ir galutinio įvertinimo matmenis, išgauti naudojama klaidų kvadratų suma

Kai kurios MNC programos

MNC plačiai naudojamas įvairiose srityse. Pavyzdžiui, tikimybių teorijoje ir matematinėje statistikoje metodas naudojamas norint nustatyti tokią atsitiktinio dydžio charakteristiką kaip standartinis nuokrypis, kuris nustato atsitiktinio dydžio verčių diapazono plotį.

Mažiausi kvadratai yra matematinė procedūra, skirta sudaryti tiesinę lygtį, kuri geriausiai atitinka eilės porų rinkinį, ieškant a ir b verčių, koeficientų tiesės lygtyje. Mažiausių kvadratų metodo tikslas yra sumažinti bendrą kvadrato paklaidą tarp y ir ŷ reikšmių. Jei kiekvienam taškui nustatome paklaidą ŷ, mažiausių kvadratų metodas sumažina:

kur n = tvarkingų porų skaičius aplink liniją. labiausiai susiję su duomenimis.

Ši koncepcija parodyta paveikslėlyje

Sprendžiant iš paveikslo, linija, kuri geriausiai atitinka duomenis, regresijos linija, sumažina bendrą keturių grafiko taškų kvadratinę paklaidą. Šiame pavyzdyje parodysiu, kaip tai nustatyti naudojant mažiausių kvadratų metodą.

Įsivaizduokite jauną porą, kuri neseniai gyvena kartu ir dalijasi vonios kosmetiniu stalu. Jaunuolis ėmė pastebėti, kad pusė jo stalo nenumaldomai mažėja, nusileidžia plaukų putoms ir sojų kompleksams. Pastaruosius kelis mėnesius vaikinas įdėmiai stebėjo, kokiu tempu jos stalo dalyje daugėja daiktų. Žemiau esančioje lentelėje parodytas daiktų, kuriuos mergina turi ant vonios stalo, skaičius, kuris susikaupė per pastaruosius kelis mėnesius.

Kadangi mūsų tikslas yra išsiaiškinti, ar prekių skaičius laikui bėgant didėja, „Mėnuo“ bus nepriklausomas kintamasis, o „Prekių skaičius“ – priklausomas kintamasis.

Naudodami mažiausiųjų kvadratų metodą, nustatome geriausiai duomenis atitinkančią lygtį, apskaičiuodami a reikšmes, atkarpą y ašyje ir b, linijos nuolydį:

a = y cf - bx plg

čia x cf yra nepriklausomo kintamojo x vidutinė reikšmė, y cf yra nepriklausomo kintamojo y vidutinė reikšmė.

Žemiau esančioje lentelėje apibendrinami šioms lygtims reikalingi skaičiavimai.

Mūsų vonios pavyzdžio efekto kreivė būtų pateikta pagal šią lygtį:

Kadangi mūsų lygtis turi teigiamą 0,976 nuolydį, vaikinas turi įrodymų, kad daiktų skaičius ant stalo laikui bėgant didėja vidutiniškai 1 preke per mėnesį. Grafike parodyta efekto kreivė su išdėstytomis poromis.

Numatomas prekių skaičius ateinančiam pusmečiui (16 mėn.) bus skaičiuojamas taip:

ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 elementas

Taigi mūsų herojui laikas imtis kokių nors veiksmų.

Funkcija TREND programoje Excel

Kaip jau galėjote atspėti, „Excel“ turi funkciją, pagal kurią galima apskaičiuoti reikšmę mažiausių kvadratų metodas.Ši funkcija vadinama TREND. Jo sintaksė yra tokia:

TREND (žinomos Y reikšmės; žinomos X reikšmės; naujos X reikšmės; const)

žinomos Y reikšmės - priklausomų kintamųjų masyvas, mūsų atveju elementų skaičius lentelėje

žinomos X reikšmės - nepriklausomų kintamųjų masyvas, mūsų atveju tai yra mėnuo

naujos X reikšmės – naujos X (mėnesio) reikšmės, kurioms TREND funkcija grąžina tikėtiną priklausomų kintamųjų reikšmę (elementų skaičių)

const – neprivaloma. Būlio reikšmė, nurodanti, ar konstanta b turi būti 0.

Pavyzdžiui, paveikslėlyje parodyta funkcija TREND, naudojama norint nustatyti numatomą daiktų skaičių ant vonios stalo 16 mėnesio.