Nešo pusiausvyra. Žaidimų teorija ekonomistams (John Nash)

Nešo pusiausvyra yra žaidimų teorijos dalis, jos autorius buvo amerikiečių matematikas Johnas Nashas. Ši teorija demonstruoja optimalų žaidimą „vakuume“: kada statyti all-in arba skambinti oponentų stūmimus. Svarbu suprasti, kad stumdymas/šaukimas pagal Nashą šiuolaikinėse pokerio realybėse nebėra vienintelis teisingas. Tai tik optimalu, jei jūsų oponentai žino šią strategiją ir laikosi jos nenukrypdami.

Nash push/fold strategija gali būti optimaliai naudojama tik prieš stiprius ir supratingus žaidėjus. Esant minimaliam nukrypimui, šios strategijos efektyvumas gerokai sumažėja. Pelningiausias būdas naudoti Nash balansą yra prisitaikyti prie oponentų ir koreguoti savo žaidimą pagal priešininkų diapazonus.

Kur naudoti Nash pusiausvyrą?

Nash Equilibrium diapazonai tinka Sit&Go ir turnyrams žaisti. Šią strategiją reikia naudoti, kai jūsų stack yra sumažintas iki 15 didelių privalomų statymų arba mažiau, o jūsų žaidimas priklauso nuo vieno stūmimo / nusimetimo sprendimo. Norėdami patobulinti savo žaidimo įgūdžius, turėtumėte naudoti specialią programinę įrangą, kuri imituoja tokias situacijas: ir ICMIZER.

Tarkime, kad jūsų varžovas patenka į viską ir jums liko 14 didžiųjų statymų. Pagal Nash pusiausvyrą galite skambinti įvairiomis rankomis su 20 didžiųjų privalomų statymų, įskaitant kišeninius trejetus, QJ, QT ir net K2.

Tačiau tai yra vakuuminis diapazonas, kuriame neatsižvelgiama į turnyro tipą, etapą ir išmokėjimų skirtumą. Ši strategija yra teisinga, bet tik tuo atveju, jei žaidimą sudaro tik du sprendimai prieš flopą: stūmimas arba nusimetimas. Šiuolaikinėse realybėse stiprūs žaidėjai gali žaisti gilią kombinaciją po flopo su 15 didžiųjų privalomųjų statymų krūva.

Be Nash balanso naudojimo, visada galite tiesiog laukti geros rankos ir paskambinti priešininkui. Bet jei tiksliai nežinote, kokia yra gera ranka, palyginti su jūsų krūvos dydžiu, pažiūrėkite į Nash lenteles.

Nash stūmimo diapazonas

Nash skambučių diapazonas

Žalia spalva– efektyvus stackas nuo 15 iki 20 didžiųjų statymų.

Geltona ir tamsiai geltona spalva– efektyvus statymas nuo 6 iki 14 didžiųjų statymų.

raudona spalva– efektyvus statymas nuo 1 iki 5 didžiųjų privalomų statymų.

Nash balanso naudojimas žaidime bus naudingas žaidėjams, nes tai suteiks žaidėjams pradinį supratimą apie standartinių turnyrų situacijų mušimo ar skambinimo diapazonus ir padės jiems gana greitai pradėti žaisti pokerį.

Realiame gyvenime dažnai kyla klausimų, kodėl įmonės vienose rinkose bendradarbiauja, o kitose agresyviai konkuruoja; kokių priemonių turėtų imtis įmonė, kad išvengtų galimų konkurentų įsibrovimo; kaip priimami kainos sprendimai; pasikeitus paklausos ar kaštų sąlygoms. Tirdami šias problemas, mokslininkai naudojasi žaidimų teorija.
Pirmieji žaidimų teorijos tyrinėtojai buvo amerikiečių matematikas J.-F. Neumannas ir austrų-amerikiečių ekonomistas O. Morgensternas („Žaidimų teorija ir ekonominis elgesys“, 1944 m.). Jie išplėtė matematines kategorijas į visuomenės ekonominį gyvenimą, įvesdami optimalių strategijų, maksimalaus tikėtino naudingumo, dominavimo žaidime (rinkoje) ir koalicinių susitarimų sąvokas. Šie mokslininkai turėjo skatinamąjį poveikį socialinių mokslų raidai apskritai, matematinei statistikai, ekonominei minčiai, ypač tikimybių teorijos ir žaidimų teorijos praktinio panaudojimo ekonomikoje srityje.
Mokslininkai siekė suformuluoti esminius rinkos dalyvio racionalaus elgesio kriterijus. Jie skyrė du žaidimų tipus. Pirmoji – „nulinė suma“ – numato tokį pelną, kuris susidaro iš kitų žaidėjų kaštų, tai yra, bendra naudos ir išlaidų suma visada lygi nuliui. Kitas būdas yra „laimėjimo žaidimas“, kuriame pavieniai žaidėjai varžosi dėl laimėjimų, gaunamų iš jų lažybų. Kartais šis pelnas sukuriamas turint „out“ (terminas iš kortų žaidimo bridžo; taip vadinamas vienas iš žaidėjų, kuris lažindamasis nedalyvauja žaidime), visiškai pasyvus ir dažnai vienas. kuris tarnauja kaip išnaudojimo objektas. Abiem atvejais žaidimas neišvengiamai susijęs su rizika, nes kiekvienas jo dalyvis, kaip J.-F. Neimanas ir O. Morgensternas „stengiasi maksimaliai padidinti funkciją, kurios kintamieji nekontroliuojami“. Jei visi žaidėjai yra vienodai kvalifikuoti, atsitiktinumas tampa lemiamu veiksniu. Tačiau taip nutinka retai. Gudrumas beveik visada yra svarbiausia žaidimo dalis, kurios pagalba bandoma atskleisti priešo ketinimus ir užmaskuoti jų ketinimus, o vėliau užimti naudingas pozicijas ir priversti priešą veikti nuostolingai. Svarbus vaidmuo skiriamas ir „kontrgudrumui“.
Žaidimo metu daug kas priklauso ir nuo racionalaus žaidėjo elgesio, tai yra apgalvoto pasirinkimo ir optimalios strategijos. J.-F. Nešas
Nešas (Nešas) Johnas-Forbesas (g. 1928 m.) – amerikiečių ekonomistas, Nobelio premijos laureatas (1994 m.). Gimė Bluefield mieste (Vakarų Virdžinija, JAV). Jis studijavo Carnegie Mellon universitete chemijos inžinieriumi, tačiau, patrauktas matematikos, perėjo į matematikos skyrių. Įgijo matematikos bakalauro, o kartu ir matematikos magistro laipsnį.
Jis įstojo į Prinstono universiteto matematikos magistrantūros mokyklą, kur apgynė daktaro disertaciją tema „Nebendradarbiaujantys žaidimai“ (1950). Kitais metais jis buvo paskelbtas kaip atskiras straipsnis žurnale „Annals of Mathematics“. Studijuodamas universitete, jis dalyvavo moksliniame darbe RAND Corp., kuris finansavo daugybę jo žvalgybos projektų žaidimų teorijos, matematinės ekonomikos ir bendrosios racionalaus elgesio žaidimų situacijose teorijos srityse.
1951-1959 metais. J.-F. Nashas yra Masačusetso technologijos instituto instruktorius. Tuo pačiu metu jis vykdo mokslinę veiklą. Jam pavyko išspręsti klasikinę problemą, susijusią su diferencine geometrija.
Dėl sunkios ligos negalėjo dirbti 20 metų.
70-aisiais liga atsitraukė. Tačiau jam nepavyko pasiekti produktyvių aukščiausio lygio mokslo rezultatų.
J.-F. Nashas tęsia savo matematikos tyrimus. Iš viso jis paskelbė 21 mokslinį darbą, iš kurių 16 išvydo šviesą iki 1959 m.
Jis yra JAV nacionalinės mokslų akademijos, Ekonometrijos draugijos ir Amerikos menų ir mokslų akademijos narys.
Klasikinėje žaidimų teorijoje kooperaciniai ir nebendradarbiaujantys žaidimai traktuojami skirtingai. J.-F. Nashas pirmiausia atkreipė dėmesį į skirtumą tarp jų ir kooperacinius žaidimus apibrėžė kaip žaidimus, kurie leidžia laisvai keistis informacija ir prievartines sąlygas tarp žaidėjų, o nebendradarbiaujančius žaidimus kaip tuos, kurie neleidžia laisvai keistis informacija ir prievartinėmis sąlygomis. Nebendradarbiaujantis žaidimas yra toks, kuriame žaidėjų bendradarbiavimas iš viso neleidžiamas. Straipsniuose „Pusiausvyros taškai žaidimuose su N dalyvių skaičiumi“ ir „Sandorių sudarymo problema“ (1951) jis matematiškai tiksliai išvedė dalyvių (žaidėjų), kurie laimi pagal pasirinktą strategiją, veiksmų taisykles. Kiekvienas iš žaidėjų stengiasi sumažinti rizikos laipsnį naudodamas pelningiausią strategiją, tai yra nuolat prisitaikydamas prie tų, kurie taip pat nori pasiekti geriausių rezultatų, elgesio.
Nuodugniai išstudijavęs įvairius žaidimus, sukūręs naujų matematinių žaidimų seriją ir stebėjęs dalyvių veiksmus įvairiose žaidimo situacijose, J.-F. Nashas siekė suprasti, kaip veikia rinka, kaip įmonės priima rizikingus sprendimus, kodėl pirkėjai elgiasi taip, kaip elgiasi. Juk ekonomikoje, kaip ir žaidime, įmonių vadovai turi atsižvelgti ne tik į naujausius, bet ir ankstesnius konkurentų žingsnius, taip pat į situaciją visoje ekonominėje (žaidimo, pavyzdžiui, šachmatų) srityje ir kiti veiksniai.
Žinoma, kad ekonominio gyvenimo subjektai yra aktyvūs jo dalyviai, kurie rizikuoja rinkoje konkurencijos sąlygomis, ir tai turi būti pagrįsta. Todėl kiekvienas iš jų, kaip ir žaidėjas, turi turėti savo strategiją. Būtent iš to J.-F. Nashas, ​​sukūręs metodą, kuris vėliau buvo pavadintas „Nash equilibrium“.
Nash equilibrium – strategijų ar veiksmų visuma, pagal kurią kiekvienas dalyvis įgyvendina optimalią strategiją, numatydamas varžovų veiksmus.
„Strategija“ kaip pagrindinė žaidimo teorijos samprata J.-F. Nashas aiškina remdamasis „nulinės sumos žaidimu“ („simetriniu žaidimu“), kai kiekvienas dalyvis turi tam tikrą skaičių strategijų. Kiekvieno žaidėjo atlyginimas priklauso nuo jo pasirinktos strategijos, taip pat nuo jo priešininkų strategijos. Tuo remiantis sukuriama matrica optimaliai strategijai surasti, kuri, kai žaidimas kartojamas daug kartų, tam tikram žaidėjui suteikia didžiausią įmanomą vidutinį pelną (arba didžiausią galimą vidutinį nuostolį). Kadangi šis žaidėjas nežino, kokią strategiją pasirinks varžovas, jam tikslingiau pasirinkti strategiją, paskaičiuotą pagal jam nepalankiausią varžovo elgesį („Garantuoto rezultato“ principas). Veikdamas atsargiai ir darydamas prielaidą, kad konkurentas yra stiprus, šis žaidėjas pasirinks mažiausią įmanomą atlygį už kiekvieną savo strategiją. Taigi iš visų minimalių laimėjimo strategijų jis pasirinks tą, kuri jam suteiks didžiausią visų minimalių išmokų („maximin“).
Jo priešininkas tikriausiai galvoja taip pat. Jis suras sau didžiausius nuostolius visose šio žaidėjo strategijose, o tada iš šių maksimalių pralaimėjimų pasirinks minimumą („minimax“). Jei maximin yra lygus minimax, žaidėjų sprendimai bus stabilūs, o žaidime bus pusiausvyra. Sprendimų (strategijų) stabilumas (balansas) yra tas, kad abiem žaidimo dalyviams bus nuostolinga nukrypti nuo pasirinktų strategijų. Kai maximin nėra lygus minimax, tada abiejų žaidėjų sprendimai (strategijos), jei jie bent kiek atspėjo priešininko strategijos pasirinkimą, bus nestabilūs, nesubalansuoti.
Taigi Nash pusiausvyra yra rezultatas, kai kiekvieno žaidėjo strategija yra geriausia iš kitų strategijų, kurias taiko kiti žaidimo dalyviai. Šis apibrėžimas grindžiamas tuo, kad kiekvienas iš žaidėjų, keisdamas savo vaidmenį, negali pasiekti didžiausios naudos (naudingumo funkcijos maksimizavimo), jei kiti dalyviai tvirtai laikosi savo elgesio linijos.
J.-F. Nashas sustiprino optimalaus informacijos kiekio rodiklį. Jis išvedė jį iš situacijų analizės, kai žaidėjas buvo visiškai informuotas apie savo varžovus, o ne iki galo informuotas apie juos. Išversdamas šį postulatą iš matematikos kalbos į ekonominio gyvenimo kalbą, mokslininkas pristatė (kaip svarbų informacinį „išorinės aplinkos“ sąlygų pažinimo elementą) nekontroliuojamus rinkos santykių kintamuosius.
Pusiausvyros atsiradimas moksle J.-F. Nashas pradėjo daugybę tyrimų, siekdamas priartinti jį prie tikrosios ekonominės realybės. Siekiant pagerinti J.-F. Nashas buvo išsiųstas į daugelio mokslininkų tyrimus. Tarp jų J.-C. Harshani.
Harshani (Harsanyi) Johnas-Charlesas (1920-2000) – amerikiečių ekonomistas, Nobelio premijos laureatas (1994). Gimė Budapešte (Vengrija), baigė liuteronų gimnaziją.
Įgijo aukštąjį medicininį išsilavinimą. 1947 m., apsigynęs daktaro disertaciją, pradėjo dirbti universiteto Sociologijos instituto dėstytoju. Dėl antimarksistinių pažiūrų jis išėjo į pensiją 1948 m., o paskui išvyko į Australiją. Ten jis dirbo gamykloje, tuo pat metu studijavo Sidnėjaus universitete, kur studijavo anglų kalbą ir ekonomiką. 1953 metais įgijo magistro laipsnį.
Nuo 1954 m. jis yra ekonomikos dėstytojas Brisbeno universitete. Po dvejų metų J.-C. Harshani buvo apdovanotas Rokfelerio fondo, kuris suteikė jam teisę kitus dvejus metus rašyti daktaro disertaciją Stanfordo universitete.
1958 metais J.-C. Harshani grįžta į Australiją. Tačiau jausdamas tam tikrą izoliaciją, kadangi žaidimo teorija šioje šalyje tuo metu realiai nebuvo žinoma, persikėlė į JAV, kur dirbo ekonomikos profesoriumi Detroito universitete. 1964 m. jis buvo Kalifornijos Berklio universiteto Walterio Haaso ekonomikos centro profesorius.
Pirmieji moksliniai darbai J.-Ch. Harshani paskelbė šeštojo dešimtmečio pradžioje, skirdamas juos Neumann-Morgenstern naudingumo funkcijos naudojimui gerovės ekonomikoje ir etikoje. J.-Ch. Harshani yra daugelio darbų apie utilitarinę etiką, gerovės ekonomiką ir ekonomikos bei moralės filosofijos sritis autorius. Knygoje „Rational Behavior and Negotiation Equilibrium in Games and Social Situations“ (1977) jis pasisako už „bendrą racionalaus elgesio teoriją“, apimančią „individualių sprendimų teoriją“, verslo etiką ir žaidimų teoriją. Tarp jo knygų yra Esė apie etiką, socialinį elgesį ir mokslinius paaiškinimus (1976), Žaidimų teorijos darbai (1982), Bendroji pusiausvyros pasirinkimo žaidimuose teorija (1988, kartu su R.-J.-R. Selten), kuri buvo išleista. rusų kalba 2001 m., „Racionali sąveika“ ir kt.
J.-Ch. Harshani yra Northwestern garbės daktaras ir Kalifornijos universiteto (JAV) garbės profesorius.
Tyrimo objektas J.-Ch. Harshani turėjo sunkių situacijų, kurios atsitinka esant asimetrinei informacijai. Žaidime su tobula informacija visi žaidėjai žino kitų pranašumus, tačiau žaidime su nepilna informacija jiems reikia šių žinių.
Kadangi Nash pusiausvyros aiškinimas buvo pagrįstas spėjimu, kad žaidėjai žino kitų pranašumus, ne visi metodai buvo prieinami žaidimų su nepilna informacija analizei, nepaisant to, kad tokie žaidimai labiau atspindi strateginius santykius realiame pasaulyje. .
Situaciją kardinaliai pakeitė J.-Ch. Harshani („Neišsamios informacijos žaidimai, kuriuos žaidžia Baysian žaidėjai“). Mokslininkas rėmėsi tuo, kad kiekvienas žaidėjas yra vienas iš kelių „tipų“, o kiekvienas tipas atitinka žaidėjui galimų pranašumų rinkinį ir tikriausiai paskirsto beveik visus žaidėjų tipus. Tai reiškia, kad kiekvienas žaidėjas žaidime su nepilna informacija pasirenka vieną iš šių strategijos tipų. Su sutartu reikalavimu dėl žaidėjų paskirstymo galimybės J.-C. Harshani parodė, kad kiekvienam žaidimui su nepilna informacija yra lygiavertis žaidimas su visa informacija. Tai yra, jis pavertė žaidimą su nepilna informacija į žaidimą su netobula informacija. Tokiu atveju žaidimą galima reguliuoti standartiniais modeliais.
Neišsamios informacijos žaidimo pavyzdys būtų tada, kai privačios įmonės ir finansų rinkos tiksliai nežino centrinio banko pranašumų, susijusių su dilema tarp infliacijos ir nedarbo. Atitinkamai nežinoma ir bankų politika dėl būsimų palūkanų normų. Sąveika tarp ateities lūkesčių ir centrinio banko politikos gali būti analizuojama naudojant J.-C. Harshani. Paprasčiausia forma bankas gali sutelkti dėmesį į kovą su infliacija ir taip ruoštis ribojančiai politikai su aukštomis palūkanų normomis arba kovoti su nedarbu naudodamas mažas palūkanų normas.
Nešo pusiausvyrą užbaigė ir patobulino, ypač žaidimams su nepilna informacija, R.-J.-R. Seltenas.
Seltenas (Seltenas) Reinhardas-Justus-Reginaldas (g. 1930 m.) – vokiečių ekonomistas, Nobelio premijos laureatas (1994 m.). Gimė Breslau (dabar Vroclavas, Lenkija). 1951 m. baigė vidurinę mokyklą Melsungene. Jau čia jis susidomėjo matematika, pirmiausia išmoko žaidimų teorijos. Mokėsi Frankfurto prie Maino universiteto Matematikos fakultete, per dešimt metų baigė 1957 m.
R.-J.-R. Seltenas ten dirbo asistentu. Šis jo gyvenimo laikotarpis buvo kupinas aktyvaus eksperimentinio darbo. 1959 m. apgynė matematikos mokslų daktaro disertaciją. Per 1969-1972 m. jis yra ekonomikos profesorius Vakarų Berlyno laisvajame universitete. Tada jis dirbo Bylefeldo universitete, kur tęsė eksperimentinius žaidimų teorijos tyrimus.
Nuo 1984 metų R.-J.-R. Seltenas yra Bonos Friedricho Vilhelmo universiteto ekonomikos profesorius. Kaip elgsenos mokslų žaidimų teorijos tyrimų metų (1987 m. spalio 1 d. – 1988 m. rugsėjo 30 d.) organizatorius, jam pavyko suburti didelę tarptautinę ekonomistų, biologų, matematikų, politologų, psichologų ir filosofų grupę. Nurodytas jų bendras darbas
4 knygose „Žaidimų pusiausvyros modeliai“ (1991). R.-J.-R. Seltenas yra nebendradarbiaujančių žaidimų teorijos įkūrėjas.
1995 metais R.-J.-R. Seltenas buvo išrinktas Europos ekonominės asociacijos viceprezidentu, o 1997 metais – jos prezidentu. Jis yra Amerikos ekonomikos asociacijos ir Econometric Society narys, yra daugelio mokslinių žurnalų redakcinių kolegijų narys, yra Amerikos menų ir mokslų akademijos garbės užsienio narys, JAV nacionalinės mokslų akademijos narys, Bylefeldo, Breslavo, Graco universitetų, Frankfurto prie Maino universiteto ir kt. garbės daktaro laipsnis.
Straipsnyje „Oligopolijos modelis su paklausos inercija“ (1965)
R.-J.-R. Seltenas sukūrė „gryną strategiją“ su intuityviais pasirinkimais. Nuosekliai komplikuodamas ir tobulindamas pažymėtą „balansą“ papildomomis ankstesnių susitarimų dėl žaidimo sąlygomis, mokslininkas jį išplėtojo dinamikos požiūriu ir priartino prie realaus gyvenimo sąlygų. Jis priešingais pavyzdžiais įrodė, kad net pusiausvyros taškai gali sukelti neracionalų elgesį. Pasak mokslininko, tik speciali pusiausvyros taškų klasė (jis pavadino juos „tikraisiais“ arba „tobulos pusiausvyros taškais“) iš tikrųjų užtikrina racionalų elgesį nebendradarbiaujančiame žaidime.
„Nešo pusiausvyros“ sąvoka apima ir dinaminių žaidimų teoriją. Tokiu atveju kiekvienas dalyvis pasirenka strategiją (ty veiksmų planą kiekvienam žaidimo laikotarpiui), kuri maksimaliai padidina jo pelną, atsižvelgiant į kitų žaidėjų strategijas. Pagrindinė dinaminės Nash pusiausvyros problema yra ta, kad paskutiniu žaidimo periodu žaidėjai gali elgtis neracionaliai. Tuo metu, kai paaiškėja, kad šis žaidimo laikotarpis yra paskutinis, anksčiau pasirinktas veiksmas gali pasirodyti neracionalus (nemaksimizuojamas pelno). Patobulinta pusiausvyros samprata, pasiūlyta 1975 m.
R.-J.-R. Seltenas, leidžia atsikratyti nenumatytų prielaidų apie strategijas. Ši „tobulos Nešo pusiausvyros“ arba tobulos požaidimo pusiausvyros koncepcija numato, kad žaidėjų pasirinktos strategijos yra Nash pusiausvyra kiekviename antriniame žaidime (ty kiekviename pagrindinio žaidimo vieno periodo žaidime), nepaisant to, kokie veiksmai buvo atlikti. prieš.
Nešo pusiausvyros įvedimas buvo svarbus žingsnis mikroekonomikoje. Jo naudojimas padėjo giliau suprasti rinkų vystymąsi ir funkcionavimą, įvairių firmų vadovų strateginių sprendimų pagrindimą. Svarbus R.-J.-R. Seltenas, kuris patobulino Nash pusiausvyros sampratą strateginės sąveikos dinamikoje analizei ir panaudojo ją analizuodamas konkurenciją esant nedideliam dalyvių skaičiui. O žaidimo su nepilna informacija analizės metodiką J.-C. Harshani pateikė teorinį pagrindą informacijos ekonomikos studijoms.
Nešo pusiausvyra gali būti naudojama tiriant politinių derybų procesą ir ekonominį elgesį, ypač oligopolinėse rinkose (rinkos organizavimo forma, kai yra keli vienarūšio ar diferencijuoto produkto gamintojai). Tai buvo R.-J.-R. Seltenas nustatė modelių panaudojimo politikoje galimybes. Jo bendradarbiavimas su amerikiečių politologu A. Pelmuteriu leido sukurti vadinamąjį paketinio metodo scenarijų – sistemingą būdą sukurti paprastus konkrečių tarptautinių konfliktų žaidimo modelius, kurių dėka galima atlikti ekspertinę empirinių faktų patikrą. .
Taigi išplėstinio žaidimo teorija suteikė ekonomikai galingą matematinių priemonių rinkinį, kuris padėjo ekonomistams išsivaduoti iš priklausomybės nuo formalaus matematinio fizikos aparato. Nešo pusiausvyra yra lankstus metodas, leidžiantis analizuoti įvairias specifines problemas ir situacijas rinkose.
Žaidimų teorija vėliau buvo panaudota Thomas Schelling ir Robert Omann tyrimuose. Juos domino klausimas: „Kodėl kai kurioms žmonių grupėms, organizacijoms ir šalims sekasi bendradarbiauti, o kitos kenčia nuo nuolatinių konfliktų?
Schellingas Thomas Crombie (g. 1921 m.) yra amerikiečių ekonomistas, 2005 m. Nobelio premijos laureatas. „Už konfliktų ir bendradarbiavimo problemų supratimo išplėtimą analizuojant žaidimų teorijos rėmus“. Merilendo universiteto profesorius. 1991 m. Amerikos ekonomikos asociacijos prezidentas. Franko Seidmano premijos laureatas (1977 m.). Pagrindiniai darbai: „Konflikto strategija“ (The Strategy of Conflict, 1960); Mikromotyvai ir makroelgesys (1978); Pasirinkimas ir pasekmės (1985).
Jis panaudojo žaidimų teoriją, kad priimtų racionalius sprendimus esant nepakankamai informacijai apie galimas pasekmes, kaip socialinių mokslų derinimo ir tyrimo pagrindą knygoje „Konflikto strategija“, išleistoje praėjusio amžiaus 50-aisiais ginklavimosi varžybose.
Savo knygoje Schellingas parodo, kad, pavyzdžiui, gebėjimas atkeršyti kartais gali būti naudingesnis nei gebėjimas atlaikyti išpuolį arba kad galimas nežinomas atpildas dažnai yra veiksmingesnis nei žinomas, neišvengiamas atpildas.
Schellingo knygoje buvo svarstomos strateginių konfliktų sprendimo galimybės ir būdai, kaip išvengti karo, tačiau jo išvadomis galima paaiškinti ir įvairius reiškinius ekonomikos ir įmonių konkurencingumo srityje.
Savo ruožtu R. Aumannas savo tyrimus skyrė nesibaigiančių pasikartojančių žaidimų teorijos tyrinėjimui arba kaip galima išlaikyti tam tikrus rezultatus santykiuose ilgą laiką.
Aumann Israel Robert John (taip pat Omanas) (g. 1930 m.) – Izraelio matematikas, Jeruzalės hebrajų universiteto profesorius, 2005 m. Nobelio ekonomikos premijos laureatas „už konfliktų ir bendradarbiavimo problemų supratimo išplėtimą atliekant analizę. žaidimo teorija“.
1983 metais Omanas buvo apdovanotas Harvey apdovanojimu. 1994 m. prof. Omanas kartu su prof. Michaelu Bruno buvo apdovanotas Izraelio valstybine ekonomikos premija.
R. Omanas vadovavo Žaidimų teorijos draugijai, o dešimtojo dešimtmečio pradžioje buvo Izraelio matematikų sąjungos prezidentas. Be to, jis buvo Europos matematikos draugijos žurnalo vyriausiasis redaktorius. Aumannas taip pat konsultavo JAV ginklų kontrolės ir nusiginklavimo agentūrą. Su žaidimų teorija ir jos taikymu jis užsiima apie 40 metų. Pagrindiniai darbai: „Beveik griežtai konkurenciniai žaidimai“ (Almost Strictly Competitive Games, 1961); Mišrios ir elgesio strategijos begaliniuose plataus masto žaidimuose, 1964 m.
Žaidimų teorija yra strategijos mokslas, tiria, kaip įvairios konkuruojančios grupės – verslininkai ar bet kuri kita bendruomenė – gali dirbti kartu, kad pasiektų idealų rezultatą.
Omanas specializuojasi „pakartojamuose žaidimuose“, analizuodamas konfliktų raidą laikui bėgant. Aumano tyrimas rėmėsi mintimi, kad bendradarbiavimą daugelyje situacijų lengviau užmegzti ilgalaikių stabilių santykių eigoje.
Aumano teorija paaiškina, kodėl sudėtingiau bendradarbiauti tarp daugelio dalyvių, atsižvelgiant į tai, kaip dažni, ilgalaikiai ir patikimi jų kontaktai ir kiek kiekvienas dalyvis gali numatyti kitų veiksmus.
Tyrimais siekiama paaiškinti tokius ekonominius konfliktus kaip kainų ir prekybos karai, atskleisti derybų mechanizmą įvairiomis sąlygomis – nuo ​​reikalavimų didinti atlyginimus iki tarptautinių prekybos sutarčių sudarymo.

Nešo pusiausvyra (Mūsų pusiausvyra) yra situacija, kai nė vienas iš žaidėjų negali padidinti savo atlyginimo vienašališkai pakeisdamas savo sprendimą. Kitaip tariant, Nash pusiausvyra yra ta padėtis, kurioje abiejų žaidėjų strategija yra geriausias atsakas į priešininko veiksmus.

Nešo pusiausvyra grynosiose strategijose strateginio žaidimo atveju tai yra strategijų profilis, kad bet kuris agentas atitiktų šią sąlygą:

Jeigu žaidime kiekvienas iš oponentų naudoja tik vieną ir tą pačią strategiją, tai šiuo atveju sakoma, kad vyksta pats žaidimas. grynosiose strategijose , ir naudojamas grotuvo BET ir žaidėjas AT vadinama pora strategijų grynos strategijos .

Apibrėžimas. Antagonistiniame žaidime strategijų pora ( BETi, AT j) vadinama pusiausvyra arba stabilia, jei nė vienam žaidėjui neapsimoka nukrypti nuo savo strategijos.

Prasminga naudoti grynas strategijas, kai žaidėjai BET ir AT turėti informacijos apie vienas kito veiksmus ir pasiektus rezultatus. Jei darysime prielaidą, kad bent viena iš šalių nežino apie priešininko elgesį, tada pusiausvyros idėja pažeidžiama ir žaidimas žaidžiamas atsitiktinai.

33. Neumann-Morgensterno funkcija žaidimų teorijoje. Bayes-Nash pusiausvyra

Sisteminę matematinę žaidimų teoriją išsamiai sukūrė amerikiečių mokslininkai J. Neumannas ir O. Morgensternas (1944), kaip matematinio požiūrio į konkurencingos ekonomikos reiškinius priemonę. Vystydamasi I. T. išaugo šiuos rėmus ir virto bendra matematine konfliktų teorija.

Pagrindinis dalykas I. t. yra žaidimo koncepcija, kuri yra formalizuotas konflikto vaizdavimas. Tikslus konflikto aprašymas žaidimo forma susideda iš nurodymo, kas ir kaip dalyvauja konflikte, kokie galimi konflikto rezultatai, kas ir kokia forma yra suinteresuoti šiais rezultatais. Konflikto šalys vadinamos veiksmų koalicija; jiems prieinami veiksmai yra jų strategijos; galimi konflikto rezultatai – pagal situacijas (dažniausiai kiekviena situacija suprantama kaip kiekvienos iš jų strategijų veiksmų koalicijos pasirinkimo rezultatas); konflikto baigtimi suinteresuotos šalys – interesų koalicijos; jų interesai apibūdinami tam tikrų situacijų pirmenybėmis (šios pirmenybės dažnai išreiškiamos skaitiniais prieaugiais). Išvardintų objektų konkretizavimas ir jų tarpusavio ryšiai lemia įvairias specifines žaidimų klases.

Galite nustatyti optimalią strategiją:

  • Bayes-Nash pusiausvyra: jei nustatomas statistinis elgesio pasiskirstymas (pavyzdžiui, 33% tat, 33% visada sukčiauja ir 33% visada bendradarbiauja), tada strategiją galima apskaičiuoti matematiškai. Tai išsamiai nagrinėja evoliucinės dinamikos teorija.

Siųsti savo gerą darbą žinių bazėje yra paprasta. Naudokite žemiau esančią formą

Studentai, magistrantai, jaunieji mokslininkai, kurie naudojasi žinių baze savo studijose ir darbe, bus jums labai dėkingi.

Publikuotas http://www.allbest.ru/

Nešo pusiausvyra

Įvadas

1. Johnas Forbesas Nešas

1.1 Johno Nasho moksliniai pasiekimai

2. Nešo pusiausvyra

2.1 Nešo pusiausvyros egzistavimo problema

2.2 Nešo pusiausvyros unikalumo problema

2.3 Nešo pusiausvyros efektyvumo problema

2.4 Pareto optimalios situacijos

3. Praktinio taikymo problemos

Išvada

Bibliografija

Įvadas

Mokslininkai beveik šešiasdešimt metų naudoja žaidimų teoriją, siekdami išplėsti įmonių priimtų strateginių sprendimų analizę, ypač norėdami atsakyti į klausimą: kodėl vienose rinkose įmonės yra linkusios susitarti, o kitose jos konkuruoja agresyviai? įmonių naudojimas potencialiems konkurentams neįtraukti; kaip turėtų būti priimami sprendimai dėl kainos, kai pasikeičia tyrimo sąlygos ar kaštai, arba kai į rinką ateina nauji konkurentai.

Pirmieji žaidimų teorijos srities tyrimus atliko J. F. Neumannas ir O Morgensternas, o rezultatus aprašė knygoje „Žaidimų teorija ir ekonominis elgesys“ (1944), šios teorijos matematines kategorijas išplėtė į visuomenės ekonominį gyvenimą, o 1944 m. supažindinant su optimalių strategijų samprata, maksimaliai padidinant laukiamą naudingumą, dominavimą žaidime.

Mokslininkai siekė suformuluoti esminius rinkos dalyvio racionalaus elgesio kriterijus, kad būtų pasiekti palankūs rezultatai. Jie išskyrė dvi pagrindines žaidimų kategorijas. Pirmasis yra nulinės sumos žaidimas, kuriame numatytas toks pelnas, kurį sudaro tik kitų žaidėjų praradimas. Šiuo atžvilgiu vienų nauda būtinai turi būti formuojama kitų žaidėjų nuostolių sąskaita, kad bendra nauda ir nuostolių suma visada būtų lygi nuliui. Antroji kategorija yra pozityvių sumų žaidimas, kuriame pavieniai žaidėjai varžosi dėl pergalės, kurią sudaro jų pačių statymai. Abiem atvejais žaidimas neišvengiamai kupinas rizikos, nes kiekvienas jo dalyvis, kaip tikėjo tyrėjai, siekia maksimaliai išnaudoti funkciją, kurios kintamieji jų nekontroliuoja. Jei visi žaidėjai yra vienodai kvalifikuoti, atsitiktinumas tampa lemiamu veiksniu. Tačiau taip nutinka retai. Beveik visada svarbų vaidmenį žaidime atlieka gudrumas, kurio pagalba bandoma atskleisti priešininkų ketinimus ir užmaskuoti jų ketinimus, o vėliau užimti palankias pozicijas, kurios priverstų šiuos priešininkus veikti jų pačių nenaudai.

1950-ųjų pradžioje Johnas Nashas sukūrė analizės metodus, kurių metu visi dalyviai laimi arba pralaimi. Šios situacijos vadinamos „Nešo pusiausvyra“.

1. Johnas Forbesas Nešas

Labai stipri asmenybė ir Nobelio premijos laureatas Johnas Nashas yra mokslininkas, daug ir vaisingai dirbęs diferencialinės geometrijos ir žaidimų teorijos srityje. Tačiau ne visi žino, kad matematikas daugelį savo gyvenimo metų paskyrė tragiškai kovai su savo paties beprotybe, besiribojančia su genialumu.

„Geros mokslinės idėjos man neateitų į galvą, jei galvočiau kaip paprasti žmonės. D. Nešas

Johnas Nashas savo karjerą pradėjo korporacijoje RAND (Santa Monica, Kalifornija), kur dirbo 1950 m. vasarą, taip pat 1952 ir 1954 m.

1950 - 1951 metais jaunuolis dėstė skaičiavimo kursuose (Princeton). Per šį laikotarpį jis įrodė Nešo teoremą (dėl įprastų įterpimų). Tai vienas iš pagrindinių diferencialinėje geometrijoje.

1951-1952 metais Johnas dirba tyrimų asistentu Kembridže (Masačusetso technologijos institutas).

Didžiajam mokslininkui buvo sunku sutarti darbo grupėse. Nuo studijų laikų jis buvo žinomas kaip ekscentriškas, izoliuotas, arogantiškas, emociškai šaltas žmogus (tai jau tada rodė šizoidinio charakterio organizaciją). Kolegos ir bendramoksliai, švelniai tariant, nemėgo Johno Nasho dėl jo egoizmo ir izoliacijos.

1.1 Johno Nasho moksliniai pasiekimai

Taikomoji matematika turi vieną iš skyrių – žaidimų teoriją, kuri tiria optimalias žaidimų strategijas. Ši teorija plačiai naudojama socialiniuose moksluose, ekonomikoje, tiriant politines ir socialines sąveikas.

Didžiausias Nasho atradimas yra išvestinė pusiausvyros formulė. Jame aprašoma žaidimo strategija, pagal kurią nė vienas dalyvis negali padidinti laimėjimo, jei jis vienašališkai persigalvos. Pavyzdžiui, darbininkų mitingas (reikalaujantis didesnių socialinių išmokų) gali baigtis partijų susitarimu arba perversmu. Siekdamos abipusės naudos, abi šalys turi naudoti idealią strategiją. Mokslininkas matematiškai pagrindė kolektyvinės ir asmeninės naudos derinius, konkurencijos sąvokas. Jis taip pat sukūrė „pasiūlymų teoriją“, kuri buvo šiuolaikinių įvairių sandorių (aukcionų ir kt.) strategijų pagrindas.

Johno Nasho moksliniai tyrimai po žaidimų teorijos srities tyrimų nesiliovė. Mokslininkai mano, kad net mokslo žmonės negali suprasti kūrinių, kuriuos matematikas parašė po pirmojo atradimo, jie yra per sunkūs jų suvokimui.

nash matematikas unikalumo pusiausvyra

2. Nešo pusiausvyra

Pagrindinis matematinis konfliktinės situacijos modelis yra įprastos formos žaidimas. Šį modelį suteikia rinkinys

kur daug dalyvių ar žaidėjų;

leistinų žaidėjų strategijų rinkinys;

žaidimo situacija, susidariusi dėl to, kad visi žaidėjai pasirenka savo strategijas;

žaidėjo atlyginimas situacijoje.

Svarbiausias sprendimų priėmimo konfliktinėse situacijose principas yra Nešo pusiausvyros samprata.

Nešo pusiausvyra žaidime yra strategijų rinkinys, kad kiekvienam žaidėjui jo strategija, įtraukta į rinkinį, atitiktų sąlygą:

Posakis „“ reiškia „pagalvoja“. Tai reiškia strategijų rinkinį, kuriame visi komponentai, išskyrus žaidėjo strategiją, sutampa, bet strategija egzistuoja. Ši sąlyga rodo, kad į rinkinį įtraukta strategija yra optimali žaidėjui, atsižvelgiant į visų kitų žaidėjų fiksuotas strategijas. Taigi galime teigti, kad Nash pusiausvyra yra toks strategijų rinkinys, nuo kurio vienam žaidėjui atskirai nukrypti neapsimoka.

Aptarkime, kaip Nash pusiausvyros sąvoka gali būti naudojama priimant sprendimus. Žaidimų teorijoje, kaip ir daugelyje kitų teorijų, galima išskirti du požiūrius: normatyvinį ir teigiamą. Normatyvus požiūris yra toks, kad teorija pateikia rekomendacijas, kaip elgtis konkrečioje konfliktinėje situacijoje. Ir taikant teigiamą požiūrį, teorija bando apibūdinti, kaip iš tikrųjų vyksta žaidėjų sąveika. Iš pradžių žaidimų teorija vystėsi kaip normatyvinė. O dabar šiuo požiūriu aptarsime Nešo pusiausvyros sampratą. Tokiu atveju sprendimo taisyklę galima suformuluoti taip: konfliktinėje situacijoje, aprašytoje žaidimo įprasta forma, kiekvienas dalyvis turėtų naudoti strategiją, kuri yra įtraukta į Nash pusiausvyrą.

Kyla tokie klausimai: ar Nešo pusiausvyra visada egzistuoja ir ar ji unikali? Toliau pateikiami keli pavyzdžiai, rodantys, kad atsakymas į abu šiuos klausimus paprastai yra ne.

2 .1 Nešo pusiausvyros egzistavimo problema

Apsvarstykite dviejų asmenų žaidimą (), kurių kiekvienas turi ribotą skaičių strategijų: , . Tokie dviejų asmenų žaidimai su baigtiniu strategijų skaičiumi kiekvienam žaidėjui vadinami bimatrix žaidimais, nes šiuo atveju norint nurodyti išmokėjimo funkcijas, patogu naudoti bimatricą:

Pirmojo žaidėjo strategijos atitinka eilutes, o antrojo žaidėjo strategijos – stulpelius. Matricos elementas yra lygus žaidėjo išmokėjimui, jei pirmasis žaidėjas naudoja savo strategiją, o antrasis žaidėjas naudoja savo strategiją.

Žaidimo pavyzdys, kurnėra Nešo pusiausvyros

Apsvarstykite šį bimatrix žaidimą:

Žaidimas su tokiomis išmokėjimo matricomis gali būti interpretuojamas taip: yra „monetos“ žaidimas: antrasis žaidėjas atspėja „galvas“ arba „uodegas“, o pirmasis – atspėja. Jei atspėja teisingai, jis gauna „1“ iš antrojo žaidėjo, kitu atveju duoda „1“ antrajam žaidėjui.

Nesunku pastebėti, kad nagrinėjamame žaidime nėra Nash pusiausvyros. Tai galima įrodyti tiesioginiu patikrinimu: kad ir kokią situaciją bepasiimtume, vienam iš žaidėjų nukrypti naudinga, nes jų interesai yra priešingi (jei vienas laimi, kitas pralaimi) ir bet kokiai fiksuotai vieno iš žaidėjų strategijai kitas visada ras strategiją, kuriai jis laimi.

2 .2 Nešo pusiausvyros unikalumo problema

Pereikime prie atsakymo į antrąjį klausimą: jei yra Nešo pusiausvyra, ar ji unikali?

Apsvarstykite bimatrix žaidimą, vadinamą „šeimos ginču“. Žaidėjai yra jauna sutuoktinių pora. Jie nusprendžia, kur eiti vakare: futbolą ar baletą. Vyras labiau mėgsta futbolą, o žmona – baletą. Bet bet kuriuo atveju jie nori kartu praleisti vakarą, nes. jei jie eis į skirtingas vietas, tada visos linksmybės bus sugadintos.

žmonos išmokėjimo matrica,

vyro atlyginimo matrica.

Nesunku pastebėti, kad šiame žaidime yra dvi Nash pusiausvyros: kai abu žaidėjai naudoja pirmąją strategiją (t. y. sutuoktiniai eina į baletą), arba kai abu žaidėjai naudoja antrąją strategiją (t. y. sutuoktiniai eina į futbolą).

Pagal sprendimų priėmimo principą, pagrįstą Nešo pusiausvyros koncepcija, žaidėjas turi naudoti strategiją, įtrauktą į tam tikrą Nešo pusiausvyrą. Tarkime, kiekvienas žaidėjas pasirenka Nash pusiausvyrą, kuri jam labiausiai patinka. Šiame žaidime tai gali lemti blogiausią rezultatą, nes. žmona rinksis baletą, vyras – futbolą ir dėl to jie atsidurs tokioje situacijoje, kai abiem atlygis nulis, t.y. mažesnė už kiekvieno žaidėjo atlyginimą bet kuriame Nešo pusiausvyros taške.

Pavyzdys rodo, kad renkantis strategiją reikia tam tikro koordinavimo mechanizmo, jei yra kelios Nash pusiausvyros. Todėl tokie žaidimai kaip šis pavyzdys dar vadinami „koordinavimo žaidimais“.

2 .3 Nešo pusiausvyros efektyvumo problema

Apsvarstykite bimatricinį žaidimą, pavadintą „Kalinio dilema“. (Šis žaidimas yra gana žinomas. Jam buvo skirta keli tūkstančiai kūrinių, pateikiančių įvairias šio žaidimo interpretacijas.) Žaidėjai yra du žmonės, tiriami. Kiekvienas iš jų turi dvi strategijas: prisipažinti padaręs nusikaltimą arba neprisipažinti. Tyrėjas kiekvienam kaliniui siūlo tokias sąlygas: jei jis prisipažįsta, o kitas įtariamasis nepripažįsta, pirmasis, suteikus jam pagalbą tyrime, bus nuteistas minimaliu kaltinimu (1 metai), o antrajam – maksimalus terminas (10 metų). Jei abu prisipažins, abu bus nuteisti ir jiems bus paskirtas jų nusikaltimą atitinkantis terminas (kiekvienam po 5 metus laisvės atėmimo). Galiausiai, jei abu kaltinamieji neprisipažįsta, jie gali būti nuteisti už nepakankamus įrodymus tik dėl dalies kaltinimo (pavyzdžiui, už neteisėtą ginklo laikymą, o ne už sunkesnį nusikaltimą, kurį jie iš tikrųjų padarė). Tokiu atveju abu gaus po 2 metus.

Gauname šias išmokėjimo matricas („C“, kad prisipažintų, „H“, kad neprisipažintų):

pirmajam žaidėjui

antram žaidėjui

Šiame žaidime yra vienas Nešo pusiausvyros taškas, kurį abu turi prisipažinti. Bet yra situacija, kuri yra naudingesnė abiem žaidėjams nepripažinti to abiem. Todėl Nešo pusiausvyros taškai gali būti neefektyvūs ta prasme, kad abu žaidėjus nukrypus nuo Nešo pusiausvyros taško, kiekvieno iš jų išmokos gali būti pagerintos.

Pavyzdyje aprašytas žaidimas turi tokią struktūrą:

2.4 Pareto optimalios situacijos

Norėdami formaliau suformuluoti atrastą Nešo pusiausvyros neefektyvumo savybę, pristatome Pareto optimalios situacijos sampratą.

Tegul žaidimas pateikiamas įprasta forma. Strategijų rinkinys vadinamas Pareto optimaliu, jei toks yra

Tiesą sakant, tam tikros situacijos Pareto optimalumas reiškia, kad pakeitus strategijas neįmanoma padidinti bent kai kurių žaidėjų išmokų, nesumažinant likusių.

Aukščiau pateiktas „kalinio dilemos“ pavyzdys rodo, kad kai kuriuose žaidimuose nėra Nešo pusiausvyros taškų, kurie būtų Pareto optimalūs. Šiuo atveju bet kuris Nash pusiausvyros taškas gali būti pagerintas kartu pasirenkant strategijas.

3 . Praktinio taikymo problemos

Pastebėjome tris Nešo pusiausvyros koncepcijos trūkumus:

Žaidime gali nebūti Nash pusiausvyros;

Nešo pusiausvyra negali būti unikali;

Nash pusiausvyra gali būti neefektyvi.

Tačiau, nepaisant šių trūkumų, ši koncepcija vaidina pagrindinį vaidmenį sprendimų priėmimo konfliktinėse situacijose teorijoje. 1999 m. Johnas Nashas, ​​pasiūlęs šią pusiausvyros koncepciją ir daugiausia dėl jos žinomas, gavo Nobelio ekonomikos premiją.

Žinoma, reikėtų atkreipti dėmesį ir į tam tikrų žaidimų teorijos analitinių priemonių taikymo ribos. Toliau nurodytais atvejais jis gali būti naudojamas tik gavus papildomos informacijos.

Pirma, tai atvejis, kai žaidėjai skirtingai įsivaizduoja žaidimą, kuriame dalyvauja, arba kai jie nėra pakankamai informuoti apie vienas kito galimybes. Pavyzdžiui, gali būti neaiškios informacijos apie konkurento mokėjimus (kaštų struktūrą). Jeigu ne itin sudėtingai informacijai būdingas neišsamumas, tuomet galima pritaikyti panašių atvejų patirtį, atsižvelgiant į tam tikrus skirtumus.

Antra, žaidimų teoriją sunku pritaikyti daugeliui pusiausvyrų. Ši problema gali kilti net per paprastus žaidimus, tuo pačiu metu pasirenkant strateginius sprendimus.

Trečia, jei strateginių sprendimų priėmimo situacija yra labai sudėtinga, žaidėjai dažnai negali pasirinkti sau geriausių variantų. Pavyzdžiui, kelios įmonės gali įeiti į rinką skirtingu laiku arba ten jau veikiančių įmonių reakcija gali būti sudėtingesnė nei agresyvi ar draugiška.

Eksperimentiškai įrodyta, kad išplėtus žaidimą iki dešimties ar daugiau etapų, žaidėjai nebegali naudoti atitinkamų algoritmų ir tęsti žaidimo su pusiausvyros strategijomis.

Deja, realios situacijos dažnai yra labai sudėtingos ir keičiasi taip greitai, kad neįmanoma tiksliai numatyti, kaip konkurentai reaguos į taktikos pasikeitimą. Tačiau žaidimų teorija yra naudinga, kai reikia nustatyti svarbiausius veiksnius, į kuriuos reikia atsižvelgti priimant konkurencinį sprendimą. Ši informacija svarbi, nes leidžia atsižvelgti į papildomus kintamuosius ar veiksnius, galinčius turėti įtakos situacijai, ir taip pagerinti sprendimo veiksmingumą.

Išvada

Apibendrinant, reikia pabrėžti, kad žaidimų teorija yra labai sudėtinga žinių sritis. Kalbant apie tai, reikia laikytis tam tikro atsargumo ir aiškiai žinoti taikymo ribas. Pernelyg paprastos interpretacijos yra kupinos paslėpto pavojaus. Dėl sudėtingumo žaidimų teorija pagrįsta analizė ir konsultacijos rekomenduojamos tik kritinėse probleminėse srityse. Patirtis rodo, kad tinkamas priemones geriau naudoti priimant vienkartinius, iš esmės svarbius planinius strateginius sprendimus, taip pat ir rengiant pagrindines bendradarbiavimo sutartis.

Kur šiandien pritaikomi Nasho atradimai?

Aštuntajame ir devintajame dešimtmečiuose patyrusi bumą, žaidimų teorija užėmė tvirtą poziciją kai kuriose socialinių žinių srityse. Eksperimentai, kuriuose Nash komanda vienu metu užfiksavo žaidėjų elgesį šeštojo dešimtmečio pradžioje, buvo laikomi nesėkme. Šiandien jie sudarė „eksperimentinės ekonomikos“ pagrindą. „Nešo pusiausvyra“ aktyviai naudojama analizuojant oligopolijas: nedidelio skaičiaus konkurentų elgesį tam tikrame rinkos sektoriuje.

Be to, Vakaruose žaidimų teorija aktyviai naudojama išduodant licencijas transliuoti ar ryšiams: išduodanti institucija matematiškai apskaičiuoja optimaliausią dažnių paskirstymo variantą.

Bibliografija

1. A. A. Vasinas ir V. V. Morozovas, Žaidimų teorija ir matematinės ekonomikos modeliai. -- M.: MGU, 2005, 272 p.

2. Vorobjovas N. N. Žaidimų teorija kibernetikos ekonomistams. -- M.: Nauka, 1985 m

3. http://dic.academic.ru/dic.nsf/econ_dict/22119

4. http://economicportal.ru/ponyatiya-all/nash_equilibrium.html

Priglobta Allbest.ru

...

Panašūs dokumentai

    Netolygaus pajamų pasiskirstymo tarp gyventojų problemos. Pareto paskirstymo dėsnis: pajamų ir žmonių skaičiaus santykis. Pareto pasiskirstymas katastrofų teorijoje. Duomenų apdorojimo metodai su sunkiu paskirstymu.

    Kursinis darbas, pridėtas 2012-06-01

    Sprendimų priėmimo matematinio modelio formavimo ypatumai, pasirinkimo problemos išdėstymas. Pareto optimalumo samprata ir jos vaidmuo matematinėje ekonomikoje. Pareto optimalių sprendimų paieškos algoritmo sudarymas, programinės įrangos įdiegimas.

    kontrolinis darbas, pridėtas 2011-11-06

    Optimalaus futbolo komandos žaidėjų išdėstymo aikštėje matematinio modelio sukūrimas, atsižvelgiant į žaidybinių pareigų paskirstymą tarp žaidėjų ir kiekvieno individualias savybes, siekiant maksimalaus visos komandos žaidimo efektyvumo.

    Kursinis darbas, pridėtas 2011-08-04

    Lyginamoji Coplando ir Simpsono klestinčių balsavimo taisyklių Condorcet, Bordo dėsnių ir Pareto optimalumo efektyvumo ir naudojimo paprastumo analizė, siekiant sukurti automatizuotą programą rinkimų nugalėtojui surasti.

    Kursinis darbas, pridėtas 2010-08-20

    Pusiausvyros sąlygos ekonominiame modelyje. Visuminės paklausos reguliavimo metodai. Efektyvios pusiausvyros gavimo galimybių makroekonomikoje tyrimas. Pinigų ir fiskalinės politikos panaudojimas reguliuojant rinkos santykius.

    baigiamasis darbas, pridėtas 2017-11-18

    Ekonominė pusiausvyra, jos pasiekimo sąlygos ir būdai, kainos ir nekaininės pažeidimo priežastys. Bendras rinkos modelis pagal Walrasą, jo taikymas ekonominės pusiausvyros pagrindime, skirtumai nuo Arrow-Debreu modelio. Konkurencinės pusiausvyros stabilumas.

    Kursinis darbas, pridėtas 2009-06-19

    Aptarnavimo veiklos tikslas, klientų aptarnavimo formos. Organizacijos efektyvumo paslaugų sektoriuje analizė. Eilių sistemos samprata, pagrindiniai jos elementai. Matematinio modelio kūrimas. Gautų rezultatų analizė.

    testas, pridėtas 2016-03-30

    Daugiakriterinių užduočių rūšys. Pareto optimalumo principas ir Nešo pusiausvyros principas renkantis sprendimą. Pirmenybės (naudingumo) funkcijos samprata ir vektorinio optimizavimo uždavinio sprendimo būdų, naudojant Excel programos priemones, apžvalga.

    santrauka, pridėta 2011-02-14

    Klasikinė optimizavimo teorija. Čebyševo skaliarizacijos funkcija. Pareto-optimalumo kriterijus. Markovo sprendimų priėmimo procesai. Apribojimų keitimo būdas. Algoritmas ieškant trumpiausio kelio. Mažiausio tinklo medžio kūrimo procesas.

    testas, pridėtas 2015-01-18

    Teorinių ir praktinių sprendimų priėmimo problemos aspektų svarstymas. Susipažinimas su sprendimo metodais, naudojant apibendrinto kriterijaus konstrukciją ir Pareto dominavimo ryšį; jų taikymo pavyzdžiai. Naudojant tikėtino atsipirkimo kriterijų.

Įsisavinęs šį skyrių, studentas turėtų:

žinoti

  • Nešo pusiausvyros nustatymas (tiek grynosios, tiek mišrios strategijose);
  • pagrindinės Nešo pusiausvyros savybės;
  • teoremos, formuluojančios Nešo pusiausvyros egzistavimo sąlygas strateginiuose žaidimuose;
  • sąvokos „drebančios rankos pusiausvyra“ apibrėžimas;

galėti

Išspręskite Nešo pusiausvyros radimo problemą bimatriciniuose žaidimuose (įskaitant žaidimų grafinį metodą);

savo

  • paprasčiausi 2 x 2 bimatricinių žaidimų savybių analizės metodai, naudojant jų grafinio sprendimo rezultatus;
  • idėjų sistema apie Nešo pusiausvyros sampratos praktinio taikymo galimybes ir objektyvias problemas;
  • terminų aparatas, leidžiantis savarankiškai įsisavinti mokslinę ir profesinę literatūrą, naudojant Nešo pusiausvyros sampratą ir jos savybes.

Šiame skyriuje aptarsime pagrindinį nebendradarbiaujančių žaidimų teorijos tyrimo objektą, vadinamą Nešo pusiausvyra. Šią koncepciją pasiūlė žymus amerikiečių matematikas Johnas Forbesas Nashas, ​​pirmiausia savo disertacijoje, o vėliau 1950–1953 m. paskelbtuose straipsniuose. .

^ Situacija s*žaidime Г = (I, () i н I , ((s)) i н I) bus vadinama Nash pusiausvyra (grynose strategijose), jei bet kuriam žaidėjui aš О aš

Kitaip tariant, Nešo pusiausvyros situacija yra žaidimo situacija, iš kurios vienam žaidėjui nenaudinga nukrypti po vieną (su sąlyga, kad kiti žaidimo dalyviai laikosi savo strategijų, kurios sudaro Nešo pusiausvyrą).

Apsvarstykite atvaizdus, ​​kad kiekvienam žaidėjui i н I kiekvienai galimai padėčiai н priskirkite tam tikrą strategiją , kuri yra geriausias jo atsakas šiai padėčiai:

Žemėlapiai, kurie pateikia geriausius atsakymus į subsituacijas, taip pat vadinami žaidėjų atsakymų žemėlapiais. Nelygybė (3.1) reiškia, kad Nash pusiausvyros situaciją formuoja strategijos, kurias grąžina visų žaidėjų atsakymų žemėlapiai, t.y. Nešo pusiausvyros situacija yra situacija, kurią sudaro geriausi kiekvieno žaidėjo atsakymai į geriausius kitų atsakymus:

Savo ruožtu sąlyga (3.3) reiškia tokias savybes.

  • 1. Griežtai dominuojamos strategijos ir NSO strategijos negali patekti į Nešo pusiausvyrą.
  • 2. Strategijos, kurios sudaro Nash pusiausvyrą, negali būti pašalintos šalinant stipriai dominuojančias strategijas ir racionalizuojant žaidimą.

Kartu reikia pabrėžti, kad silpnai dominuojamos strategijos šių savybių neturi. Nesunku sukurti Nash pusiausvyros pavyzdį, kuriame bus viena ar kelios silpnai dominuojančios strategijos.

Norėdami apsvarstyti Nešo pusiausvyros savybes, grįžkime prie žaidimo Prisoner's Dilemma (žr. 2.1 lentelę).

Nesunku pastebėti, kad šis žaidimas turi unikalią Nash pusiausvyros būseną. Tai situacija (C, C), kai abu žaidėjai prisipažįsta ir gauna penkerių metų kalėjimo. Esminė situacijos (C, C) kokybė yra būtent ta, kad po vieną nuo jos nukrypti niekam tikrai nenaudinga. Jei vienas iš kalinių bando pakeisti strategiją iš „prisipažinti“ į „nutylėti“, tada

taip pasielgęs jis tik pablogins savo poziciją – vietoj penkerių metų bausmės gaus dešimt – ir pagerins kito žaidėjo, kuris bus paleistas, poziciją.

Reikia pripažinti, kad pusiausvyros situacija šiame pavyzdyje yra neefektyvus rezultatas kaliniams. Išties situacijoje (M, M) – abu tyli – jų naudingumas didesnis (bausmė – vieneri metai prieš penkerius). Tačiau situacija (M, M) turi trūkumą, kad ji yra nestabili. Jame kiekvienam iš žaidėjų pravartu pakeisti strategiją „tylėti“ į „prisipažinti“, su sąlyga, kad kitas žaidėjas ir toliau laikosi strategijos „tylėti“. Tokiu atveju bausmė išdavikui tampa lygi nuliui, nors bhaktam ji smarkiai padidėja: nuo metų iki dešimties.

Taigi kalinio dilema gana aiškiai atspindi faktą, kad

Nash pusiausvyra nebūtinai yra „geriausia“ situacija žaidėjams, tai yra stabili situacija.

Be to, naudojant kalinio dilemą kaip pavyzdį, galima aiškiai parodyti ryšį tarp Nešo pusiausvyros ir tokios esminės ekonomikos sampratos kaip Pareto optimalumas. Prisiminkite tai

pasiskirstymas vadinamas optimaliu, bet Pareto (Pareto-optimalus), kai kurio nors šio skirstinio dalyvio naudingumas (gerovė) negali būti padidintas nesumažinus jokio kito dalyvio naudingumo.

Nesunku pastebėti, kad Kalinio dilemoje Nešo pusiausvyros situacija yra vienintelė Pareto neoptimali: dalyvių naudingumą „neskausmingai kiekvienam iš jų“ galima pagerinti pereinant iš situacijos (C, C) į situaciją. (M, M), tačiau pastaroji nėra pusiausvyra pagal Nashą dėl savo nestabilumo. Šiuo požiūriu kalinio dilema yra klasikinis Nešo pusiausvyros ir Pareto optimalumo skirtumo pavyzdys.

Parodykime Nešo pusiausvyros sąvokos praktinio panaudojimo galimybes, kaip pavyzdį naudodamiesi siužetais iš literatūrinės programos.

  • Už indėlį į nebendradarbiaujančių žaidimų teoriją J. Nashas 1994 metais gavo Nobelio ekonomikos premiją
  • Pristatė italų ekonomisto ir sociologo Vilfredo Pareto (1848-1923)