Pagrindinės žaidimų teorijos ir žaidimų modelių sampratos. Matematinio žaidimo teorija

Žaidimo teorija- matematinis metodas optimalioms žaidimų strategijoms tirti. Žaidimas suprantamas kaip procesas, kuriame dalyvauja dvi ar daugiau šalių, kovojančių už savo interesų įgyvendinimą. Kiekviena pusė turi savo tikslą ir naudoja tam tikrą strategiją, kuri gali lemti pergalę arba pralaimėjimą – priklausomai nuo kitų žaidėjų elgesio. Žaidimo teorija padeda pasirinkti geriausias strategijas, atsižvelgiant į idėjas apie kitus dalyvius, jų išteklius ir galimus veiksmus.

Žaidimų teorija – taikomosios matematikos, tiksliau operacijų tyrimo, šaka. Dažniausiai žaidimų teorijos metodai taikomi ekonomikoje, kiek rečiau kituose socialiniuose moksluose – sociologijoje, politikos moksluose, psichologijoje, etikoje ir kt. Nuo 1970-ųjų jį pradėjo naudoti biologai, tirdami gyvūnų elgesį ir evoliucijos teoriją. Tai labai svarbu dirbtiniam intelektui ir kibernetikai, ypač pasireiškus susidomėjimui protingais agentais.

Istorija.

Optimalūs matematinio modeliavimo sprendimai ar strategijos buvo pasiūlyti dar XVIII a. Gamybos ir kainodaros problemos oligopolijoje, vėliau tapusios vadovėliniais žaidimų teorijos pavyzdžiais, buvo svarstomos XIX a. A. Cournot ir J. Bertrand. XX amžiaus pradžioje. E. Laskeris, E. Zermelo, E. Borelis iškėlė matematinės interesų konflikto teorijos idėją.

Matematinė žaidimų teorija kilo iš neoklasikinė ekonomika. Teorijos matematiniai aspektai ir taikymas pirmą kartą buvo pristatyti klasikinėje 1944 m. Johno von Neumanno ir Oscaro Morgensterno knygoje Žaidimų teorija ir ekonominis elgesys. Žaidimų teorija ir ekonominis elgesys ).

Ši matematikos sritis rado tam tikrą atspindį viešojoje kultūroje. 1998 metais amerikiečių rašytoja ir žurnalistė Sylvia Nazar išleido knygą apie Nobelio ekonomikos premijos laureato ir žaidimų teorijos mokslininko Johno Nasho likimą; o 2001 metais pagal knygą buvo sukurtas filmas „Gražus protas“. Kai kurios Amerikos televizijos laidos, tokios kaip „Draugas ar priešas“, „Alias“ arba „NUMB3RS“, savo epizoduose periodiškai nurodo teoriją.

J. Nashas 1949 metais rašo disertaciją apie žaidimų teoriją, po 45 metų gauna Nobelio ekonomikos premiją. J. Nashas, ​​baigęs Karnegio politechnikos institutą dviem diplomais – bakalauro ir magistro studijomis, įstojo į Prinstono universitetą, kur lankė Johno von Neumanno paskaitas. Savo raštuose J. Nashas išplėtojo „vadybinės dinamikos“ principus. Pirmosios žaidimų teorijos koncepcijos analizavo antagonistinius žaidimus, kai yra pralaimėtojai ir žaidėjai, kurie laimėjo savo sąskaita. Nashas kuria analizės metodus, kurių metu visi dalyviai laimi arba pralaimi. Tokios situacijos vadinamos „Nešo pusiausvyra“ arba „nebendradarbiaujančia pusiausvyra“, kai šalys taiko optimalią strategiją, kuri leidžia sukurti stabilią pusiausvyrą. Žaidėjams naudinga išlaikyti šią pusiausvyrą, nes bet koks pasikeitimas pablogins jų padėtį. Šie J. Nash darbai rimtai prisidėjo prie žaidimų teorijos kūrimo, buvo peržiūrimi matematiniai ekonominio modeliavimo įrankiai. J. Nashas parodo, kad klasikinis A. Smitho požiūris į konkurenciją, kai kiekvienas žmogus yra sau, nėra optimalus. Optimalesnės strategijos yra tada, kai kiekvienas bando padaryti geriau sau, o kitiems.

Nors žaidimų teorija iš pradžių buvo susijusi su ekonominiais modeliais, iki šeštojo dešimtmečio ji išliko formali matematikos teorija. Tačiau nuo 1950 m žaidimo teorijos metodus pradedama taikyti ne tik ekonomikoje, bet ir biologijoje, kibernetikoje, technologijose, antropologijoje. Antrojo pasaulinio karo metu ir iškart po jo kariškiai rimtai domėjosi žaidimų teorija, kuri ją laikė galinga strateginių sprendimų tyrimo priemone.

1960-1970 metais. susidomėjimas žaidimų teorija blėsta, nepaisant iki tol gautų reikšmingų matematinių rezultatų. Nuo devintojo dešimtmečio vidurio. prasideda aktyvus praktinis žaidimų teorijos panaudojimas, ypač ekonomikos ir vadybos srityse. Per pastaruosius 20 - 30 metų žaidimų teorijos svarba ir susidomėjimas labai išaugo, kai kurios šiuolaikinės ekonomikos teorijos sritys negali būti aprašytos be žaidimų teorijos panaudojimo.

Didelis indėlis į žaidimų teorijos taikymą buvo 2005 m. Nobelio ekonomikos premijos laureato Thomaso Schellingo darbas „Konflikto strategija“. T. Schellingas svarsto įvairias konflikto dalyvių elgesio „strategijas“. Šios strategijos sutampa su konfliktų valdymo taktika ir konfliktų analizės principais konfliktologijoje (tai psichologinė disciplina) ir konfliktų valdyme organizacijoje (vadybos teorija). Psichologijoje ir kituose moksluose žodis „žaidimas“ vartojamas kitomis prasmėmis nei matematikoje. Kai kurie psichologai ir matematikai skeptiškai vertina šio termino vartojimą kitomis, anksčiau susiformavusiomis prasmėmis. Kultūrologinė žaidimo samprata pateikta Johano Huizingos darbe „Homo Ludens“ (straipsniai apie kultūros istoriją), autorius pasakoja apie žaidimų panaudojimą teisingumo, kultūros, etikos srityse.. sako, kad žaidimas yra senesnis nei pats žmogus, nes žaidžia ir gyvūnai. Žaidimo koncepcija randama Erico Burne'o koncepcijoje „Žaidimai, kuriuos žaidžia žmonės, žmonės, kurie žaidžia žaidimus“. Tai grynai psichologiniai žaidimai, pagrįsti sandorių analize. J.Hözingo žaidimo samprata skiriasi nuo žaidimo interpretacijos konfliktų teorijoje ir matematinės žaidimų teorijos. Žaidimai taip pat naudojami mokymams verslo bylose, organizacinio ir veiklos požiūrio pradininko G. P. Ščedrovitskio seminaruose. SSRS Perestroikos metu G. P. Ščedrovitskis daug žaidė su sovietų vadovais. Kalbant apie psichologinį intensyvumą, ODI (organizacinės veiklos žaidimai) buvo tokie stiprūs, kad buvo galingas pokyčių SSRS katalizatorius. Dabar Rusijoje yra visas ODI judėjimas. Kritikai atkreipia dėmesį į dirbtinį ODI unikalumą. ODI pagrindas buvo Maskvos metodinis ratas (MMC).

Dabar sparčiai vystosi matematinių žaidimų teorija, svarstomi dinamiški žaidimai. Tačiau matematinis žaidimų teorijos aparatas yra brangus. Jis naudojamas teisėtoms užduotims: politikai, monopolijų ekonomikai ir rinkos galios pasiskirstymui ir kt. Nemažai žinomų mokslininkų yra tapę Nobelio ekonomikos premijos laureatais už indėlį į žaidimų teorijos, apibūdinančios socialinius ir ekonominius procesus, plėtrą. J. Nashas žaidimų teorijos tyrimų dėka tapo vienu iš pirmaujančių „šaltojo karo“ vykdymo ekspertų, o tai patvirtina žaidimų teorijos užduočių mastą.

Nobelio ekonomikos premijos laureatai už pasiekimus žaidimų teorijos ir ekonomikos teorijos srityse yra: Robertas Aumannas, Reinhardas Seltenas, Johnas Nashas, ​​Johnas Harsanyi, Williamas Vickrey, Jamesas Mirrleesas, Thomasas Schellingas, George'as Akerlofas, Michaelas Spence'as, Josephas Stiglitzas, Leonidas Hurwitzas, Ericas Maskinas, Rogeris Myersonas, Lloydas Shapley, Alvinas Rothas.

Žaidimų teorijos taikymas.

Žaidimų teorija, kaip vienas iš taikomosios matematikos požiūrių, naudojama tiriant žmonių ir gyvūnų elgesį įvairiose situacijose. Iš pradžių žaidimų teorija pradėjo vystytis ekonomikos mokslo rėmuose, leido suprasti ir paaiškinti ūkio subjektų elgesį įvairiose situacijose. Vėliau žaidimų teorijos sritis buvo išplėsta į kitus socialinius mokslus; Šiuo metu žaidimų teorija yra naudojama žmogaus elgesiui paaiškinti politikos moksluose, sociologijoje ir psichologijoje. Žaidimų teorinę analizę gyvūnų elgesiui apibūdinti 1930-aisiais pirmą kartą panaudojo Ronaldas Fisheris (nors net Charlesas Darwinas be formalaus pagrindimo naudojo žaidimų teorijos idėjas). Termino „žaidimo teorija“ Ronaldo Fisherio darbuose nėra. Nepaisant to, darbas iš esmės atliekamas laikantis žaidimo teorinės analizės. Ekonomikos pokyčius pritaikė Johnas Maynardas Smithas knygoje Evoliucija ir žaidimų teorija. Žaidimų teorija naudojama ne tik nuspėti ir paaiškinti elgesį; buvo bandoma panaudoti žaidimų teoriją kuriant etinio arba orientacinio elgesio teorijas. Ekonomistai ir filosofai naudojo žaidimų teoriją, kad geriau suprastų gerą elgesį. Paprastai tariant, pirmuosius žaidimo teorinius argumentus, paaiškinančius teisingą elgesį, išsakė Platonas.

Aprašymas ir modeliavimas.

Iš pradžių žaidimų teorija buvo naudojama žmonių populiacijų elgesiui apibūdinti ir modeliuoti. Kai kurie tyrinėtojai mano, kad nustatydami pusiausvyrą atitinkamuose žaidimuose, jie gali numatyti žmonių populiacijų elgesį tikros konfrontacijos situacijoje. Šis požiūris į žaidimų teoriją pastaruoju metu buvo kritikuojamas dėl kelių priežasčių. Pirma, modeliavime naudojamos prielaidos dažnai pažeidžiamos realiame gyvenime. Tyrėjai gali manyti, kad žaidėjai pasirenka elgesį, kuris maksimaliai padidina jų bendrą naudą (ekonominio žmogaus modelis), tačiau praktiškai žmogaus elgesys dažnai neatitinka šios prielaidos. Šio reiškinio paaiškinimų yra daug – neracionalumas, diskusijų modeliavimas ir net skirtingos žaidėjų motyvacijos (įskaitant altruizmą). Žaidimų teorinių modelių autoriai tam prieštarauja sakydami, kad jų prielaidos yra panašios į fizikos prielaidas. Todėl, net jei jų prielaidos ne visada išsipildo, žaidimų teorija gali būti naudojama kaip pagrįstas idealus modelis, pagal analogiją su tais pačiais fizikos modeliais. Tačiau žaidimų teoriją užgriuvo nauja kritikos banga, kai eksperimentų metu paaiškėjo, kad žmonės praktiškai nesilaiko pusiausvyros strategijų. Pavyzdžiui, „Šimtakojis“ ir „Diktatorius“ žaidimuose dalyviai dažnai nenaudoja strategijos profilio, kuris sudaro Nešo pusiausvyrą. Diskusijos apie tokių eksperimentų reikšmę tęsiasi. Remiantis kitu požiūriu, Nešo pusiausvyra nėra numatomo elgesio numatymas, o tik paaiškina, kodėl populiacijos, jau esančios Nešo pusiausvyroje, išlieka tokioje būsenoje. Tačiau klausimas, kaip šios populiacijos pasiekia Nešo pusiausvyrą, lieka atviras. Kai kurie tyrėjai, ieškodami atsakymo į šį klausimą, perėjo prie evoliucinių žaidimų teorijos studijų. Evoliuciniai žaidimų teorijos modeliai daro prielaidą, kad žaidėjai yra racionalūs arba neracionalūs. Nepaisant pavadinimo, evoliucinio žaidimo teorija yra susijusi ne tik su natūralia biologinių rūšių atranka, bet ne tiek. Ši žaidimų teorijos šaka tiria biologinės ir kultūrinės evoliucijos bei mokymosi proceso modelius.

Normatyvinė analizė (geriausios elgsenos nustatymas).

Kita vertus, daugelis tyrinėtojų žaidimų teoriją laiko ne elgesio numatymo, o situacijų analizės įrankiu, siekiant nustatyti geriausią racionalaus žaidėjo elgesį. Kadangi Nešo pusiausvyra apima strategijas, kurios geriausiai reaguoja į kito žaidėjo elgesį, Nash pusiausvyros sąvoka pasirenkant elgesį atrodo gana pagrįsta. Tačiau toks žaidimų teorinių modelių naudojimas taip pat buvo kritikuojamas. Pirma, kai kuriais atvejais žaidėjui naudinga pasirinkti strategiją, kuri nėra pusiausvyroje, jei jis tikisi, kad kiti žaidėjai taip pat nesilaikys pusiausvyros strategijų. Antra, garsusis žaidimas Kalinio dilema“ leidžia pateikti dar vieną priešingą pavyzdį. AT " Kalinio dilema» siekdami savo interesų, abu žaidėjai atsiduria blogesnėje situacijoje, nei jie būtų paaukoję savo interesus.

Žaidimo tipai

bendradarbiaujantys ir nebendradarbiaujantys.

Žaidimas vadinamas kooperatyviniu arba koalicija, jei žaidėjai gali burtis į grupes, prisiimdami tam tikrus įsipareigojimus kitiems žaidėjams ir koordinuodami jų veiksmus. Tuo jis skiriasi nuo nebendradarbiaujančių žaidimų, kuriuose kiekvienas privalo žaisti pats. Pramoginiai žaidimai retai būna bendradarbiaujantys, tačiau tokie mechanizmai nėra neįprasti kasdieniame gyvenime.

Dažnai manoma, kad kooperaciniai žaidimai skiriasi būtent žaidėjų gebėjimu bendrauti tarpusavyje. Apskritai tai netiesa. Būna žaidimų, kur bendrauti leidžiama, tačiau žaidėjai siekia asmeninių tikslų, ir atvirkščiai.

Iš dviejų žaidimų tipų nebendradarbiaujantys labai išsamiai aprašo situacijas ir duoda tikslesnius rezultatus. Kooperatyvai žaidimo procesą vertina kaip visumą. Bandymai sujungti šiuos du metodus davė didelių rezultatų. Vadinamasis Nash programa jau rado sprendimus kai kuriems kooperatyviniams žaidimams kaip pusiausvyros situacijas nebendradarbiaujantiems žaidimams.

Hibridiniai žaidimai apima kooperacinių ir nebendradarbiaujančių žaidimų elementus. Pavyzdžiui, žaidėjai gali burtis į grupes, tačiau žaidimas bus žaidžiamas nebendradarbiaujant. Tai reiškia, kad kiekvienas žaidėjas sieks savo grupės interesų ir tuo pačiu metu sieks asmeninės naudos.

Simetriška ir asimetriška.

Žaidimas bus simetriškas, kai atitinkamos žaidėjų strategijos yra vienodos, tai yra, jie turi vienodus laimėjimus. Kitaip tariant, jei žaidėjai gali pasikeisti vietomis ir tuo pačiu jų atlyginimai už tuos pačius ėjimus nepasikeis. Daugelis ištirtų žaidimų dviems žaidėjams yra simetriški. Visų pirma, tai yra: „Kalinio dilema“, „Elnių medžioklė“, „Vanagai ir balandžiai“. Kaip asimetrinius žaidimus galima paminėti „Ultimatumą“ arba „Diktatorių“.

Dešinėje pateiktame pavyzdyje žaidimas iš pirmo žvilgsnio gali atrodyti simetriškas dėl panašių strategijų, tačiau taip nėra – juk antrojo žaidėjo, turinčio strategijos profilius (A, A) ir (B, B), atsipirkimas. bus didesnis nei pirmasis.

Nulinė suma ir nenulinė suma.

Nulinės sumos žaidimai- ypatinga įvairovė pastovių sumų žaidimai, tai yra tie, kuriuose žaidėjai negali padidinti ar sumažinti turimų išteklių ar žaidimo fondo. Šiuo atveju visų laimėjimų suma yra lygi visų pralaimėjimų bet kuriame ėjime sumai. Pažiūrėkite į dešinę – skaičiai reiškia mokėjimus žaidėjams – ir jų suma kiekvienoje langelyje yra lygi nuliui. Tokių žaidimų pavyzdžiai yra pokeris, kai vienas laimi visus kitų statymus; reversi, kur pagaunami priešo lustai; arba banalus vagystė.

Daugelis matematikų tyrinėtų žaidimų, įskaitant jau minėtą kalinio dilemą, yra kitokio pobūdžio: žaidimai be nulinės sumos Vieno žaidėjo pergalė nebūtinai reiškia pralaimėjimą kitam, ir atvirkščiai. Tokio žaidimo rezultatas gali būti mažesnis arba didesnis už nulį. Tokius žaidimus galima konvertuoti į nulinę sumą – tai daroma įvedant fiktyvus žaidėjas, kuris „pasisavina“ perteklių arba kompensuoja lėšų trūkumą.

Kitas žaidimas su ne nuline suma yra prekyba kur kiekvienas dalyvis gauna naudos. Gerai žinomas pavyzdys, kai jis mažėja karas.

Lygiagretus ir nuoseklus.

Lygiagrečių žaidimų metu žaidėjai juda tuo pačiu metu arba bent jau nesuvokia kitų pasirinkimų, kol visi nedarys savo žingsnio. iš eilės arba dinamiškasŽaidimuose dalyviai gali atlikti judesius iš anksto nustatyta arba atsitiktine tvarka, tačiau tai darydami jie gauna tam tikrą informaciją apie ankstesnius kitų veiksmus. Ši informacija gali net ne visai baigtas, pavyzdžiui, žaidėjas gali sužinoti, kad jo priešininkas iš dešimties savo strategijų tikrai nesirinko penktas, nieko nežinodamas apie kitus.

Lygiagrečių ir nuoseklių žaidimų vaizdavimo skirtumai buvo aptarti aukščiau. Pirmieji paprastai pateikiami įprasta forma, o antrieji yra ekstensyvios formos.

Su visa arba neišsamia informacija.

Svarbus nuoseklių žaidimų pogrupis yra žaidimai su visa informacija. Tokiame žaidime dalyviai žino visus iki esamo momento padarytus ėjimus, taip pat galimas varžovų strategijas, o tai leidžia tam tikru mastu numatyti tolesnę žaidimo raidą. Paraleliuose žaidimuose nėra visos informacijos, nes juose nėra žinomi dabartiniai priešininkų judesiai. Dauguma matematikos studijuojamų žaidimų yra su nepilna informacija. Pavyzdžiui, visa „druska“ Kalinio dilemos arba Monetų palyginimai slypi jų neužbaigtumuose.

Tuo pačiu metu yra įdomių žaidimų pavyzdžių su visa informacija: Ultimatum, Centipede. Tai taip pat apima šachmatai, šaškės, go, mancala ir kt.

Dažnai išsamios informacijos sąvoka painiojama su panašia - tobula informacija . Pastariesiems pakanka tik žinoti visas oponentams prieinamas strategijas, nebūtina žinoti visų jų judesių.

Žaidimai su begaliniu žingsnių skaičiumi.

Žaidimai realiame pasaulyje arba žaidimai, studijuoti ekonomikos srityje, paprastai trunka galutinis judesių skaičius. Matematika nėra tokia ribota, o ypač aibių teorija susijusi su žaidimais, kurie gali tęstis neribotą laiką. Be to, laimėtojas ir jo laimėjimai nėra nustatomi iki visų ėjimų pabaigos.

Paprastai šiuo atveju iškyla problema ne rasti optimalų sprendimą, o bent jau rasti laimėjimo strategija. Pasitelkiant pasirinkimo aksiomą galima įrodyti, kad kartais net žaidimams su visa informacija ir dviem baigtimis – „laimėti“ arba „pralaimėti“ – nė vienas žaidėjas neturi tokios strategijos. Kai kurių specialiai sukurtų žaidimų laimėjimo strategijų buvimas vaidina svarbų vaidmenį aprašomoji aibių teorija.

Diskretūs ir nuolatiniai žaidimai.

Dažniausiai studijavo žaidimus diskretus: jie turi ribotą žaidėjų, ėjimų, įvykių, rezultatų ir tt skaičių. Tačiau šie komponentai gali būti išplėsti iki realių skaičių rinkinio. Žaidimai, kuriuose yra tokių elementų, dažnai vadinami diferencialiniais žaidimais. Jie yra siejami su tam tikru realiu mastu (dažniausiai - laiko skale), nors juose vykstantys įvykiai gali būti diskretiško pobūdžio. Diferencialiniai žaidimai svarstomi ir optimizavimo teorijoje, jie randa savo pritaikymą inžinerijoje ir technologijose, fizikoje.

Metagames.

Tai žaidimai, kurių rezultatas yra kito žaidimo taisyklių rinkinys (vadinamas taikinys arba žaidimo objektas). Metažaidimų tikslas yra padidinti pateiktų taisyklių rinkinio naudingumą. Metagamos teorija yra susijusi su optimalių mechanizmų teorija .

remiantis wikipedia.org

Studijuodamas šį skyrių, studentas turėtų:

žinoti

Dominavimo principu paremtos žaidimų sampratos, Nešo pusiausvyra, kas yra atgalinė indukcija ir kt.; konceptualūs žaidimo sprendimo būdai, racionalumo ir pusiausvyros sampratos reikšmė sąveikos strategijos rėmuose;

galėti

Atskirti žaidimus strategine ir išplėstine forma, sukurti „žaidimų medį“; suformuluoti žaidimo modelius konkurencijos įvairių tipų rinkoms;

savo

Žaidimo rezultato nustatymo metodai.

Žaidimai: pagrindinės sąvokos ir principai

Pirmą kartą sukurti matematinę žaidimų teoriją E. Borelis 1921 m. Kaip savarankiška mokslo sritis, žaidimų teorija pirmą kartą buvo sistemingai pristatyta J. von Neumanno ir O. Morgensterno monografijoje „Žaidimų teorija ir ekonominis elgesys“ 1944 m. Nuo tada daugelis ekonomikos teorijos skyrių (pvz. netobula konkurencija, ekonominių paskatų teorija ir kt.) vystėsi glaudžiai bendradarbiaujant su žaidimų teorija. Žaidimų teorija sėkmingai taikoma ir socialiniuose moksluose (pavyzdžiui, balsavimo procedūrų analizė, pusiausvyros sampratų, lemiančių individų kooperatyvą ir nebendradarbiavimą, paieška). Paprastai rinkėjai atmeta kraštutinius požiūrius atstovaujančius kandidatus, tačiau renkantis vieną iš dviejų kandidatų, siūlančių skirtingus kompromisinius sprendimus, kyla kova. Netgi Rousseau idėja apie evoliuciją nuo „prigimtinės laisvės“ iki „pilietinės laisvės“ formaliai atitinka bendradarbiavimo požiūrį žaidimo teorijos požiūriu.

Žaidimas- tai idealizuotas matematinis kelių asmenų (žaidėjų), kurių interesai skiriasi, kolektyvinio elgesio modelis, dėl kurio kyla konfliktas. Konfliktas nebūtinai reiškia antagonistinių šalių prieštaravimų buvimą, bet visada yra susijęs su tam tikru nesutarimu. Konfliktinė situacija bus antagonistinė, jei vienos iš šalių įmokos padidėjimas tam tikra suma lems kitos pusės atlyginimo sumažėjimą ta pačia suma ir atvirkščiai. Interesų priešprieša generuoja konfliktą, o interesų sutapimas žaidimą redukuoja į veiksmų derinimą (bendradarbiavimo).

Konfliktinės situacijos pavyzdžiai yra situacijos, kurios susiklosto pirkėjo ir pardavėjo santykiuose; įvairių firmų konkurencijos sąlygomis; vykstant karo veiksmams ir pan.. Įprasti žaidimai taip pat yra žaidimų pavyzdžiai: šachmatai, šaškės, kortų žaidimai, saloniniai žaidimai ir kt. (iš čia ir kilo pavadinimas „žaidimų teorija“ ir jos terminija).

Daugumoje žaidimų, kylančių analizuojant finansines, ekonomines ir vadybines situacijas, žaidėjų (šalių) interesai nėra nei griežtai antagonistiški, nei absoliučiai sutampa. Pirkėjas ir pardavėjas sutaria, kad susitarti dėl pardavimo yra jų bendras interesas, tačiau jie energingai derasi, kad pasirinktų konkrečią kainą abipusio pranašumo ribose.

Žaidimo teorija yra matematinė konfliktinių situacijų teorija.

Žaidimas nuo tikrojo konflikto skiriasi tuo, kad vyksta pagal tam tikras taisykles. Šios taisyklės nustato ėjimų seką, informacijos kiekį, kurį kiekviena pusė turi apie kitos elgesį, ir žaidimo baigtį, priklausomai nuo situacijos. Taisyklės taip pat nustato žaidimo pabaigą, kai jau atlikta tam tikra ėjimų seka ir daugiau ėjimų neleidžiama.

Žaidimų teorija, kaip ir bet kuris matematinis modelis, turi savo apribojimų. Viena iš jų – visiško (idealaus) oponentų pagrįstumo prielaida. Tikrame konflikte dažnai geriausia strategija yra atspėti, dėl ko priešas yra kvailas, ir panaudoti šią kvailystę savo naudai.

Dar vienas žaidimo teorijos trūkumas – kiekvienas iš žaidėjų turi žinoti visus įmanomus priešininko veiksmus (strategijas), tik žinoma, kuriuos iš jų jis panaudos tam tikrame žaidime. Tikrame konflikte to dažniausiai nebūna: visų galimų priešo strategijų sąrašas tiesiog nežinomas, o geriausias sprendimas konflikto situacijoje dažnai bus peržengti priešui žinomas strategijas, „apsvaiginti“. jį su kažkuo visiškai nauju, nenumatytu.

Žaidimų teorija neapima rizikos elementų, kurie neišvengiamai lydi pagrįstus sprendimus realiuose konfliktuose. Tai lemia atsargiausią, perdraudimišką konflikto dalyvių elgesį.

Be to, žaidimų teorijoje randamos optimalios strategijos vieno rodiklio (kriterijaus) atžvilgiu. Praktinėse situacijose dažnai tenka atsižvelgti ne į vieną, o į kelis skaitinius kriterijus. Strategija, kuri yra optimali vienu matmeniu, gali būti neoptimali pagal kitą.

Žinant šiuos apribojimus ir todėl aklai nesilaikant žaidimų teorijų pateiktų rekomendacijų, vis tiek galima sukurti visiškai priimtiną strategiją daugeliui realių konfliktinių situacijų.

Šiuo metu vykdomi moksliniai tyrimai, kuriais siekiama plėsti žaidimų teorijos taikymo sritis.

Literatūroje pateikiami šie žaidimą sudarančių elementų apibrėžimai.

Žaidėjai- tai subjektai, dalyvaujantys sąveikoje, vaizduojami žaidimo forma. Mūsų atveju tai namų ūkiai, firmos, valdžia. Tačiau esant išorinių aplinkybių neapibrėžtumui, visai patogu atsitiktinius žaidimo komponentus, kurie nepriklauso nuo žaidėjų elgesio, pavaizduoti kaip „gamtos“ veiksmus.

Žaidimo taisyklės.Žaidimo taisyklės yra žaidėjų galimi veiksmų ar judesių rinkiniai. Veiksmai tokiu atveju gali būti labai įvairūs: pirkėjų sprendimai dėl perkamų prekių ar paslaugų kiekių; firmos – dėl produkcijos apimties; valdžios nustatytų mokesčių lygio.

Žaidimo rezultato (rezultato) nustatymas. Kiekvienam žaidėjo veiksmų deriniui žaidimo rezultatas nustatomas beveik mechaniškai. Rezultatas gali būti: vartotojo krepšelio sudėtis, įmonės produkcijos vektorius arba kitų kiekybinių rodiklių rinkinys.

Laimėjimai. Laimėjimo sąvokos reikšmė skirtingų tipų žaidimams gali skirtis. Tuo pačiu metu būtina aiškiai atskirti pelną, išmatuotą eilės skalėje (pavyzdžiui, naudingumo lygis), ir vertes, kurių intervalų palyginimas yra prasmingas (pavyzdžiui, pelnas, gerovės lygis).

Informacija ir lūkesčiai. Neapibrėžtumas ir nuolat besikeičianti informacija gali turėti itin rimtą poveikį galimiems sąveikos rezultatams. Štai kodėl būtina atsižvelgti į informacijos vaidmenį kuriant žaidimą. Šiuo atžvilgiu koncepcija informacijos rinkinysžaidėjas, t.y. visos informacijos apie žaidimo būseną, kurią jis turi pagrindiniais laiko momentais, visuma.

Svarstant žaidėjų prieigą prie informacijos, intuityvi bendrų žinių idėja arba viešumas, Tai reiškia: faktas yra gerai žinomas, jei visi žaidėjai tai žino ir visi žaidėjai žino, kad kiti žaidėjai taip pat žino apie tai.

Tais atvejais, kai bendro žinojimo sąvokos taikymo neužtenka, individo samprata lūkesčius dalyviai – idėjos apie žaidimo situaciją šiame etape.

Žaidimo teorijoje daroma prielaida, kad žaidimas susideda iš juda,žaidėjų atlieka vienu metu arba paeiliui.

Judėjimai yra asmeniški ir atsitiktiniai. Judėjimas vadinamas Asmeninis, jeigu žaidėjas sąmoningai pasirenka jį iš galimų veiksmų variantų rinkinio ir jį įgyvendina (pavyzdžiui, bet kokį ėjimą šachmatų partijoje). Judėjimas vadinamas atsitiktinis, jei jo pasirinkimą daro ne žaidėjas, o koks nors atsitiktinės atrankos mechanizmas (pavyzdžiui, remiantis monetos metimo rezultatais).

Žaidėjų atliktų ėjimų nuo žaidimo pradžios iki pabaigos rinkinys vadinamas vakarėlis.

Viena iš pagrindinių žaidimų teorijos sąvokų yra strategijos samprata. strategijažaidėjas vadinamas taisyklių rinkiniu, kuris lemia kiekvieno asmeninio ėjimo veiksmų varianto pasirinkimą, priklausomai nuo žaidimo metu susidariusios situacijos. Paprastuose (vieno ėjimo) žaidimuose, kai žaidėjas gali atlikti tik vieną ėjimą kiekviename žaidime, strategijos ir galimos veiksmų eigos sąvokos sutampa. Šiuo atveju žaidėjo strategijų visuma apima visus galimus jo veiksmus ir visus galimus žaidėjui i veiksmas yra jo strategija. Sudėtinguose (kelių judesių) žaidimuose sąvokos „galimų veiksmų variantas“ ir „strategija“ gali skirtis viena nuo kitos.

Žaidėjo strategija vadinama optimalus, jei jis suteikia tam žaidėjui didžiausią įmanomą vidutinį pelną arba minimalų galimą vidutinį nuostolį, nepaisant to, kokias strategijas naudoja priešininkas, kai žaidimas kartojamas daug kartų. Taip pat gali būti naudojami kiti optimalumo kriterijai.

Gali būti, kad strategija, kuri suteikia didžiausią atlygį, neturi kito svarbaus optimalumo atvaizdo, pavyzdžiui, sprendimo stabilumo (pusiausvyros). Žaidimo sprendimas yra tvarus(pusiausvyra), jei šį sprendimą atitinkančios strategijos sudaro situaciją, kurios nė vienas iš žaidėjų nėra suinteresuotas keisti.

Pakartojame, kad žaidimų teorijos uždavinys yra rasti optimalias strategijas.

Žaidimų klasifikacija parodyta fig. 8.1.

  • 1. Pagal ėjimų tipus žaidimai skirstomi į strateginius ir azartinius. azartinių lošimųžaidimus sudaro tik atsitiktiniai judesiai, kurių žaidimo teorija nenagrinėja. Jei kartu su atsitiktiniais judesiais yra asmeninių ėjimų arba visi judesiai yra asmeniniai, tokie žaidimai vadinami strateginis.
  • 2. Priklausomai nuo žaidėjų skaičiaus, žaidimai skirstomi į dvejetus ir kartotinius. AT dvejetų žaidimas dalyvių skaičius – du daugkartinis- daugiau nei du.
  • 3. Daugybinio žaidimo dalyviai gali sudaryti nuolatines arba laikinas koalicijas. Pagal žaidėjų tarpusavio santykių pobūdį žaidimai skirstomi į nebendradarbiaujančius, koalicinius ir kooperatyvinius.

Ne koalicija vadinami žaidimais, kuriuose žaidėjai neturi teisės sudaryti susitarimų, formuoti koalicijų, o kiekvieno žaidėjo tikslas – gauti kuo didesnį individualų pelną.

Žaidimai, kuriuose žaidėjų veiksmais siekiama maksimaliai padidinti kolektyvų (koalicijų) atlygį be tolesnio jų padalijimo tarp žaidėjų, vadinami koalicija.

Ryžiai. 8.1.

Išėjimas kooperatyvasžaidimas – tai koalicijos atlygio padalijimas, kuris atsiranda ne dėl tam tikrų žaidėjų veiksmų, o dėl jų iš anksto numatytų susitarimų.

Atsižvelgiant į tai, kooperaciniuose žaidimuose pagal pirmenybę lyginamos ne situacijos, kaip yra nebendradarbiaujančiuose žaidimuose, o skirstymai; ir palyginimas neapsiriboja individualios naudos įvertinimu, bet yra sudėtingesnis.

  • 4. Pagal kiekvieno žaidėjo strategijų skaičių žaidimai skirstomi į galutinis(kiekvieno žaidėjo strategijų skaičius yra baigtinis) ir begalinis(kiekvieno žaidėjo strategijų rinkinys yra begalinis).
  • 5. Pagal žaidėjų turimą informaciją apie praeities ėjimus, žaidimai skirstomi į žaidimus su pilna informacija(yra visa informacija apie ankstesnius ėjimus) ir nepilna informacija.Žaidimų su visa informacija pavyzdžiai yra šachmatai, šaškės ir panašiai.
  • 6. Pagal aprašymo tipą žaidimai skirstomi į pozicinius (arba žaidimus išplėstine forma) ir įprastos formos žaidimus. Pozicijos žaidimai pateikiami žaidimų medžio pavidalu. Bet bet koks pozicinis žaidimas gali būti sumažintas iki normali forma, kuriame kiekvienas žaidėjas atlieka tik vieną savarankišką ėjimą. Poziciniuose žaidimuose judesiai atliekami atskiru laiku. Egzistuoti diferenciniai žaidimai, kuriame judesiai daromi nuolat. Šiuose žaidimuose nagrinėjamos kito valdomo objekto valdomo objekto siekimo problemos, atsižvelgiant į jų elgesio dinamiką, kuri apibūdinama diferencialinėmis lygtimis.

Taip pat yra atspindintys žaidimai, kuriose nagrinėjamos situacijos, susijusios su galimo priešo veiksmų ir elgesio protiniu atkūrimu.

7. Jei kuris nors galimas kurio nors žaidimo žaidimas turi nulinę visų išmokų sumą Nžaidėjai (), tada pakalbėkite apie nulinės sumos žaidimas. Kitu atveju žaidimai vadinami žaidimai be nulinės sumos.

Aišku, nulinės sumos poros žaidimas yra antagonistinis kadangi vieno žaidėjo pelnas yra lygus antrojo praradimui, todėl šių žaidėjų tikslai yra tiesiogiai priešingi.

Vadinamas baigtinės poros nulinės sumos žaidimas matricos žaidimas. Tokį žaidimą apibūdina išmokėjimo matrica, kurioje pateikiami pirmojo žaidėjo laimėjimai. Matricos eilutės numeris atitinka pirmojo žaidėjo pritaikytos strategijos numerį, stulpelis – antrojo žaidėjo taikomos strategijos numerį; eilutės ir stulpelio sankirtoje yra atitinkamas pirmojo žaidėjo pelnas (antrojo žaidėjo pralaimėjimas).

Vadinamas baigtinių porų žaidimas su ne nuline suma bimatrix žaidimas. Tokį žaidimą apibūdina dvi išmokėjimo matricos, kiekviena skirta atitinkamam žaidėjui.

Paimkime tokį pavyzdį. Žaidimas „Rekordas“. Tegul 1 žaidėjas yra mokinys, besiruošiantis testui, o 2 žaidėjas – testą laikantis mokytojas. Tarkime, kad mokinys turi dvi strategijas: A1 – gerai pasiruošti testui; A 2 – nepasiruošti. Mokytojas taip pat turi dvi strategijas: B1 – atlikti testą; B 2 – neužsiimkite. Žaidėjų išmokėjimo verčių įvertinimas gali būti pagrįstas, pavyzdžiui, tokiomis aplinkybėmis, kurios atsispindi išmokėjimo matricose:

Šis žaidimas pagal aukščiau pateiktą klasifikaciją yra strateginis, porinis, nebendradarbiaujantis, baigtinis, aprašytas įprasta forma, su ne nuline suma. Trumpiau tariant, šis žaidimas gali būti vadinamas bimatrix.

Užduotis – nustatyti optimalias strategijas mokiniui ir mokytojui.

Kitas gerai žinomo bimatricinio žaidimo „Prisoner's Dilemma“ pavyzdys.

Kiekvienas iš dviejų žaidėjų turi dvi strategijas: A 2 ir B 2 – agresyvaus elgesio strategijos, a A aš ir B i – taikus elgesys. Tarkime, kad „taika“ (abu žaidėjai yra taikūs) yra geriau abiem žaidėjams nei „karas“. Agresoriui naudingesnis atvejis, kai vienas žaidėjas yra agresyvus, o kitas yra taikus. Tegul 1 ir 2 žaidėjų išmokėjimo matricos šiame bimatriciniame žaidime turi tokią formą

Abiem žaidėjams agresyvios strategijos A2 ir B2 dominuoja taikiose strategijose Ax ir B v Taigi vienintelė dominuojančių strategijų pusiausvyra turi formą (A2, B 2), t.y. postuluojama, kad nebendradarbiaujančio elgesio rezultatas yra karas. Tuo pačiu metu rezultatas (A1, B1) (pasaulis) suteikia didesnį pelną abiem žaidėjams. Taigi nebendradarbiaujantis egoistinis elgesys prieštarauja kolektyviniams interesams. Kolektyviniai interesai lemia taikių strategijų pasirinkimą. Tuo pačiu metu, jei žaidėjai nesikeičia informacija, karas yra labiausiai tikėtinas rezultatas.

Šiuo atveju situacija (A1, B1) yra Pareto optimali. Tačiau ši situacija yra nestabili, todėl žaidėjai gali pažeisti nustatytą susitarimą. Iš tiesų, jei pirmasis žaidėjas pažeidžia susitarimą, o antrasis - ne, tada pirmojo žaidėjo išmokėjimas padidės iki trijų, o antrojo - iki nulio ir atvirkščiai. Be to, kiekvienas žaidėjas, kuris nepažeidžia susitarimo, pralaimi daugiau, jei antrasis žaidėjas pažeidžia susitarimą, nei jei jie abu pažeidžia susitarimą.

Yra dvi pagrindinės žaidimo formos. žaidimas plati forma vaizduojama kaip „medžio“ tipo sprendimų priėmimo schema, kurios „šaknis“ atitinka žaidimo pradžios tašką ir kiekvienos naujos „šakos“, vadinamos, pradžia. mazgas,- būsena, pasiekta šiame etape, kai žaidėjai jau ėmėsi veiksmų. Kiekvienam galutiniam mazgui – kiekvienam žaidimo galutiniam taškui – priskiriamas išmokėjimo vektorius, po vieną komponentą kiekvienam žaidėjui.

strateginis, kitaip vadinamas normali, formaŽaidimo vaizdavimas atitinka daugiamatę matricą, kurioje kiekvienas matmuo (eilutės ir stulpeliai dvimačiu atveju) apima galimų vieno agento veiksmų rinkinį.

Atskiroje matricos langelyje yra išmokėjimų vektorius, atitinkantis tam tikrą žaidėjo strategijų derinį.

Ant pav. 8.2 pateikia plačią žaidimo formą ir lentelėje. 8.1 - strateginė forma.

Ryžiai. 8.2.

8.1 lentelė.Žaidimas kartu su sprendimų priėmimu strategine forma

Yra gana išsami žaidimų teorijos komponentų klasifikacija. Vienas iš bendriausių tokios klasifikacijos kriterijų yra žaidimo teorijos skirstymas į nebendradarbiaujančių žaidimų teoriją, kurioje sprendimų priėmimo subjektai yra patys individai, ir kooperacinių žaidimų teoriją, kurioje žaidimo subjektai. sprendimų priėmimas yra asmenų grupės arba koalicijos.

Nebendradarbiaujantys žaidimai dažniausiai pateikiami įprastomis (strateginėmis) ir išplėstomis (išsamiomis) formomis.

  • Vorobjovas N. N.Žaidimų teorija eko-jomistams-kiberistams. Maskva: Nauka, 1985 m.
  • Wentzel E. S. Operacijų tyrimas. Maskva: Nauka, 1980 m.

eksperimentinė ekonomika

Ir kiti analizės metodai

Kaip ir bet kuris kitas mokslas, kuris nėra visiškai tradicinis, institucinė ekonomika naudoja skirtingus analizės metodus. Tai tradicinės mikroekonomikos priemonės, ekonometriniai metodai, statistinės informacijos analizė ir kt. Šiame skyriuje trumpai aptariame žaidimų teorijos, eksperimentinės ekonomikos ir kitų institucinei analizei pritaikytų metodų taikymą.

Žaidimo teorija. Žaidimo teorija- analitinis metodas, sukurtas po Antrojo pasaulinio karo ir naudojamas situacijoms, kuriose asmenys sąveikauja strategiškai, analizuoti. Šachmatai yra strateginio žaidimo prototipas, nes rezultatas priklauso nuo priešininko elgesio, taip pat nuo paties žaidėjo elgesio. Dėl analogijų tarp strateginių žaidimų ir politinės bei ekonominės sąveikos formų žaidimų teorija susilaukė didesnio dėmesio socialiniuose moksluose. Šiuolaikinė žaidimų teorija prasideda nuo D. Neumanno ir O. Morgensterno kūrinio „Žaidimų teorija ir ekonominis elgesys“ (1944 m., rusiška versija – 1970 m.). Teorija tiria individualių sprendimų sąveiką, remiantis tam tikromis prielaidomis apie sprendimų priėmimą rizikos sąlygomis, bendrą aplinkos būklę, bendradarbiaujantį ar nebendradarbiaujantį kitų asmenų elgesį. Akivaizdu, kad racionalus individas turi priimti sprendimus neapibrėžtumo ir sąveikos sąlygomis. Jei vieno asmens laimėjimas yra kito praradimas, tai yra nulinės sumos žaidimas. Kai kiekvienas iš asmenų gali turėti naudos iš vieno iš jų sprendimo, tada vyksta žaidimas su ne nuline suma. Žaidimas gali būti bendradarbiaujantis, kai įmanomas slaptas susitarimas, ir nebendradarbiaujantis, kai vyrauja priešprieša. Vienas gerai žinomas ne nulinės sumos žaidimo pavyzdys yra kalinio dilema (PD). Šis pavyzdys rodo, kad, priešingai nei teigia liberalizmas, individo savo interesų siekimas veda prie sprendimo, kuris yra mažiau patenkinamas nei galimos alternatyvos.

Ribinė teorema F.I. Edgeworthas laikomas ankstyvu kooperacinio žaidimo pavyzdžiu n dalyvių. Teorema teigia, kad didėjant grynosios mainų ekonomikos dalyvių skaičiui, susitarimas tampa mažiau naudingas ir mažėja galimų pusiausvyros santykinių kainų aibė (branduo). Jei dalyvių skaičius linkęs į begalybę, tai lieka tik viena santykinių kainų sistema, atitinkanti bendrosios pusiausvyros kainas.

Optimalaus (pusiausvyros) sprendimo samprata pagal Nashą yra viena pagrindinių žaidimų teorijos sąvokų. Jį 1951 metais pristatė amerikiečių matematikas Johnas F. Nashas.

Šiame kontekste pakanka nagrinėti šią koncepciją, susijusią su žaidimo teoriniu dviejų asmenų modeliu 25 . Šiame modelyje kiekvienas iš dalyvių turi tam tikrą netuščią strategijų rinkinį S i , i= 1, 2. Šiuo atveju konkrečių strategijų pasirinkimas iš žaidėjui prieinamų vykdomas taip, kad maksimaliai padidintų savo išmokėjimo funkcijos (naudingumo) vertę. u i , i= 1, 2. Išmokėjimo funkcijos reikšmės pateiktos sutvarkytų žaidėjo strategijų porų rinkinyje S vienas S 2 , kurio elementai yra visi galimi žaidėjų strategijų deriniai ( s 1 , s 2) (strategijų porų eilės tvarka yra tokia, kad kiekvienoje iš kombinacijų pirmąją vietą užima pirmojo žaidėjo strategija, antrąją – antrojo), t.y. u i = u i (s 1 , s 2), i= 1, 2. Kitaip tariant, kiekvieno žaidėjo atsipirkimas priklauso ne tik nuo jo pasirinktos strategijos, bet ir nuo jo priešininko pasirinktos strategijos.

Optimalus Nash sprendimas yra strategijų pora ( s 1 *, s 2 *), s iS i , i= 1, 2, kuri turi tokią savybę: strategija s 1 * suteikia grotuvą 1 didžiausias laimėjimas, kai 2 žaidėjas pasirenka strategiją s 2 * ir simetriškas s 2* suteikia maksimalią žaidėjo išmokėjimo funkcijos reikšmę 2 kai žaidėjas 1 strategija yra priimta s vienas *. Pora strategijų veda į Nash pusiausvyrą, jei žaidėjas pasirenka 1 , yra optimalus tam tikram žaidėjo pasirinkimui 2 , o 2 žaidėjo pasirinkimas yra optimalus tam žaidėjo pasirinkimui 1 . Nash optimalumo sąvoką galima aiškiai apibendrinti žaidimo atveju n asmenų. Reikėtų pažymėti, kad Nash pusiausvyros egzistavimas nereiškia, kad ji yra Pareto optimali, o Pareto optimalus strategijų rinkinys neturi tenkinti Nešo pusiausvyros. 1994 metais J. F. Nashas, ​​R. Seltenas ir J. C. Harshani buvo apdovanoti A. Nobelio memorialine ekonomikos premija už indėlį plėtojant žaidimų teoriją ir jos taikymą ekonomikoje.

Kreipimasis į šį metodą priklauso nuo jo galios išryškinant institucinių pokyčių priežastis ir pasekmes. Žaidimo teorijos gebėjimas padėti analizuoti taisyklių keitimo pasekmes yra neabejotinas; jo galia atskleisti priežastis yra dviprasmiška. Bet kokia žaidimo teorinė analizė turi suponuoti išankstinį pagrindinių žaidimo taisyklių apibrėžimą. Taigi O. Morgensternas 1968 metais rašė: „Žaidimai aprašomi apibrėžiant galimą elgesį žaidimo taisyklių ribose. Taisyklės kiekvienu atveju yra nedviprasmiškos; pavyzdžiui, šachmatuose tam tikri ėjimai leidžiami tam tikroms figūroms, bet draudžiami kitoms. Taisyklės taip pat nepažeidžiamos. Kai į socialinę situaciją žiūrima kaip į žaidimą, taisykles suteikia fizinė ir teisinė aplinka, kurioje vyksta individų veiksmai.

Jei toks požiūris bus priimtas, negalima tikėtis, kad žaidimų teorija paaiškins esminių ekonominio, politinio ir socialinio gyvenimo organizavimo taisyklių pasikeitimą: akivaizdu, kad tokių taisyklių apibrėžimas yra būtina tokios analizės sąlyga.

Institucijų reikšmei suprasti pasitelkiami koordinacinio žaidimo modeliai ir kalinių dilemos.

Apsvarstykite grynojo ir apibendrinto koordinavimo problema. Grynas koordinavimo žaidimas rodo, kad ūkio subjektai negali garantuoti, kad supras abipusę bendradarbiavimo naudą, net jei nėra interesų konflikto. Kitaip tariant, „grynojo“ koordinavimo situacijoje yra daugialypė pusiausvyra, kuriai vienodai pirmenybę teikia kiekviena pusė. Šiuo atveju nėra interesų konflikto, tačiau nėra garantijos, kad visi sieks to paties pusiausvyros rezultato. Gerai žinomas pavyzdys yra pasirinkimas, kuria kelio puse (dešinėje ar kairėje) turėtų važiuoti žmonės (2.1 pav.). Šiame žaidime yra dvi Nash pusiausvyros, atitinkančios strategijų rinkinius (kairėje, kairėje) ir (dešinėje, dešinėje). Niekas iš anksto neprieštaravo važiuoti dešine ar kaire puse, tačiau norint pasiekti suderintą rezultatą su daugybe derybininkų, reikėtų didelių sandorio sąnaudų. Reikalinga institucija, kuri atliktų židinio funkciją, t.y. sugalvojo bendrą sprendimą. Tokia institucija gali būti bendros žinios, gautos remiantis tos pačios rūšies situacijos analize, rezultatas arba gali būti valstybė, kuri įsikiša siekdama įvesti koordinavimo taisyklę ir sumažinti sandorio išlaidas. Apskritai institucijos atlieka koordinavimo funkciją, mažina neapibrėžtumą.

Apibendrinta koordinavimo problema egzistuoja, jei išmokėjimo matrica yra tokia, kad bet kuriame pusiausvyros taške nė vienas žaidėjas neturi paskatos keisti savo elgesio, atsižvelgiant į kitų žaidėjų elgesį, tačiau nė vienas žaidėjas nenori, kad joks kitas žaidėjas tai pakeistų. Šiuo atveju visi norėtų suderinto rezultato, o ne nekoordinuoto, bet galbūt visi norėtų teikti pirmenybę tam tikram suderintam rezultatui (2.2 pav.). Pavyzdžiui, du gamintojai BET ir B naudoti skirtingas technologijas X ir Y, bet nori įvesti nacionalinį gaminio standartą, kuris sukels tinklo išorinius padarinius. Gamintojas BET būtų daugiau naudos, jei technologija taptų standartu X, ir gamintojas B- technologija Y. Atlyginimas paskirstomas asimetriškai. Taigi gamintojas BET(B) norėtų, kad standartas taptų X(Y)-technologiją, tačiau abu pirmenybę teikia bet kokiems suderintiems rezultatams, o ne nesuderintam. Šio modelio sandorių išlaidos bus didesnės nei ankstesniame (ypač dalyvaujant daugybei šalių), nes kyla interesų konfliktas. Privačių bandymų derinti veiksmus pakeitus vyriausybės įsikišimu, sumažėtų sandorių sąnaudos ekonomikoje. Pavyzdžiai yra vyriausybės technologijų standartų įgyvendinimas, matavimo ir kokybės standartai ir kt. Apibendrintas koordinavimo modelis iliustruoja ne tik institucijų koordinacinės funkcijos svarbą, bet ir paskirstymo funkciją, kuri apriboja galimas žaidėjų alternatyvas, o galiausiai ir sąveikos efektyvumą.

Kalinio dilema dažnai minimas kaip asmenų bendradarbiavimo užmezgimo problemos pavyzdys. Žaidimą žaidžia du žaidėjai, du kaliniai, kuriuos skiria sargybiniai. Kiekvienas turi du pasirinkimus: bendradarbiauti, t.y. tylėti, arba atsisakyti bendradarbiauti, t.y. išduoti kitą. Kiekvienas turi veikti nežinodamas, ką darys kitas. Visiems sakoma, kad pripažinimas, jei kitas tyli, veda į laisvę. Atsisakymas pripažinti kitą išdavystę reiškia mirtį. Jei abu prisipažins, jie kartu kelerius metus praleis kalėjime. Jei kiekvienas iš jų atsisakys prisipažinti, jis bus trumpam suimtas ir paleistas. Darant prielaidą, kad kalėjimas yra geresnis už mirtį, o laisvė yra labiausiai geidžiama būsena, kaliniai susiduria su paradoksu: nors jie abu norėtų neišduoti vienas kito ir praleisti trumpai kalėjime, kiekvienas iš jų bus geresnėje padėtyje. išduoti kitą, nepaisant to, kad imsis kitą. Analitiškai kalinių gebėjimas užmegzti ryšį nukeliauja į antrą planą, nes paskatos išduoti išlieka vienodai stiprios su ryšiu arba be jo. Išdavystė išlieka dominuojančia strategija.

Ši analizė padeda paaiškinti, kodėl egoistiškai maksimizuojantys agentai negali racionaliai pasiekti arba išlaikyti bendradarbiavimo rezultato (individualaus racionalumo paradoksas). Tai naudinga paaiškinant kartelio ar kito bendradarbiavimo susitarimo ex post žlugimą, bet nepaaiškina, kaip susidaro kartelis ar bendradarbiavimo susitarimas. Jei kaliniams pavyksta susitarti, problema išnyksta: jie susitaria neišduoti vienas kito ir pasiekia tašką, kai maksimaliai padidina savo bendrą naudą. Taigi pakanka sudaryti susitarimą, kuris yra bendrai pageidaujamas, tačiau kiekvienas atskirai gali būti labiau pažeidžiamas žalos nei jei tokio susitarimo nėra. Ši analizė atkreipia dėmesį į institucijas, kurios individualiu požiūriu gali padaryti tokius susitarimus mažiau rizikingus.

Teorinėje literatūroje išskiriama kooperatyvinių ir nebendradarbiaujančių žaidimų analizė. Kaip jau buvo aprašyta, žaidėjai gali sudaryti juos įpareigojančius susitarimus. Tokių susitarimų garantas yra numanomas. Daugelis žaidimų teoretikų tvirtina, kad sukčiavimas ir susitarimų pažeidimas yra bendri žmonių santykių bruožai, todėl toks elgesys turi likti strateginėje erdvėje. Kooperacijos atsiradimą ir išlaikymą bandoma paaiškinti nebendradarbiaujančių žaidimų modelyje, ypač be galo pasikartojančios PD žaidimų sekos modelyje. Galutinė žaidimų seka neduos rezultato, nes nuo to momento, kai paskutiniame žaidime dominuojanti strategija taps aiškiai ydinga, o nuo to momento, kai bus tikimasi, tas pats galios ir priešpaskutiniame žaidime ir t.t. pirmasis žaidimas. Begalinėse žaidimų serijose, laikantis tam tikrų prielaidų dėl išmokų diskontavimo, bendradarbiavimas gali pasirodyti kaip pusiausvyros strategija. Taigi nebendradarbiaujanti analizė neišvengia būtinybės priimti pagrindines žaidimo taisykles kaip strateginės erdvės aprašymo dalį. Tai tiesiog siūlo kitokias ir mažiau ribojančias taisykles. Skirtingai nuo kooperatyvinės analizės, susitarimus galima nutraukti savo nuožiūra. Kita vertus, išėjimas iš nepertraukiamo žaidimo yra ribotas. Nė vienas iš požiūrių neišvengia būtinybės apibrėžti žaidimo taisykles prieš pradedant analizę.

Vienas iš įdomiausių pastarojo meto PD tyrimų pasiekimų buvo turnyrų organizavimas tarp iš anksto nustatytų strategijų, skirtų žaisti ribotai pasikartojančius 2 žaidėjų PD žaidimus. Pirmąjį iš jų organizavo Robertas Axelrodas (aprašytas 1984 m.), kuriame buvo žaidžiama 200 žaidimų. Patyrusiems DZ dalyviams buvo pasiūlytos kompiuterinės programos, kurios vėliau varžėsi tarpusavyje.

R. Axelrodas žaidėjus informavo, kad strategijos bus vertinamos ne pagal pergalių skaičių, o pagal jų taškų sumą prieš visas kitas strategijas, po tris balus už abipusį bendradarbiavimą, vieną tašką už abipusį nusižengimą ir 5:0 pergalę. pasišalinimui/bendradarbiavimui. Kaip minėta anksčiau, analitiškai aišku, kad atsimetimas yra dominuojanti paskutinio žaidimo strategija, taigi ir kiekviename ankstesniame žaidime.

Apsvarstykite R. Axelrod 27 analizuotą išmokėjimo matricą PD (2.3 pav.). Nepriklausomai nuo to, ką daro kitas žaidėjas, išdavystė suteikia didesnį atlygį nei bendradarbiavimas. Jei pirmasis žaidėjas mano, kad kitas žaidėjas tylės, tada jam labiau apsimoka išduoti ($5>3$). Kita vertus, jei pirmasis žaidėjas mano, kad kitas išduos, jam vis tiek labiau apsimoka išduoti save ($ 1 geriau nei nieko). Todėl pagunda linksta į išdavystę. Bet jei abu išduoda, abu gauna mažiau nei bendradarbiavimo situacijoje (1 USD+1 USD<$3+$3).

Antras žaidėjas

bendradarbiauja

Pirmasis žaidėjas

bendradarbiauja

Ryžiai. 2.3. Atsipirkimo matrica kalinio dilemoje

Kalinio dilema, garsi ekonomikos problema, rodo, kad tai, kas yra racionalu arba optimalu vienam veiksniui, gali nebūti racionalu ar optimalu kartu nagrinėjamų asmenų grupei. Savanaudiškas individo elgesys gali būti žalingas arba destruktyvus grupei. Pakartotiniuose PD žaidimuose tinkama strategija nėra akivaizdi. Norint rasti gerą strategiją, buvo organizuojami turnyrai. Jei laimėjimai būtų gaunami griežtai laimėjimo-pralaimėjimo principu, kiekvienas turnyro dalyvis turėtų pasiūlyti nuolatinį nusižengimą. Tačiau balų skaičiavimo taisyklės aiškiai parodė, kad tam tikro bendradarbiavimo organizavimas gali lemti aukštesnius bendrus rezultatus. Daugelio nuostabai nugalėjo paprasta A. Rapoporto pasiūlyta „tit-for-tat“ strategija: žaidėjas bendradarbiauja pirmame žingsnyje, o paskui atlieka tą patį judesį, kurį kitas žaidėjas padarė ankstesniame žingsnyje.

Antrajame turnyre dalyvavo daug daugiau žaidėjų, tarp kurių buvo ir profesionalai, ir tie, kurie žinojo apie pirmojo turo rezultatus. Rezultatas buvo dar viena kopijavimo strategijos („tit for tat“) pergalė.

Turnyrų rezultatų analizė atskleidė keturias savybes, kurios lemia sėkmingą strategiją: 1) noras išvengti nereikalingų konfliktų ir bendradarbiauti tiek, kiek daro kitas; 2) gebėjimas mesti iššūkį nesukeltos kito išdavystės akivaizdoje; 3) atleidimas atsakius į iššūkį; 4) elgesio aiškumas, kad kitas žaidėjas galėtų atpažinti ir prisitaikyti prie pirmojo veikimo būdo.

R. Axelrodas parodė, kad bendradarbiavimas gali prasidėti, vystytis ir stabilizuotis situacijose, kurios šiaip yra nepaprastos, nieko gero nežadančios. Galima sutikti, kad „tit-for-tat“ strategija yra analitiškai neracionali žaidime, kuris visiškai pasikartoja, tačiau empiriškai taip nėra. Jei strategija „tit-for-tt“ konkuruotų su kitomis analitinėmis strategijomis, kurios visos būtų sudarytos iš nuolatinio atsitraukimo, ji negalėtų laimėti turnyro.

Žaidimų teorija gali būti svarbi priemonė tiriant žmonių sąveiką pagal taisykles. Dėl savo gebėjimo ištirti skirtingų institucinių susitarimų pasekmes, jis taip pat gali būti naudingas viešosios politikos požiūriu kuriant naują institucinę tvarką. Žaidimų teorija buvo naudojama analizuojant viešąsias gėrybes, oligopoliją, kartelį ir susitarimą prekių ir darbo rinkose. Nepaisant visų savo privalumų, žaidimų teorija turi ir santykinių silpnybių. Kai kurie autoriai kėlė abejonių dėl kalinio dilemos modelio taikymo socialiniuose moksluose. Pavyzdžiui, M. Taylor 1987 metais pasiūlė, kad tokie žaidimai atitiktų viešųjų gėrybių teikimo aplinkybes. 1985 m. N. Schofieldas teigė, kad agentai turi suformuoti nuoseklias sampratas apie kitų agentų įsitikinimus ir troškimus, įskaitant pažinimo ir interpretavimo problemas, kurias nelengva modeliuoti 28 . Daugelis ekonomistų pažymėjo, kad žaidimų teorijos naudojimas be kvalifikacijos gali sumažinti ekonominę veiklą iki pernelyg statinio modelio. Visų pirma Nobelio premijos laureatas R. Stone'as 1948 metais rašė: „Pagrindinis bruožas, dėl kurio žaidimo teorija konfliktuoja su gyvąja tikrove, yra ta, kad tyrimo objektas yra ribotas laike – žaidimas turi pradžią ir pabaigą. To negalima pasakyti apie ekonominę realybę. Kaip tik galimybėje izoliuoti partiją nuo žaidimo slypi gilus teorijos ir tikrovės divergencija, ir ši divergencija riboja jos taikymą“ 29 . Tačiau nuo to laiko buvo atliktas neįkainojamas darbas siekiant išlyginti šį neatitikimą ir išplėsti žaidimų teorijos taikymą ekonomikoje.

Eksperimentinė ekonomika. Kitas metodologinis požiūris, naudojamas ekonomikos teorijos ir susijusių mokslų postulatams patikrinti, taip pat institucinėms problemoms paaiškinti, yra eksperimentinė ekonomika. Sukurtų institucijų poveikis išteklių paskirstymo efektyvumui ne visada gali būti prognozuojamas ex ante. Vienas iš būdų sutaupyti ex post išlaidas – imituoti institutų darbą laboratorinėmis sąlygomis.

Apskritai ekonominis eksperimentas – tai ekonominio reiškinio ar proceso atkūrimas, siekiant jį ištirti kuo palankiausiomis sąlygomis ir tolimesnius praktinius pokyčius. Eksperimentai, kurie atliekami realiomis sąlygomis, vadinami natūraliais arba lauko eksperimentais, o dirbtinėmis sąlygomis – laboratoriniais. Pastariesiems dažnai reikia naudoti ekonominius ir matematinius metodus bei modelius. Gamtiniai eksperimentai gali būti atliekami mikro lygmeniu (R. Owen, F. Taylor eksperimentai, dėl kaštų apskaitos įvedimo įmonėje ir kt.) ir makro lygiu (ekonominės politikos galimybės, laisvosios ekonominės zonos ir kt.). ). Laboratoriniai eksperimentai – tai dirbtinai atkuriamos ekonominės situacijos, tam tikri ekonominiai modeliai, kurių aplinką (eksperimento sąlygas) kontroliuoja tyrėjas laboratorijoje.

Amerikos ekonomistas Rothas, nuo 70-ųjų pabaigos. dirbdamas eksperimentinės ekonomikos srityje, pažymi nemažai laboratorinių eksperimentų pranašumų prieš „lauko“ eksperimentus 30 . Laboratorinėmis sąlygomis eksperimentuotojas gali visiškai kontroliuoti aplinką ir tiriamųjų elgesį, tuo tarpu „lauko“ eksperimentuose įmanoma kontroliuoti tik ribotą aplinkos veiksnių skaičių ir beveik neįmanoma – ekonominių subjektų elgesį. Kaip tik dėl to laboratoriniai eksperimentai leidžia tiksliau nustatyti sąlygas, kuriomis galima tikėtis atskirų reiškinių pasikartojimo. Be to, natūralūs eksperimentai kainuoja brangiai ir, jei nepavyksta, paveikia daugelio žmonių gyvenimus.

Eksperimentinės ekonomikos domėjimosi sritis gana plati: žaidimų teorijos nuostatos, pramonės rinkų teorija, racionalaus pasirinkimo modelis, rinkos pusiausvyros fenomenas, viešųjų gėrybių problemos ir kt.

Pavyzdžiui, apsistokime ties rinkos institucijų lyginamojo efektyvumo tyrimo rezultatais, kuriuos paskelbė Ch.A. Holtas ir pristatė A.E. Šastitko 31 . Tyrime lyginamos teorinių ir eksperimentinių rinkos modelių išvados, gautos atliekant kontroliuojamus eksperimentus. Agentų elgesio rezultatai matuojami pirkėjo ir pardavėjo galimų nuomos mokesčių sumos išnaudojimo santykiu, atitinkančiu mainų efektyvumą. Išnaudojimo koeficientas – faktiškai (eksperimentiškai) gautos nuomos mokesčio ir maksimalios galimos vertės santykis – svyruoja nuo 0 iki 1. Palyginimas atliktas pagal tokias rinkos formas: dvišalis aukcionas, prekyba pagal kainų pasiūlymus iš vieno tarp šalių, kliringo namai, decentralizuotos derybos dėl kainų, prekyba pagal pasiūlymus, po kurių vyksta derybos. Įdomiausius eksperimentinius rezultatus skirtingos tyrėjų grupės gavo apie pirmąsias dvi rinkos formas (2.1 lentelė).

Žaidimo teorija - matematinių metodų kompleksas konfliktinėms situacijoms (interesų susidūrimams) spręsti. Žaidimo teorijoje žaidimas yra matematinis konfliktinės situacijos modelis. Žaidimo teorijoje ypač dominantis dalykas yra žaidimo dalyvių sprendimų priėmimo strategijų neapibrėžtumo sąlygomis tyrimas. Neapibrėžtumas kyla dėl to, kad dvi ar daugiau pusių siekia priešingų tikslų, o kiekvienos iš šalių veiksmų rezultatai priklauso nuo partnerio judesių. Tuo pačiu metu kiekviena iš šalių siekia priimti optimalius sprendimus, maksimaliai įgyvendinančius užsibrėžtus tikslus.

Žaidimų teorija nuosekliausiai taikoma ekonomikoje, kur konfliktinės situacijos kyla, pavyzdžiui, tiekėjo ir vartotojo, pirkėjo ir pardavėjo, banko ir kliento santykiuose. Žaidimų teoriją taip pat galima pritaikyti politikoje, sociologijoje, biologijoje ir kariniame mene.

Iš žaidimų teorijos istorijos

Žaidimų teorijos istorija kaip nepriklausoma disciplina prasideda 1944 m., kai Johnas von Neumannas ir Oscaras Morgensternas išleido knygą „Žaidimų ir ekonominės elgsenos teorija“ („Theory of Games and Economic Behavior“). Nors su žaidimo teorijos pavyzdžiais buvo susidurta ir anksčiau: Babilono Talmudo traktatas apie mirusio vyro turto padalijimą tarp žmonų, kortų žaidimai XVIII amžiuje, šachmatų žaidimo teorijos raida XX amžiaus pradžioje, įrodymas to paties Johno von Neumanno 1928 m. minimax teorema, be kurios nebūtų žaidimo teorijos.

1950-aisiais Melvinas Drescheris ir Meryl Flood iš Rand korporacija Pirmasis, eksperimentiškai pritaikęs kalinio dilemą, Johnas Nashas savo darbe apie pusiausvyros būseną dviejų asmenų žaidimuose sukūrė Nešo pusiausvyros koncepciją.

Reinhardas Saltenas 1965 metais išleido knygą „Oligopoly Processing in Game Theory on Demand“ („Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit“), su kuria žaidimų teorijos taikymas ekonomikoje įgavo naują pagreitį. Žingsnis į priekį žaidimų teorijos raidoje siejamas su John Maynard Smith darbu „Evoliucinė stabili strategija“ („Evolutionary Stable Strategy“, 1974). Kalinio dilema buvo išpopuliarinta 1984 metais išleistoje Roberto Axelrodo knygoje „Bendradarbiavimo evoliucija“. 1994 m. Johnas Nashas, ​​Johnas Harsanyi ir Reinhardas Saltenas buvo apdovanoti Nobelio žaidimų teorijos premija.

Žaidimų teorija gyvenime ir versle

Pagyvenkime plačiau ties konfliktinės situacijos (interesų susidūrimo) esme ta prasme, kaip ji suprantama žaidimų teorijoje, skirta tolesniam įvairių gyvenimo ir verslo situacijų modeliavimui. Tegul asmuo atsiduria tokioje padėtyje, kuri veda prie vieno iš kelių galimų rezultatų, o asmuo turi tam tikrų asmeninių pageidavimų, susijusių su šiais rezultatais. Tačiau nors jis tam tikru mastu gali kontroliuoti kintamus veiksnius, lemiančius rezultatą, jis negali jų visiškai kontroliuoti. Kartais kontrolė yra kelių asmenų rankose, kurie, kaip ir jis, teikia pirmenybę galimiems rezultatams, tačiau apskritai šių asmenų interesai nesutampa. Kitais atvejais galutinis rezultatas gali priklausyti ir nuo nelaimingų atsitikimų (teisės moksluose kartais vadinamų stichinėmis nelaimėmis), ir nuo kitų asmenų. Žaidimų teorija susistemina tokių situacijų stebėjimą ir bendrųjų principų formulavimą, pagal kuriuos būtų galima vadovautis protingais veiksmais tokiose situacijose.

Kai kuriais atžvilgiais pavadinimas „žaidimų teorija“ yra apgailėtinas, nes jis leidžia manyti, kad žaidimų teorija nagrinėja tik socialiai nereikšmingus susidūrimus, kurie įvyksta saloniniuose žaidimuose, tačiau vis tiek ši teorija turi daug platesnę prasmę.

Žemiau pateikta ekonominė situacija gali padėti suprasti žaidimų teorijos taikymą. Tarkime, kad yra keli verslininkai, kurių kiekvienas siekia maksimaliai padidinti pelną, tačiau turi tik ribotą galią kintamiesiems, lemiantiems šį pelną. Verslininkas nekontroliuoja kintamųjų, kuriuos valdo kitas verslininkas, bet kurie gali labai paveikti pirmojo verslininko pajamas. Šios situacijos aiškinimas kaip žaidimas gali sukelti tokį prieštaravimą. Žaidimo modelis daro prielaidą, kad kiekvienas verslininkas pasirenka vieną iš galimų pasirinkimų srities, o pelną lemia šie vieninteliai pasirinkimai. Akivaizdu, kad realiai tai beveik neįmanoma, nes tokiu atveju pramonėje nereikėtų sudėtingų administracinių aparatų. Tiesiog yra nemažai sprendimų ir šių sprendimų modifikacijų, kurios priklauso nuo kitų ekonominės sistemos dalyvių (žaidėjų) pasirinkimų. Bet iš principo galima įsivaizduoti, kad bet kuris administratorius numato visus įmanomus nenumatytus atvejus ir kiekvienu atveju detaliai aprašo veiksmus, kurių reikia imtis, o ne sprendžia kiekvieną užduotį taip, kaip ji iškyla.

Karinis konfliktas pagal apibrėžimą yra interesų susidūrimas, kai nė viena pusė visiškai nekontroliuoja kintamųjų, lemiančių baigtį, o tai nusprendžia daugybė mūšių. Galite tiesiog laikyti rezultatą laimėjimu arba pralaimėjimu ir priskirti jiems skaitines reikšmes 1 ir 0.

Viena iš paprasčiausių konfliktinių situacijų, kurią galima užrašyti ir išspręsti žaidimo teorijoje, yra dvikova, kuri yra konfliktas tarp dviejų žaidėjų 1 ir 2, turinčių atitinkamai p ir qšūvių. Kiekvienam žaidėjui yra funkcija, nurodanti žaidėjo smūgio tikimybę i tuo metu t duos smūgį, kuris bus mirtinas.

Dėl to žaidimų teorija pateikia tokią tam tikros klasės interesų konfliktų formuluotę: yra nžaidėjų, o kiekvienas žaidėjas turi pasirinkti vieną galimybę iš tam tikro 100 rinkinio, o pasirinkdamas žaidėjas neturi jokios informacijos apie kitų žaidėjų pasirinkimus. Žaidėjo galimų pasirinkimų srityje gali būti tokių elementų kaip „pikų tūzo judėjimas“, „gaminti tankus vietoj automobilių“ arba bendra prasme strategija, apibrėžianti visus veiksmus, kurių reikia imtis visomis įmanomomis aplinkybėmis. Kiekvienas žaidėjas susiduria su užduotimi: kokį pasirinkimą jis turėtų pasirinkti, kad jo asmeninė įtaka rezultatui atneštų jam didžiausią įmanomą naudą?

Matematinis modelis žaidimų teorijoje ir problemų formalizavimas

Kaip jau pažymėjome, žaidimas yra matematinis konfliktinės situacijos modelis ir reikalauja šių komponentų:

  1. suinteresuotosios šalys;
  2. galimi veiksmai kiekvienoje pusėje;
  3. šalių interesus.

Žaidimu suinteresuotos šalys vadinamos žaidėjais. , kiekvienas iš jų gali atlikti bent du veiksmus (jei žaidėjas turi tik vieną veiksmą, jis realiai žaidime nedalyvauja, nes iš anksto žinoma, ką jis atliks). Žaidimo rezultatas vadinamas laimėjimu. .

Tikra konfliktinė situacija ne visada, bet žaidimas (žaidimo teorijos sampratoje) - visada - vyksta kartu tam tikras taisykles , kurie tiksliai apibrėžia:

  1. žaidėjo parinktys;
  2. kiek informacijos kiekvienas žaidėjas turi apie partnerio elgesį;
  3. atlygis, kurį atneša kiekvienas veiksmų rinkinys.

Formalizuotų žaidimų pavyzdžiai yra futbolas, kortų žaidimas, šachmatai.

Tačiau ekonomikoje atsiranda žaidėjų elgesio modelis, pavyzdžiui, kai kelios firmos siekia užimti palankesnę vietą rinkoje, keli asmenys bando pasidalyti kokiu nors gėriu (ištekliais, finansais) tarpusavyje, kad visi gautų kuo daugiau. . Konfliktinėse ekonomikos situacijose, kurias galima modeliuoti kaip žaidimą, žaidėjai yra įmonės, bankai, asmenys ir kiti ūkio subjektai. Savo ruožtu karo sąlygomis žaidimo modelis naudojamas, pavyzdžiui, pasirenkant geriausią ginklą (iš esamo ar potencialiai galimo) nugalėti priešą ar apsiginti nuo puolimo.

Žaidimui būdingas rezultato neapibrėžtumas . Neapibrėžtumo priežastis galima suskirstyti į šias grupes:

  1. kombinatorinis (kaip šachmatuose);
  2. atsitiktinių veiksnių įtaka (kaip žaidime „galvos ar uodegos“, kauliukai, kortų žaidimai);
  3. strateginis (žaidėjas nežino, kokių veiksmų imsis priešininkas).

Žaidėjo strategija yra taisyklių rinkinys, kuris nustato jo veiksmus kiekviename žingsnyje, priklausomai nuo situacijos.

Žaidimo teorijos tikslas yra nustatyti optimalią strategiją kiekvienam žaidėjui. Norint nustatyti tokią strategiją, reikia išspręsti žaidimą. Strategijos optimalumas pasiekiamas, kai vienas iš žaidėjų turi gauti didžiausią atlygį, o antrasis laikosi savo strategijos. O antrasis žaidėjas turėtų patirti minimalų nuostolį, jei pirmasis laikysis savo strategijos.

Žaidimo klasifikacija

  1. Klasifikacija pagal žaidėjų skaičių (dviejų ar daugiau asmenų žaidimas). Dviejų asmenų žaidimai yra visos žaidimų teorijos pagrindas. Pagrindinė dviejų asmenų žaidimų teorijos koncepcija yra pačios esminės pusiausvyros idėjos, kuri natūraliai atsiranda dviejų asmenų žaidimuose, apibendrinimas. Kalbant apie žaidimus n asmenų, tada viena žaidimo teorijos dalis skirta žaidimams, kuriuose žaidėjų bendradarbiavimas yra draudžiamas. Kitoje žaidimų teorijos dalyje n asmenų, daroma prielaida, kad žaidėjai gali bendradarbiauti siekdami abipusės naudos (žr. toliau šioje pastraipoje apie nebendradarbiaujančius ir kooperacinius žaidimus).
  2. Klasifikacija pagal žaidėjų skaičių ir jų strategijas (strategijų skaičius yra mažiausiai dvi, gali būti begalybė).
  3. Klasifikavimas pagal informacijos kiekį apie ankstesnius veiksmus: žaidimai su visa informacija ir nepilna informacija. Tebūnie 1 žaidėjas – pirkėjas ir 2 žaidėjas – pardavėjas. Jei 1 žaidėjas neturi visos informacijos apie 2 žaidėjo veiksmus, tada 1 žaidėjas gali neskirti dviejų alternatyvų, kurias jis turi pasirinkti. Pavyzdžiui, renkantis vieną iš dviejų tam tikros prekės rūšių ir nežinant, kad pagal kai kurias savybes produktas A blogiau už prekes B, 1 žaidėjas gali nematyti skirtumo tarp alternatyvų.
  4. Klasifikavimas pagal laimėjimų padalijimo principus : kooperatyvas, koalicija iš vienos pusės ir nebendradarbiaujantis, nebendradarbiaujantis iš kitos pusės. AT nebendradarbiaujantis žaidimas , arba kitaip - nebendradarbiaujantis žaidimas , žaidėjai vienu metu pasirenka strategijas, nežinodami, kurią strategiją pasirinks antrasis žaidėjas. Bendravimas tarp žaidėjų neįmanomas. AT kooperacinis žaidimas , arba kitaip - koalicijos žaidimas , žaidėjai gali sudaryti koalicijas ir imtis kolektyvinių veiksmų, kad padidintų savo laimėjimus.
  5. Dviejų asmenų baigtinės nulinės sumos žaidimas arba antagonistinis žaidimas – tai strateginis žaidimas su visa informacija, kuriame dalyvauja priešingų interesų šalys. Antagonistiniai žaidimai yra matriciniai žaidimai .

Klasikinis žaidimų teorijos pavyzdys yra kalinio dilema.

Abu įtariamieji sulaikyti ir izoliuoti vienas nuo kito. Apygardos prokuroras įsitikinęs, kad jie padarė sunkų nusikaltimą, tačiau neturi pakankamai įrodymų, kad galėtų juos apkaltinti teisme. Kiekvienam kaliniui jis sako, kad turi dvi alternatyvas: prisipažinti padaręs nusikaltimą, kurį, policijos nuomone, jis padarė, arba neprisipažinti. Jei abu neprisipažins, apygardos prokuroras apkaltins juos dėl nedidelio nusikaltimo, pavyzdžiui, smulkios vagystės ar neteisėto ginklo laikymo, ir jie abu gaus nedidelę bausmę. Jei jie abu prisipažins, jiems bus taikomas baudžiamasis persekiojimas, tačiau tam neprireiks griežčiausios bausmės. Jei vienas prisipažins, o kitas neprisipažins, prisipažinusiajam bus sušvelninta bausmė už bendrininko ekstradiciją, o užsispyręs gaus „iki galo“.

Jei ši strateginė užduotis suformuluota kaip išvada, tada ji susiveda į:

Taigi, jei abu kaliniai neprisipažins, jie gaus po 1 metus. Jei abu prisipažins, tada kiekvienas gaus 8 metus. O jei vienas prisipažins, kitas neprisipažins, tai tas, kuris prisipažįsta, išeis su trimis mėnesiais kalėjimo, o kas neprisipažins – 10 metų. Aukščiau pateikta matrica teisingai atspindi kalinio dilemą: kiekvienas susiduria su klausimu, prisipažinti ar neprisipažinti. Žaidimas, kurį apygardos prokuroras siūlo kaliniams nebendradarbiaujantis žaidimas arba kitaip - ne koalicijos žaidimas . Jei abu kaliniai galėtų bendradarbiauti (t.y. žaidimas būtų bendradarbiaujantis arba kitaip koalicijos žaidimas ), tada abu neprisipažintų ir gavo po metus kalėjimo.

Žaidimų teorijos matematinių priemonių panaudojimo pavyzdžiai

Dabar mes kreipiamės į bendrų žaidimų klasių, kurioms yra žaidimų teorijos tyrimo ir sprendimo metodai, pavyzdžius.

Nebendradarbiaujančio (nebendradarbiaujančio) dviejų asmenų žaidimo įforminimo pavyzdys

Ankstesnėje pastraipoje jau nagrinėjome nebendradarbiaujančio (nebendradarbiaujančio) žaidimo pavyzdį (kalinio dilema). Stiprinkime savo įgūdžius. Tam tinka ir klasikinis siužetas, įkvėptas Arthuro Conano Doyle'o „Šerloko Holmso nuotykių“. Žinoma, galima prieštarauti: pavyzdys ne iš gyvenimo, o iš literatūros, tačiau Conanas Doyle'as neįsitvirtino kaip mokslinės fantastikos rašytojas! Klasika dar ir dėl to, kad užduotį atliko Oskaras Morgensternas, kaip jau nustatėme – vienas žaidimų teorijos pradininkų.

1 pavyzdys Bus pateikta sutrumpinta ištrauka iš vieno iš Šerloko Holmso nuotykių. Pagal gerai žinomas žaidimo teorijos sampratas sukurkite konfliktinės situacijos modelį ir formaliai užsirašykite žaidimą.

Šerlokas Holmsas ketina iš Londono vykti į Doverį, turėdamas tolimesnį tikslą – patekti į žemyną (Europą), kad pabėgtų nuo jį persekiojančio profesoriaus Moriarty. Įlipęs į traukinį, stoties perone pamatė profesorių Moriartį. Šerlokas Holmsas pripažįsta, kad Moriarty gali pasirinkti specialų traukinį ir jį aplenkti. Šerlokas Holmsas turi dvi alternatyvas: toliau važiuoti į Doverį arba išlipti Kenterberio stotyje, kuri yra vienintelė tarpinė stotis jo maršrute. Manome, kad jo priešininkas yra pakankamai protingas, kad nustatytų Holmso galimybes, todėl jis turi tas pačias dvi alternatyvas. Abu priešininkai turi pasirinkti stotį, kurioje išlips iš traukinio, nežinodami, kokį sprendimą priims kiekvienas iš jų. Jei dėl šio sprendimo abu atsidurs toje pačioje stotyje, tuomet tikrai galime manyti, kad profesorius Moriarty nužudys Šerloką Holmsą. Jei Šerlokas Holmsas saugiai pateks į Doverį, jis bus išgelbėtas.

Sprendimas. Conano Doyle'o herojai gali būti laikomi žaidimo dalyviais, tai yra žaidėjais. Kiekvieno žaidėjo žinioje i (i=1,2) dvi grynos strategijos:

  • išlipkite Doveryje (strategija si1 ( i=1,2) );
  • išlipkite tarpinėje stotyje (strategija si2 ( i=1,2) )

Priklausomai nuo to, kurią iš dviejų strategijų pasirinks kiekvienas iš dviejų žaidėjų, bus sukurtas specialus strategijų derinys kaip pora. s = (s1 , s 2 ) .

Kiekvienas derinys gali būti siejamas su įvykiu – profesoriaus Moriarty bandymo nužudyti Šerloką Holmsą baigtimi. Sudarome šio žaidimo matricą su galimais įvykiais.

Po kiekvienu įvykiu nurodomas indeksas, reiškiantis profesoriaus Moriarty įsigijimą, ir apskaičiuojamas atsižvelgiant į Holmso išgelbėjimą. Abu herojai vienu metu pasirenka strategiją, nežinodami, ką pasirinks priešininkas. Taigi žaidimas yra nebendradarbiaujantis, nes, pirma, žaidėjai yra skirtinguose traukiniuose, antra, jų interesai yra priešingi.

Kooperacinio (koalicinio) žaidimo įforminimo ir sprendimo pavyzdys n asmenų

Šioje vietoje prieš praktinę dalį, tai yra pavyzdinio uždavinio sprendimo eigą, eis teorinė dalis, kurioje susipažinsime su žaidimų teorijos sąvokomis sprendžiant kooperatyvinius (nesakooperacinius) žaidimus. Šiai užduočiai žaidimų teorija siūlo:

  • būdinga funkcija (paprasčiau tariant, ji atspindi žaidėjų sujungimo į koaliciją naudos vertę);
  • adityvumo sąvoka (dydžių savybė, susidedanti iš to, kad viso objekto dydžio vertė yra lygi dydžių, atitinkančių jo dalis, verčių sumai tam tikroje objekto padalijimo klasėje į dalis) ir būdingos funkcijos superaddityvumas (visą objektą atitinkančio kiekio vertė yra didesnė už dydžių, atitinkančių jo dalis, reikšmių sumą).

Charakteristinės funkcijos superaddityvumas rodo, kad koalicijos yra naudingos žaidėjams, nes tokiu atveju koalicijos atsipirkimas didėja didėjant žaidėjų skaičiui.

Norėdami formalizuoti žaidimą, turime įvesti formalų aukščiau pateiktų sąvokų žymėjimą.

Žaidimui n visų jos žaidėjų aibę žymi kaip N= (1,2,...,n) Bet koks netuščias aibės poaibis Nžymimas kaip T(įskaitant save N ir visi poaibiai, susidedantys iš vieno elemento). Svetainėje vyksta veikla Aibės ir operacijos su aibėmis, kuris atsidaro naujame lange paspaudus nuorodą.

Būdinga funkcija žymima kaip v o jo apibrėžimo sritis susideda iš galimų aibės poaibių N. v(T) – tam tikram poaibiui būdingos funkcijos reikšmė, pavyzdžiui, koalicijos, įskaitant, galbūt, iš vieno žaidėjo, gautos pajamos. Tai svarbu, nes žaidimų teorija reikalauja patikrinti, ar nėra visų nesutampančių koalicijų būdingos funkcijos verčių superadityvumo.

Dviem netuščioms poaibių koalicijoms T1 ir T2 kooperacinio (koalicinio) žaidimo būdingos funkcijos adityvumas rašomas taip:

O superaddityvumas yra toks:

2 pavyzdys Trys muzikos mokyklos auklėtiniai skirtinguose būreliuose papildomai užsidirba, pajamas gauna iš klubo lankytojų. Nustatykite, ar jiems apsimoka suvienyti jėgas (jei taip, kokiomis sąlygomis), naudojant žaidimų teorijos sąvokas sprendžiant kooperacinius žaidimus n asmenų, su tokiais pradiniais duomenimis.

Vidutinės jų pajamos per vakarą buvo:

  • smuikininkas turi 600 vnt.;
  • gitaristas turi 700 vienetų;
  • dainininkė turi 900 vnt.

Siekdami padidinti pajamas, studentai kelis mėnesius kūrė įvairias grupes. Rezultatai parodė, kad susijungę jie galėtų padidinti vakarines pajamas taip:

  • smuikininkas + gitaristas uždirbo 1500 vnt.;
  • smuikininkas + dainininkas uždirbo 1800 vnt.;
  • gitaristas + dainininkas uždirbo 1900 vienetų;
  • smuikininkas + gitaristas + dainininkas uždirbo 3000 vnt.

Sprendimas. Šiame pavyzdyje – žaidimo dalyvių skaičius n= 3 , todėl žaidimui būdingos funkcijos sritį sudaro 2³ = 8 galimi visų žaidėjų aibės poaibiai. Išvardinkime visas galimas koalicijas T:

  • vieno elemento koalicijos, kurių kiekvieną sudaro vienas žaidėjas – muzikantas: T{1} , T{2} , T{3} ;
  • dviejų elementų koalicijos: T{1,2} , T{1,3} , T{2,3} ;
  • trijų elementų koalicija: T{1,2,3} .

Kiekvienam žaidėjui suteikiame serijos numerį:

  • smuikininkas - 1-as grotuvas;
  • gitaristas - 2 grotuvas;
  • dainininkas yra 3 žaidėjas.

Pagal problemos duomenis nustatome būdingą žaidimo funkciją v:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; šios būdingos funkcijos reikšmės nustatomos pagal pirmojo, antrojo ir trečiojo žaidėjo išmokas, atitinkamai, kai jie nėra susivieniję į koalicijas;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; šias būdingos funkcijos reikšmes lemia kiekvienos žaidėjų poros, susijungusios į koalicijas, pajamos;

v(T(1,2,3)) = 3000 ; šią charakteristikos funkcijos reikšmę lemia vidutinės pajamos tuo atveju, kai žaidėjai buvo sujungti į trejetus.

Taigi, mes išvardijome visas galimas žaidėjų koalicijas, jų, kaip ir turėtų būti, yra aštuonios, nes būdingos žaidimo funkcijos apibrėžimo sritį sudaro lygiai aštuoni galimi visų žaidėjų rinkinio poaibiai. To reikalauja žaidimų teorija, nes turime patikrinti, ar nėra visų nesutampančių koalicijų būdingos funkcijos vertės superadityvumo.

Kaip šiame pavyzdyje įvykdytos superadityvumo sąlygos? Apibrėžkime, kaip žaidėjai sudaro nesutampančius koalicijas T1 ir T2 . Jei kai kurie žaidėjai yra koalicijoje T1 , tada visi kiti žaidėjai yra koalicijoje T2 ir pagal apibrėžimą ši koalicija formuojama kaip skirtumas tarp viso žaidėjų rinkinio ir rinkinio T1 . Tada jei T1 – vieno žaidėjo koalicija, vėliau – koalicijoje T2 bus antras ir trečias žaidėjai, jei koalicijoje T1 bus pirmasis ir trečias žaidėjai, tada koalicija T2 sudarys tik antrasis žaidėjas ir pan.

Žmogui, kuris nėra politikos ekspertas, Bruce'as Bueno de Mesquita iš Niujorko universiteto pateikia nepaprastai tikslius įvykius. Jam pavyko kelių mėnesių tikslumu nuspėti Pereverzo Musharrafo pasitraukimą iš savo postų. Jis tiksliai įvardijo ajatolos Khomeini įpėdinį Irano vadovu likus 5 metams iki jo mirties. Paklaustas, kokia yra paslaptis, jis atsako, kad atsakymo nežino – žaidimas jį pažįsta. Žaidimas čia reiškia matematinį metodą, kuris iš pradžių buvo sukurtas įvairių žaidimų strategijoms formuoti ir analizuoti, būtent žaidimų teorijai. Ekonomikoje jis naudojamas dažniausiai. Nors iš pradžių jis buvo skirtas pramogoms naudojamų žaidimų strategijoms kurti ir analizuoti.

Žaidimo teorija – tai skaitmeninis aparatas, leidžiantis apskaičiuoti scenarijų, o tiksliau, įvairių scenarijų tikimybę, kad sistema ar „žaidimas“ elgsis įvairiais veiksniais. Šiuos veiksnius savo ruožtu lemia tam tikras „žaidėjų“ skaičius.

Taigi žaidimų teorija, gavusi pagrindinį impulsą ekonomikos plėtrai, gali būti taikoma įvairiose žmogaus veiklos srityse. Dar anksti teigti, kad šios programos bus naudojamos kariniams konfliktams spręsti, tačiau ateityje tai gana realu.