Алексей Савватеев про теорию игр, часть 1

Новые | Популярные | Goblin News | В цепких лапах | Властелин колёс | Вопросы и ответы | Гоблин и танки | Каба40к | Книги | Коротко про | Опергеймер | Под ковром | Путешествия | Разведопрос - Наука и техника | Репортажи с мест | Семья Сопрано | Сериал Breaking Bad | Сериал Рим | Синий Фил | Смешное | Солженицынские чтения | Трейлеры | Это ПЕАР | Персоналии | Разное | Каталог

27.03.19



Вконтакте
Одноклассники
Telegram


Сергей Ивановский. Всем добрый день! Мы продолжаем научную тематику на канале Дмитрию Пучкова, в гостях у нас Алексей Савватеев.

Алексей Савватеев. Привет всем!

Сергей Ивановский. Леха, здорово!

Алексей Савватеев. Здорово! Спасибо, что снова позвали.

Сергей Ивановский. Долго ждали.

Алексей Савватеев. И вот я снова здесь.

Сергей Ивановский. Давай мы начнем с теории игр. Я знаю, что ты специалист по теории игр. Что это такое? У меня в голове стойкая ассоциация, что теория игр каким-то образом связана с теорией вероятности. То есть, игра, вероятностные процессы, выкидывание кубиков, число сочетаний, число перемещений. Что-то, что может в игре быть случайным. В моей голове стойкая ассоциация с вероятностью. Насколько я понимаю, это не совсем так.

Алексей Савватеев. Пожалуй, это совсем так в некоторых исключительных ситуациях, связанных с игрой в кубики, в кости, в “Монополию“. Если в игре в карты вероятность входит в игру, когда ты их раздаешь. Потом начинается анализ ситуации. Есть ли потом вероятность, мы об этом еще поговорим. Есть два вида вероятностей, которые связаны с теорией игр. Теория игр – это то, как люди друг с другом взаимодействуют, достигая, возможно, противоположных, иногда не полностью противоположных, но не обязательно сонаправленных целей. То есть, у людей есть какие-то цели, которых они должны достичь. При этом им надо будет вовлечься в некое взаимодействие. Мы с тобой идем в переход в метро, я пою, ты играешь на гитаре. Или я играю на гитаре и пою, а ты барабанишь. Нам с тобой до фига кидают денег. Реально до фига. Я говорю: “Ну, чего? Пополам?” И ты говоришь: “Пополам”. Мы нормальные пацаны, мы поделили все пополам. В этой ситуации теория игр не нужна. Теперь представь, что мы не очень нормальные пацаны. Я какой-нибудь раскрученный певец. И я говорю: “Не пополам, парень. Мне 80 процентов, тебе 20”. Ты говоришь: “Почему именно такие цифры? Я согласен, что не пополам. Ты раскрученный, а я нет. Но почему не 60 и 40?” Кто этим управляет? Какие должны быть цифры? Об этом кооперативная теория игр. Что мы делаем? Я сажусь в один переход, ты в другой. Допустим, нам кидают 100 рублей в час, кода мы вдвоем играем. Я говорю: “Тебе 20, а мне 80”. Ты говоришь: “Нет. Я вас очень уважаю, но мне 40, а вам 60”. Я говорю: “Хорошо. Садись в тот переход, я сажусь в этот”. Я начинаю играть и петь, ты начинаешь барабанить. Мы это делаем отдельно. Ты приходишь со своей шляпой с деньгами, я прихожу со своей шляпой с деньгами. Как-то делаем так, чтобы было видно, что никто не смухлевал, это очень важный момент. Вначале ты барабанишь, я смотрю, сколько кидают. Потом наоборот. Потом мы сравниваем две шляпы. В одной шляпе лежит 50 рублей. Это в моей. А в другой шляпе лежит 30 рублей. Это в твоей. Как мы тогда будем делить? Давай я начну с того, что здесь много разных методов. Но в данной конкретной ситуации они всегда приводят к одному и тому же. Мы излишек делим пополам.

Сергей Ивановский. Нам же нужно понять пропорциональность.

Алексей Савватеев. Это немножко другой подход.

Сергей Ивановский. Ты мне назначил 20 процентов, а я хочу 40. И вот мы узнаем заработал ли я 40.

Алексей Савватеев. Это подход другой. Раз 50 к 30, в той же пропорции, 5 к 3, поделим исходные 100. Это минимальные условия. В коалиционной теории игр есть такое понятие “дележ”. Давай просто напишу. Вот мы зарабатываем 100 и нужно, чтобы сколько-то получил ты и сколько-то получил я. Из чего мы исходим? Мы исходим из эксперимента. О том, что ты можешь получить некоторую гарантированную величину “Ux”, а я некоторую гарантированную величину “Uy“. И она оказалась в этом случае равна... Здесь ты, у тебя 30. Здесь я, у меня 50. Мы можем работать отдельно, тогда мы получим столько. Дележом называется любая комбинация X и Y с таким свойством. То есть, любая пара X и Y в сумме дающая 100. Но при этом теории игр накладывается требование, которое называется “индивидуальная рациональность”. Это значит, что уж по крайней мере X больше или равно 30, а Y больше или равно 50. Иначе кто-то из нас откажется работать со вторым. Возникает пространство дележей с разными пропорциями выигрыша для нас с тобой. И здесь совершенно неочевидно, что выбрать. Л. Шепли предложил метод дележа, который заключается в следующем: “Давай посмотрим два порядка, в которых можно нас с тобой упорядочить. Вначале пришел я, я играю на гитаре и пою. И тогда мне побросали 50”.

Сергей Ивановский. Почему 50?

Алексей Савватеев. Я пока играл час, мне 50 рублей накидали. Потом присоединился ко мне ты. Вначале я, потом ты, а можно было бы наоборот сделать. Если вначале появился я, а потом ты, мне бросили 50. А в следующий час нам накидали 100. Ты мне привнес, как бы, еще 50. Сначала я сам 50 заработал, потом вдвоем с тобой заработал 100. Теперь давай в другом порядке запустим. Ты приходишь, тебе 30. Прихожу я и добавляю к твоим еще 70.

Сергей Ивановский. Почему 70?

Алексей Савватеев. Потому, что ты один “настукивал” 30, а в следующий час мы вдвоем “настукиваем“ 100. Я привнес своим приходом 70. Но здесь важно именно то, что я пришел второй. Поэтому здесь я привнес больше, чем здесь. Теперь мы суммируем это все. И говорим, что здесь 120, а здесь 80.

Сергей Ивановский. Почему в правой верхней клеточке нельзя было написать 70? И та, и та ситуация, когда мы играем с тобой вместе... Или это связано с начальными условиями?

Алексей Савватеев. Это ты барабанишь.

Сергей Ивановский. Я набарабанил в компании с тобой на 50. Почему я в компании с тобой не могу набарабанить 70? Это же, по сути, игра слов. Я с тобой барабаню или ты со мной барабанишь.

Алексей Савватеев. Да, это игра слов. Вначале я один пел, мне кидали 50.

Сергей Ивановский. Почему не 70?

Алексей Савватеев. Мне кидали 50, мы это видели. Это же чистый эксперимент. Это мы поодиночке столько можем зарабатывать. А вместе нам кидают больше, чем сумма, мы хотим понять, как разделить излишек. За час мне кидают столько, если вместе, то столько. Вместе нам 100 кидают. Но если ты вначале барабанил, кажется, что ты зарабатывал 30, а я тебе добавил 70. Честно сделать – просто поделить поровну. То, что у нас получилось, в такой ситуации так, а в такой так, значит, в среднем я должен получить так, а ты так. Значит, ты был прав. Тебе нужно 40, а мне 60. А мои 80 и 20, это я придумал из головы и был неправ. С точки зрения Шепли. По процентному соотношению было бы немножко иначе. Процентное соотношение очень сложно реализовать, если нас трое. Предположим, что нам вместе кидают какую-то сумму. Как тогда ее распределить? Тут придется привлекать не только сколько из нас кто получает отдельно, а еще то, сколько может получить пара человек. X с Y, они вместе. Три человека. Савватеев тут, Ивановский и тут еще Гоблин, например. Нам неплохо, кстати, бросают, 200 рублей в час. Нам нужно понять как между собой их разделить. И возникает вопрос не только сколько кидают каждому из на по отдельности, но сколько кидают каждой паре. Если мы с тобой барабаним, это 100. Если мы с Гоблином поем или ты с ним барабанишь... В каждой из таких компаний получается некоторая величина. И она будет учтена при таком подходе. Такой подход называется “подход вектора Шепли“. Я шестью разными способами упорядочу нашу компанию и в каждом случае посмотрю, сколько добавляет каждый следующий к тому, что умеет зарабатывать предыдущий. И все усредню делением на 6. Это называется кооперативная теория игр, это называется “решение Шепли“.

Но самое интересное... Не менее интересное, это некооперативная теория игр. Здесь никаких вероятностей, шансов нет. Здесь нет стратегии, которую мы могли бы использовать. Мы только между собой договариваемся исходя из каких-то соображений, которые мы формально ввели. В некооперативной теории игр у нас есть стратегии, которыми мы можем пользоваться. Допустим, в этой ситуации я мог бы принести гитару, балалайку или что-то в этом духе. Мы бы могли бы петь те или иные песни. Один из нас при этом какие-то речи толкать. Выигрыши бы как-то менялись. И если мы знаем правила деления между собой этих выигрышей, то возникает у меня стимул использовать те или иные стратегии. Это типичная ситуация стратегического взаимодействия. Если мы в него вовлечены, вопрос: “А что мы называем решением тогда?”

Сергей Ивановский. Давай, может быть, сразу мы определим, что мы называем решениями?

Алексей Савватеев. Решением в некооперативной ситуации мы называем набор стратегий. Моя, твоя и всех остальных участников взаимодействия. Который удовлетворяет некоторым требованиям. Требованиям нашего собственного рационального поведения.

Сергей Ивановский. Вот Игорь Леонардович Викентьев занимается жизненными стратегиями творческих личностей. Это тоже определенная стратегия поведения и мы можем говорить о решениях в жизненных стратегиях?

Алексей Савватеев. Ну, можем, наверное, иногда. У меня тоже есть набор сюжетов. Вот, например, загадка всем. Я отсюда поеду в Великий Новгород выступать. Мне из Великого Новгорода берут билет до Москвы. Я прошу билет до Владимира. Почему я из Великого Новгорода попросил купить билет во Владимир, а не в Москву? Поезд интересный: “Великий Новгород – Нижний Новгород”. Он проходит через Москву, идет во Владимир и туда. С какого-то рожна я попросил взять мне билет не до Москвы, а до Владимира? Это задача по теории игр.

Сергей Ивановский. Я пока не понимаю. Я понимаю, что у тебя есть какая-то мотивация поехать туда.

Алексей Савватеев. Да, за одним исключением. Я туда не поеду, я выйду в Москве. Это подсказка. Почему я выйду в Москве? Зачем мне было брать билет до Владимира, если я выхожу в Москве? Ответ. Москва в 5 утра с лишним. Если я возьму билет до Москвы, меня разбудят в 3 часа 30 минут, как у нас любят в поездах делать. Если я возьму билет до Владимира, меня никто до Москвы не разбудит. Я собираюсь за одну минуту. То есть, я предсказываю действия других людей. Кого? Проводницы. Я знаю, что если у нее записано, что у меня билет до Владимира, она меня не будет будить в Москве. По собственному горькому опыту я знаю, что договориться об этом абсолютно невозможно. Сказать: “Не будите, я точно встану и выйду”. - “Нет, нам обязательно надо это сделать. Если вы не выйдете по моей вине, меня уволят с работы”. Проще взять практически за ту же стоимость... В данном случае мне оплачивают. Разница билета “Великий Новгород - Владимир” и “Великий Новгород - Москва”, наверное, меньше, чем стоит один чай в столовой. Зато у нее уже записан Владимир и она уже знает, что меня будить не надо, она ко мне не подойдет. А в 5 часов утра эти полтора часа очень многое значат.

Сергей Ивановский. Давай еще раз вернемся к задачке, которая у нас была. Я попытался задать вопрос. Видимо, не очень корректно. У нас есть некие начальные условия, при которых мы говорим, что два человека зарабатывают 100. Я отдельно зарабатываю 30, ты отдельно зарабатываешь 50. Но вдвоем мы зарабатываем 100. Это некие ограничения. В результате этого мы на доске написали две цифры. Когда я играю один и ты ко мне приходишь, ты мне добавляешь 70. А когда я прихожу к тебе, я тебе добавляю 50. Но это чисто вероятностный процесс. Мы добавили либо 70, либо 50, исходя только из наших начальных условий. Если мы введем сюда вероятность... Потому, что если мы возьмем тебя в твоем переходе, меня в моем переходе, то нам могут добавить 50 и 70, а могут и не добавить.

Алексей Савватеев. И вообще эти 100 были усредненные. Иногда нам кидали 150, иногда нам кидали 30 за час.

Сергей Ивановский. Давай, может быть, мы эту задачку развернем. Можем?

Алексей Савватеев. Можем, но реально все сведется к подсчету средних значений. Мы должны что сделать? Мы должны понять, сколько в среднем ты привносишь мне, когда присоединяешься ко мне. Другая информация, это мне нужно знать сколько в среднем я привношу к тебе, если я присоединяюсь к тебе.

Сергей Ивановский. Если мы с точки зрения физического эксперимента как бы добавляемся. Ты один играешь, я добавляюсь, люди это со стороны видят. А если мы возьмем попросту. Мы будем рассматривать ситуацию не добавления, а просто игры.

Алексей Савватеев. Грубо говоря, мы не получим той информации, которую мы могли бы использовать для определения кто сколько должен получить.

Сергей Ивановский. Получается, что факт присоединения одного музыканта к другому накладывает ограничение на то, сколько им накидают?

Алексей Савватеев. Факт того, кто к кому присоединился, накладывает ограничение на то, кому... Кто кому важен и полезен. Насколько кто кому важен и полезен. Если я начинал, а ты ко мне пришел, мне кажется, что мы важны друг другу наполовину. Но если ты начинал, а я к тебе пришел, тебе кажется, что я важней на 70 процентов против 30 процентов, чем ты. Получается, что нам важно в среднем понять, сколько бы ты привнес мне дополнительно. И сколько бы я привнес тебе. Но так как нас всего двое мы считаем, что с равной вероятностью происходит такая комбинация выигрышей и такая комбинация выигрышей. Поэтому мы усредняем.

Сергей Ивановский. Я понял. Хорошо. Давай тогда перейдем к более простой игре. Монетка.

Алексей Савватеев. К некооперативной. Я хотел как раз рассказать. Перед этим я загадаю еще одну загадку. Чуть-чуть более сложную. А разгадка будет после того, как мы разберем монету. Ситуация тоже из собственной жизни. Год назад я ехал в Тюмень с лекциями. Ехал из Галича потому, что до этого была школа Райгородского. Я оттуда ехал в Тюмень. Поезд, который утром из Галича выходит, днем следующего дня приходит в Тюмень. Я прикинул, решил поехать на поезде. Я сказал приглашающей стороне, Школе прикладных исследований, что я поеду поездом, пусть они мне возьмут билет. Дальше я делаю некие манипуляции в интернете, указываю вагон и прошу взять мне двадцатое место в нем. Они пишут: “Алексей Владимирович, а что вы так скромно? Давайте нижнее, вам будет комфортнее ехать. Зачем вы берете верхнее место?” - “Дайте мне, пожалуйста, верхнее место”. И беру верхнее место.

Сергей Ивановский. То есть, это связано, видимо, с твоими взаимоотношениями либо с людьми в купе, либо с той же проводницей?

Алексей Савватеев. Здесь чуть-чуть сложнее. Нужно предсказывать поведение других людей. Я сейчас дам маленький намек, а потом мы перейдем к монетке. А потом я все объясню. Я предсказываю поведение тех, кто вместе со мной берет билеты в этот же поезд в тот же вагон.

Сергей Ивановский. А какая тебе разница как они берут билеты?

Алексей Савватеев. Я открою секрет потом. Теперь переходим к монетке. Мы играем с тобой. Ты от меня скрываешь монетку либо “орлом“, либо “решкой“. Ты не бросаешь ее. Ты решаешь как зажать. Теперь я должен угадать. Я говорю: “Орел”. Ты открываешь: “Решка”. Ничего не происходит. А вот если я угадываю, то происходит интересное. Если я угадал и там “решка”, то ты мне проставляешь одну бутылку кефира. А если там был “орел”, то две бутылки кефира.

Сергей Ивановский. За “орла” платят больше.

Алексей Савватеев. Вдвое. Вопрос: “За сколько я готов купить билет на один такой сеанс?”

Сергей Ивановский. Честно говоря, я знаю правильный ответ. Поэтому лукавить не буду.

Алексей Савватеев. Оказывается все не так просто. Есть такое выражение: “В действительности все не так, как на самом деле”. Очевидный вариант будет такой. Все будет 50 на 50. И я буду предсказывать “орел” или “решку” 50 на 50, и ты зажимать, подбрасывая. Процесс принятия мною решений будет какой? Я тоже подбрасываю монетку, кем легла, то и пытаюсь угадать.

Сергей Ивановский. Мы можем вдвоем подбрасывать монетку. Совпало – хорошо.

Алексей Савватеев. Тебе хорошо, если не совпало, ты ничего не теряешь. Здесь и здесь ты теряешь. Если “решка” совпала, ты теряешь бутылку кефира, а если это, то две бутылки кефира. У нас будет с вероятностью одна четверть каждый из этих исходов. С одной четвертью я получу единицу. С вероятностью одна четверть я получу два. С вероятностью одна вторая я ничего не получу. Но это три четверти. Верно ли, что три четверти это правильная цена за эту лотерею? Нет, не верно. Я готов продавать тебе ее за три четверти. И сам зажимать монету. И я утверждаю, что на очень долгом горизонте игры... Далеко не сразу, но когда мы сыграем раз сто, ты начнешь понимать, что тебя накололи. Ты заплатил в среднем три четверти. А выигрываешь меньше, чем три четверти. В чем же загадка? На самом деле, играя в эту игру, я буду использовать стратегии назвать “орел” или “решка”, не подкидывая монету, а некоторым другим образом. В ответе на вопрос “каким образом я это делаю?” лежит разгадка что такое теория игр, чем она занимается.

Сергей Ивановский. Играющий человек, который зажимает монетку, у него должен быть некий способ комбинаций “орла” либо “решки”?

Алексей Савватеев. Чем он управляет, что такое стратегия. Если я говорю, что я их зажимаю не с равными шансами, значит, наверное, есть какой-то перекос с моей стороны куда-то. В сторону “орла” или в сторону “решки”. Если этот перекос есть, он не тотальный. Если я все время буду зажимать решку, желая не проигрывать никогда, ты будешь говорить “решка” будешь получать рубль, больше, чем три четверти, которые ты заплатил. Но если я все время буду зажимать “орла”, это совсем глупо. Значит, что-то я делаю. Ни одна вторая, ни один, ни ноль. Это неверные оценки вероятности шансов, что я зажал “решку“. Теория игр говорит: “Вы найдите это математически”. Доля случаев, в которых я зажму “решку”, я буду математически вычислять. Вопрос: “Как я могу это вычислить?” Предположим, что ты со мной играешь давно. Тогда мы считаем что это “P“, которое мы ищем, ты на самом деле постепенно нащупаешь. Ты сможешь понять примерно с какой частотой это происходит. Какой твой ответ будет наиболее выгодным для тебя, если “P” равно вероятности “решки”. Вот ты пытаешься угадать либо “орла”, либо “решку”. Если ты знаешь, что с вероятностью “P” у меня здесь “решка”, и говоришь: “Решка”. В каком проценте случаев ты выиграешь и сколько?

Сергей Ивановский. Не могу сказать.

Алексей Савватеев. Вероятность равна “P”, значит, в “P” процентах. Что если ты будешь называть “орел” всегда? Сколько тогда ты выиграешь в среднем? Ты выигрываешь на “орле” вместо единицы двойку. Правильно? Но это случается во всех остальных случаях. Что же больше, “P” или эта величина?

Сергей Ивановский. Возьми разницу и узнаешь.

Алексей Савватеев. Конечно, надо посмотреть. Если “P” равно два минус два “P”, “P” равно две трети. Я утверждаю, что это математически точный прогноз. Конечно, в жизни трудно представить себе, чтобы выпадало ровно в двух из трех случаев. Я утверждаю, что математическая идеальная формализация этой игры приведет к тому, что я буду зажимать “решку” в двух третях случаев. “Орел” в одной трети. Объяснение состоит в следующем. Предположим, что наш прогноз другой. Если наш прогноз вот такой, то ты все время называешь “решку”. Я так часто ее зажимаю, что ты больше... Лучше тебе попытаться получить этот рубль, это гораздо чаще происходит, чем получение двух, если ты угадываешь “орла”. Но если ты все время называешь “решку”, должно быть совершенно очевидно, что это несовместимо с равновесием. Я же тоже начинаю угадывать это. Я хочу объяснить, что такое равновесие. Для того, чтобы объяснить, я привожу пример поиска его. Потому, что иначе объяснить совершенно невозможно. Если “P” больше две трети, то ты все время будешь, в качестве оптимальной стратегии своего собственного поведения, всегда называть “решку”. Но такого предсказания в равновесии быть не может. Если так, то я все время буду зажимать “орлом”. Получается, что если бы “P” было больше двух третей, то “P” было бы равно нулю. Логическое противоречие. Хорошо. А что если “P” меньше двух третей? Тогда ты все время что будешь делать? Называть “орел”. Почему? Потому, что выигрыш вот этот, два на один минус “P”, он перевешивает. Но это опять несовместимо с равновесием. Потому, что если ты все время называешь “орел”, то я называю “решку”. Теория игр, она вся здесь.

Сергей Ивановский. Имеется в виду больше либо меньше двух третей, но не сто процентов. Я зажимаю “решку” не в ста процентах случаев, а чаще, максимально часто.

Алексей Савватеев. Да. Достаточно чуть-чуть больше двух третей, чтобы тебе было выгодно вот это. Потому, что “P” больше, чем это.

Сергей Ивановский. Почему тогда “P” равно нулю?

Алексей Савватеев. Потому, что если ты называешь “решку”, я же тоже хочу не проиграть много, я начинаю зажимать “орла”.

Сергей Ивановский. Эта ситуация, в которой я зажимаю только “решку”. Из десяти один раз я все равно зажму “орла”.

Алексей Савватеев. Все равно ответ будет: “P” равно нулю. Если ты почти всегда зажимаешь “решку”, мой ответ зажимать “орла”.

Сергей Ивановский. Десять случаев. В девяти случаях я зажал “решку”, ты зажал “орла”, и “P” равно нулю. Но в десятом случае взял я и разбавил “орлом”.

Алексей Савватеев. Если мы я все эти случаи зажимал “решку”, я бы гораздо больше проиграл. Получается, что наш прогноз такой: каждый из нас должен выбрать стратегию, несущую максимально допустимый выигрыш. И если “P” отлично от двух третей хотя бы в одну сторону, неважно в какую, в большую или в меньшую, это несовместимо с равновесием. Потому, что один из нас начинает действовать предсказуемо, всегда делая то-то или то-то. И второй, в ответ на эту предсказуемость, делает совершенно противоположное тому, что мы до этого предположили. Поэтому единственный прогноз равновесия равен две трети. Мой прогноз действий такой. Но и твой тоже такой. Потому, что если ты чаще пытаешься угадывать “решку”, чем в двух третях случаев, то мне выгоднее зажимать “орла”. И это опять будет несовместимо с равновесием. Потому, что тогда ты будешь пытаться угадывать “орла”.

Сергей Ивановский. Вот у нас ручка, я прячу колпачок. Я должен выбрать стратегию. Либо правая рука, либо левая рука. Я изначально начинаю выбирать стратегию, что я ее прячу в правой руке. Чтобы следовать этой штуке, я должен примерно прикинуть количество итераций которое у нас будет длиться игра и выбрать две трети раз на правую руку. Тогда я буду в потенциальном выигрыше?

Алексей Савватеев. Последняя фраза неверна, до этого все правильно. И тогда... Что будет тогда? Мы еще не обсудили, что будет если действительно это две трети. Предположим, что ты две трети случаев зажимаешь “решку”, одна треть “орел”. Что я тогда думаю? Мне все равно, что говорить. Если я говорю “орел”, я в одной трети случаев выиграю, но два рубля. Если говорю “решка”, я в двух третях случаев выиграю, но один рубль. А если мне все равно, я готов смешивать свои стратегии поведения. Вероятность здесь не такая, как при карточных сдачах. Когда карта как-то легла и это вопрос вероятности. В данном случае вероятность проистекает из теории игр. Оказывается наш прогноз на такую простую игру, как орлянка состоит в том, что мы оба должны пользоваться вероятностными стратегиями поведения. Причем с точно определенными вероятностями. И никакой другой прогноз не является совместимым с концепцией равновесия. Мне, наконец, нужно сказать, что такое концепция равновесия. Концепция равновесия в некооперативной теории игр заключается в том, что каждый из игроков каким-то образом смог узнать, что делают другие. И это знание не повлияло на его поведение. К нему пришел гномик и сказал: “Этот будет так действовать. Этот так. Этот в 70 процентах так, в 30 так. Ты понял?” - “Понял”. - “Теперь ты сможешь их больше обыграть, чем сейчас ты обыгрываешь?” - “Нет. Та стратегия, которую я выбрал, она и так оптимальная из всех моих стратегий в ответ ровно на такие, какие ты мне продиктовал”.

Сергей Ивановский. Что бы они ни делали...

Алексей Савватеев. Если зафиксировать их поведение, то я использую стратегию, которая приносит мне максимальный выигрыш в ответ на их действия. Наши орлянки. Ко мне приходит гномик и говорит: “Серега зажимает в двух третях случаев “решкой”, в одной трети “орлом”. Может, это как-то поможет тебе выиграть?“ - “А как это может мне помочь? Я тоже в двух третях случаев говорю “решка” и пытаюсь, таким образом, угадать. А в одной трети говорю “орел” и тоже пытаюсь угадать и получить два рубля“. Но мне на самом деле все равно называть “решку” или “орла”. Моя стратегия смешивать две трети и одну треть в этом случае одна из целого класса оптимальных стратегий. Выигрыши в той и другой ситуации одинаковые. Это дополнительное знание не приведет к изменению моей стратегии. То же самое, если тебе сказали, что я пытаюсь в двух третях случаев говорить “решка”, в одной трети “орел”, у тебя нет стимулов менять свою вероятность две трети. Конечно, здесь есть возражение: “Если у тебя выигрыш один и тот же, не проще ли использовать одну стратегию?” Ответ: “Это возражение, оно правильное. Но если мы примем, что люди пытаются упрощать ситуацию, мы придем к ситуации, когда равновесия нет. Потому, что это нас не удовлетворило, а другие мы исключили полностью”. Это называется равновесие в теории игр. Если две трети мы мгновенно посчитаем что будет, тогда получится другая табличка. Если мы пришли к тому, что “решку” мы показываем с вероятностью две трети, а “орла” с вероятностью одна треть и угадываем также. У нас получается, что угаданная “решка” происходит с вероятностью четыре девятых. Угаданный “орел” с вероятностью одна девятая. И по две девятых не угаданные. Тогда четыре девятых умножается на один, а одна девятая умножается на два. Это я выиграл два рубля. Получается шесть девятых, то есть, две трети, что и требовалось доказать. Это значит, что правильная цена этой игры равна две трети. И если ты приходишь на рынок, а она там по-другому стоит, ты готов ее продавать, а не покупать. За три четверти я готов ее продавать. Мы будем играть, и ничего нельзя будет сделать с тем, что на самом деле в среднем я буду проигрывать две трети, а вовсе не три четверти. Кажется, какая разница, две трети или три четверти? Отличается на одну двенадцатую. Но на рынке и за меньшие процентные пункты борются.

Сергей Ивановский. В зависимости от объема вложенных денег.

Алексей Савватеев. Тут я должен рассказать некоторую историю. Двадцать лет назад я вел занятия по теории игр. Только закончил Российскую экономическую школу. И у нас была такая группа, называлась “Центр дополнительного профессионального образования”. Мы ездили по всей стране и читали лекции. Несли некоторую часть науки в массы. В 2000 году, после нескольких таких семинаров, я еду в поезде из Сибири. У нас была большая экспедиция. Почти месяц шли. Возвращаемся, знакомимся с зеком. Тогда была такая амнистия. И вот я ехал с зеком, который возвращался в Самару. На некотором участке пути мы ехали вместе. Мы разговорились. Он говорит: “А что по жизни делаешь?” Я говорю: “По жизни я занимаюсь теорией игр”. – Говорит: “Давай сыграем на сахар. Игра очень простая. На раз, два, три вместо “камень, ножницы, бумага” ты показываешь либо один, либо два пальца. Если у нас одинаковое количество пальцев, ты выиграл. Если два пальца, то выиграл два куска сахара. А если четыре пальца, то выиграл четыре куска сахара. А если разное, то ты проиграл три куска сахара”. Я говорю: “Погоди”. Ушел с бумажкой, якобы в туалет. Быстренько такой же анализ провел. Возвращаюсь и говорю: “Давай играть. Но только я за нечетных. Это я буду выигрывать три куска сахара, а ты будешь выигрывать два и четыре”. - “А почему?” - “Потому, что в среднем я буду выигрывать”. - “Как? Она же совершенно честная”. Я говорю: “Я в семи из двенадцати случаев покажу один палец, а в пяти из двенадцати случаев покажу два”. Тут он просто упал буквально: “Даже цифры ты понял. Твоя наука чего-то стоит. Мы тут всех новых разводим, всех до единого”. Это же медленно. Цена игры одна двенадцатая. В среднем, тот, который за нечетных, выигрывает одну двенадцатую куска сахара. Сколько ты должен играть, чтобы заметить, что тебя начинают дурить. Говорит: “Не буду я с тобой играть. Теория игр серьезное дело”. А еще один случай после этого, я эту историю рассказывал на каждом семинаре. Один раз подошла женщина в Екатеринбурге и говорит: “Алексей Владимирович, а вы собираете случаи апробации ваших результатов?” - “Да нет, мы теоретики тут”. - “Запишите, пожалуйста, что случай монетизации этой игры в пальцы произошел вчера на фирме моего мужа. Он за вечер выиграл двадцать долларов”.

С меня отгадка про верхнее купе. Я беру верхнее купе потому, что я видел в интернете... Намек был, верхнее купе гораздо дешевле нижнего. Верхнее купе стоило 3600, нижнее 5500. Они мне готовы были покупать нижнее, в этом был намек, что нижнее дороже. Как вы понимаете, нижнее дороже, поэтому все берут верхнее. Я вижу вагон, в котором почти все верхние взяты, а нижние все пустые. Я наугад тыкаю: “Возьмите мне это верхнее”. Зачем? Нижнее будет пустым. Так и было до Екатеринбурга. У меня был рабочий кабинет. Там была спальня, а здесь я раскладывал компьютер и работал. Мне купили одно верхнее место, а в результате я получил их два. В этом и состоит отгадка. Теория игр в жизни человека иногда применяется. В Екатеринбурге сел мужик на нижнее место. Последние три часа мы ехали уже вместе.

Сергей Ивановский. Не знаю как вы, граждане, а я доволен. Продолжим в следующий раз. На сегодня прощаемся, но ждите следующих выпусков.

Алексей Савватеев. Надеюсь, это было проще, чем основная теорема арифметики.

Сергей Ивановский. Да.


В новостях

27.03.19 16:06 Алексей Савватеев про теорию игр, часть 1, комментарии: 15


Правила | Регистрация | Поиск | Мне пишут | Поделиться ссылкой

Комментарий появится на сайте только после проверки модератором!
имя:

пароль:

забыл пароль?
я с форума!


комментарий:
Перед цитированием выделяй нужный фрагмент текста. Оверквотинг - зло.

выделение     транслит


интересное

Новости

Заметки

Картинки

Видео

Переводы

Проекты

гоблин

Гоблин в Facebook

Гоблин в Twitter

Гоблин в Instagram

Гоблин на YouTube

Видео в iTunes Store

Аудио в iTunes Store

Аудиокниги на ЛитРес

tynu40k

Группа в Контакте

Новости в RSS

Новости в Facebook

Новости в Twitter

Новости в ЖЖ

Канал в Telegram

реклама

Разработка сайтов Megagroup.ru

Реклама на сайте

Рейтинг@Mail.ru
Рейтинг@Mail.ru


Goblin EnterTorMent © | заслать письмо | цурюк