это быстро и бесплатно
Оформите заказ сейчас и получите скидку 100 руб.!
ID (номер) заказа
2342657
Ознакомительный фрагмент работы:
СОДЕРЖАНИЕ
ВВЕДЕНИЕ 3
1. Предмет и задачи теории игр 5
2. Классификация игр 7
3. Практическое применение теории игр в моделировании экономических
процессов 9
4. Парные игры с нулевой суммой. Решение в чистых стратегиях 13
5. Решение игр в смешанных стратегиях 20
ЗАКЛЮЧЕНИЕ 26
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 28
ВВЕДЕНИЕ
Для эффективного анализа и прогнозирования экономических процессов, моделирования экономических систем используется эконометрика. Впервые термин «эконометрика» введен норвежским ученым Рагнаром Фришем в 1926 году и в переводе означает «измерение в экономике».
Эконометрика ― это статистический анализ экономических данных, другими словами, эконометрика ― это наука об экономических измерениях . Эконометрика изучает качественные и количественные взаимосвязи экономических объектов и процессов с помощью математико-статистических методов и моделей.
Предприятие как открытая, динамичная, многоуровневая система требует учета всех особенностей, относящихся к такого рода системе, которые развиваются в процессе управления предприятием. Соответственно, возникает необходимость в применен ии в процессе управления предприятием таких методов и моделей, позволяющих планировать, организовывать, мотивировать и контролировать предпринимательскую деятельность с точки зрения рассмотрения предприятия как системы и с учетом его особенностей. Применение в таких ситуациях экономикой - математических методов и моделей является общеизвестным и проявило себя как наиболее прогрессивное и эффективное. Современные методы управления экономическими системами и процессами базируются на широком использовании математических и экономико-математических методов.
Теория игр берет свое начало с неоклассической экономики. Несмотря на бурный интерес к теории игр и ее быстрое развитие в 80-е годы прошлого века до 90-х годов, она мало влияла на практику стратегического менеджмента. Значительный вклад в становление и развитие теории игр по определению взаимоотношений между участниками рынка в конкурентной борьбе в разные года сделали О. Курно, Дж. Бертран, Ф. Эджуорт, Г. Хотеллинга, Э. Чемберлен, Г. фон Штакельберг, Дж. Фон Нейман и О. Моргенштейн, Д. Нэш, Г. Оуэн, Э. Мулен, Н.Н. Воробьев, С. Б. Авдашева, В. Гальперин и другие ученые. Актуальность формирования стратегий вызывает интерес многих отечественных и зарубежных ученых. Теоретические основы стратегического менеджмента освещены в работах таких зарубежных ученых, как И. Ансофф, Г. Рассел, Х. Хершген, Ф. Котлер, М. Мак-Дональд, П. Дойль, М. Портер, А.П. Панкрухин. Проблематике исследования стратегий много внимания было посвящено в трудах таких отечественных ученых: А.Ф. Павленко, А.В. Войчак, Н.В. Куденко, И.Л. Решетниковой, С.С. Горковенко, Л.В. Балабановой.
Несмотря на довольно большую численность научных разработок в области теории игр отечественными изарубежными учеными, использование математического аппарата теории игр в стратегическом менеджменте остаются без должного внимания, что обусловливает актуальность исследования.
Цель реферата заключалась в рассмотрении теории игр в моделировании социально-экономических систем.
Задачи реферата:
- рассмотреть эволюцию и методологию экономико-математического моделирования,
- изучить особенности и виды основных эконометрических моделей,
- рассмотреть теории игр в моделировании социально-экономических систем: теоретические особенности и практические аспекты.
Объект работы – эконометрические модели.
Предмет работы – особенности теории игр в моделировании социально-экономических систем.
1. Предмет и задачи теории игр
В процессе целенаправленной человеческой деятельности возникают ситуации, в которых интересы отдельных лиц (участников, групп, сторон) либо прямо противоположны (антагонистичны), либо, не будучи непримиримыми, все же не совпадают.
Простейшими и наиболее наглядными примерами таких ситуаций являются спортивные игры, арбитражные споры, военные учения (маневры), борьба между блоками избирателей за своих кандидатов, в международных отношениях- отстаивание интересов своего государства и т.п. Здесь каждый из участников сознательно стремится добиться наилучшего результата за счет другого участника. Подобного рода ситуации встречаются и в различных сферах производственной деятельности.
Все ситуации, когда эффективность действия одного из участников зависит от действий других, можно разбить на два типа: интересы участников совпадают, и они могут договориться о совместных действиях; интересы участников не совпадают. В этих случаях может оказаться невыгодным сообщать другим участникам свои решения, так как кто-нибудь из них сможет воспользоваться знанием чужих решений и получит больший выигрыш за счет других участников. Ситуации такого типа называются конфликтными. Для указанных ситуаций характерно, что эффективность решений, принимаемых в ходе конфликта каждой из сторон, существенно зависит от действий другой стороны. При этом ни одна из сторон не может полностью контролировать положение, так как и той и другой стороне решения приходится принимать в условиях неопределенности. Так, при определении объема выпуска продукции на одном предприятии нельзя не учитывать размеров выпуска аналогичной продукции на других предприятиях.
В реальных условиях нередко возникают ситуации, в которых антагонизм отсутствует, но существуют противоположные тенденции. Например, для нормального функционирования производства, с одной стороны, необходимо наличие запасов разнообразных ресурсов, но с другой – стремление к чрезвычайному увеличению этих запасов вызывает дополнительные затраты по их содержанию и хранению. В приведенных примерах конфликтные ситуации возникают в результате сознательной деятельности людей.
Однако на практике встречаются неопределенности, которые порождаются не сознательным противодействием другой стороны, а недостаточной информированностью об условиях проведения планируемой операции. Раздел математики, изучающий конфликтные ситуации на основе их математических моделей, называется теорией игр. Таким образом, теория игр – это математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действий каждого из участников в ходе конфликтной ситуации, т.е. таких действий, которые обеспечивали бы ему наилучший результат.
Игровую схему можно придать многим ситуациям в экономике. Здесь выигрышем могут быть эффективность использования дефицитных ресурсов, производственных фондов, величина прибыли, себестоимость и т.д.
Необходимо подчеркнуть, что методы и рекомендации теории игр разрабатываются применительно к таким специфическим конфликтным ситуациям, которые обладают свойством многократной повторяемости. Если конфликтная ситуация реализуется однократно или ограниченное число раз, то рекомендации теории игр теряют смысл.
2. Классификация игр
Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.
В зависимости от количества игроков различают игры двух и игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков – тем больше проблем.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.
По характеру взаимодействия игры делятся на:
- бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции;
- коалиционные (кооперативные) могут вступать в коалиции.В кооперативных играх коалиции наперёд определены.
По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др.
Матричная игра - это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение, и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице выигрыш игрока 2.)Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
3. Практическое применение теории игр в моделировании экономических процессов
Пример №1. На базе торговой фирмы имеется n типов товара ассортиментного минимума. В магазин фирмы должен быть завезен только один из этих типов товара. Если товар типа j будет пользоваться спросом, то магазин от его реализации получит прибыль . Если же этот товар не будет пользоваться спросом, то издержки на его хранение принесут магазину убыток .Требуется выбрать тип товара, который целесообразно завезти в магазин.
В условиях неопределенного покупательского спроса конфликтная ситуация товароснабжения формализуется матричной игрой. Пусть первый игрок — магазин, второй игрок — покупательский спрос. Каждый из игроков имеет по n стратегий. Завоз i-го товара — i-я. стратегия первого игрока, спрос на j-й товар — j-я стратегия второго игрока. Тогда матрица выигрышей первого игрока имеет вид квадратной матрицы n-го порядка.
Пример №2. Матрица игры имеет вид: Минимальный элемент первой строки (первой стратегии первого игрока) равен 2, второй — 5, третьей — 4; максимальное значение из этих величин равно 5. Максимальный элемент первого столбца (первой стратегии второго игрока) равен 10, второго — 10; третьего — 5, четвертого — 14, пятого — 12; минимальное значение из них равно 5. Следовательно, данная игра имеет седловую точку (2, 3) и задача разрешима в чистых стратегиях. Придерживаясь чисто второй стратегии, первый игрок обеспечивает себе выигрыш, не меньший 5; второй игрок, применяя чистую третью стратегию, проигрывает не более 5. Обе стратегии j = 2 и j = 3 являются оптимальными для первого и второго игроков, при этом цена игры V = 5.
Пример №3. Диспетчер автобусного парка (ЛПР) в месяцы в конце каждой недели должен принять решение о целесообразности выделения дополнительных автобусов на загородный маршрут. ЛПР имеет три варианта решений: увеличить количество автобусов на 10 (стратегия ) увеличить это количество на 5 (стратегия Р2) или оставить без изменения обычное число автобусов на линии (стратегия Р3). Возможны два состояния погоды: —Q1 плохая погода,Q2 - хорошая погода, причем в момент принятия решения нет возможности определить ожидаемое состояние погоды. Если в выходные дни будет хорошая погода и много желающих выехать за город, а выделено мало автобусов, то парк понесет убытки, связанные с недополученной прибылью. Если же выделены дополнительные автобусы, а погода окажется плохой, то возникнут потери вследствие эксплуатации незаполненных автобусов.
Пусть, на основе анализа статистических данных за определенный период установлена функция потерь для возможных комбинаций состояний природы и решений ЛПР в виде матрицы игры А (Рi,Qi), в которой отрицательные значения показывают дополнительную прибыль, а положительные – потери:
Q1 Q2
Если нет сведений о вероятностях различных состояний погоды, то по критерию Вальда и по критерию Сэвиджа оптимальной является стратегия Р2. По критерию Гурвица при “коэффициенте пессимизма” q=1 оптимальной окажется стратегия Р2, а при q=0 — стратегия Р1.
Пример №4. Швейное предприятие, выпускающее детские платья и костюмы, реализует свою продукцию через фирменный магазин. Сбыт продукции зависит от состояния погоды. Но данным прошлых наблюдений предприятие в течении апреля — мая в условиях теплой погоды может реализовать 600 костюмов и 1975 платьев, а при прохладной погоде 1000 костюмов и 625 платьев. Известно, что затраты на единицу продукции в течение указанных месяцев составили для костюмов 27 руб., для платьев 8 руб., а цена реализации равна соответственно 48 руб. и 16 руб. (цифры условные).
Задача заключается в максимизации средней величины прибыли от реализации выпущенной продукции с учетом неопределенности погоды в рассматриваемые месяцы. Таким образом, служба маркетинга предприятия должна в этих условиях определить оптимальную стратегию предприятия, обеспечивающую при любой погоде определенный средний доход. Решим эту задачу методами теории игр, игра в этом случае будет относиться к типу игр с природой.
Предприятие располагает в этих условиях двумя чистыми стратегиями: стратегия А — в расчете на теплую погоду и стратегия Б — в расчете на холодную погоду. Природу будим рассматривать как второго игрока также с двумя стратегиями: прохладная погода (стратегия В) и теплая погода (стратегия Г).
Если предприятие выберет стратегию А, то в случае прохладной погоды (стратегия природы В) доход составит:
600(48 - 27) + 625(16 - 8) - (1975 - 625)8 = 6 800 руб.,
а в случае теплой погоды (стратегия природы Г) доход равен:
600(48 - 27) + 1 975(16 - 8) = 28 400 руб.
Если предприятие выберет стратегию Б, то реализация продукции в условиях прохладной погоды даст доход:
1 000(48 - 27) + 625(16 - 8) = 26 000 руб.,
а в условиях теплой погоды:
600(48 - 27) + 625(16 - 8) - (1 000 - 600)27 = 6 800
Следовательно, матрица данной игры (платежная матица) имеет вид:
Первая и вторая строки этой матрицы соответствуют стратегиям А и Б предприятия, а первый и второй стратегиям В и Г природы.
По платежной матрице видно, что первый игрок (предприятие) никогда не получит доход меньше 6800.
Но если погодные условия совпадают с выбранной стратегией, то выручка (выигрыш) составит 26 000 или 28 400.
Отсюда можно сделать вывод, что в условиях неопределенности погоды наибольший гарантированный доход предприятие обеспечит, если будет попеременно применять то А, то стратегию Б.
Такая стратегия называется смешанной.
Оптимизация смешанной стратегии позволит первому игроку всегда получать выигрыша независимо от стратегии второго игрока.
Пусть х означает частоту применения первым игроком стратегии А, тогда частота применения им стратегии Б равна (1 - х).
В случае оптимальной смешанной стратегии первый игрок (предприятие) получит и при стратегии В (холодная погода), и при стратегии Г (теплая погода) второго игрока одинаковый средний доход:
6800х + 26 000(1 - х) = 28 400х + 6800(1 - х).
Отсюда можно найти, что х — 8/17; 1 - х = 9/17.
Следовательно, первый игрок, применяя чистые стратегии А и Б в соотношении 8:9, будет иметь оптимальную смешанную стратегию, обеспечивающую ему в любом случае средний доход в сумме:
6800-8/17 + 26000-9/17 16965 руб.; эта величина и будет в данном случае ценой игры.
Легко рассчитать, какое количество костюмов и платьев должно выпускать предприятие при оптимальной стратегии:
(600 костюмов + 1975 платьев)*8/17 + (1000 костюмов + 625 платьев)*9/17 = 812 костюмов + 1260 платьев.
Следовательно, оптимальная стратегия предприятия заключи в выпуске 812 костюмов и 1260 платьев, что обеспечит три любой погоде средний доход в сумме 16 965 руб.
4. Парные игры с нулевой суммой. Решение в чистых стратегиях
Рассмотрим парную конечную игру.
Пусть игрок А располагает m личными стратегиями: A1, A2, …, Am. Пусть у игрока B имеется n личных стратегий. Обозначим их B1, B2, …, Bn. В этом случае игра имеет размерность mxn. В результате выбора игроками любой пары стратегий Ai,Bj ( ) однозначно определяется исход игры, т.е. выигрыш aij игрока А (положительный или отрицательный) и проигрыш ( - aij) игрока В.
Предположим, что значения aij известны для любой пары стратегий (Ai,Bj).
Матрица А = (aij), , элементами которой являются выигрыши, соответствующие стратегиям Ai и Bj, называется платежной матрицей или матрицей игры.
Общий вид платежной матрицы приведен ниже:
A = a11 a12 a1n
a21 a22 a2n
am1 am2 amn.
Платежную матрицу также часто представляют в виде таблицы (см. таблицу 1).
Таблица 1 - Общий вид платежной матрицы
B1 B2 ... BnA1 a11 a12 ... A1n
A2 a21 a22 ... A2n
... ... ... ... ...
Amam1 am2 ... AmnСтроки матрицы А соответствуют стратегиям первого игрока, а столбцы – стратегиям второго.
Эти стратегии называются чистыми.
Пример 1. Составьте платежную матрицу для следующей игры (игра "Поиск").
Игрок А может спрятаться в одном из двух убежищ (I или II); игрок B ищет игрока A, и если найдет, то получает штраф 1 денежную единицу от А, в противном случае - платит игроку А 1 денежную единицу.
Решение.
Для того чтобы составить платежную матрицу следует проанализировать поведение каждого из игроков. Игрок А может спрятаться в убежище I - обозначим эту стратегию через A1, или в убежище II - стратегия A2.
Для того чтобы составить платежную матрицу следует проанализировать поведение каждого из игроков. Игрок А может спрятаться в убежище I - обозначим эту стратегию через A1, или в убежище II - стратегия A2.
Игрок B может искать первого игрока в убежище I - стратегия B1, либо в убежище II - стратегия B2. Если игрок А находится в убежище I и там его обнаруживает игрок B, т.е. осуществляется пара стратегий (A1, B1), то игрок А платит штраф, т.е. a11 = -1. Аналогично a22 = -1.
Очевидно, что комбинации стратегий (A1, B2) и (A2, B1) дают игроку А выигрыш, равный единице, поэтому a12= a21 = 1.
Таким образом, для игры "Поиск" размера 2x2 получаем следующую платежную матрицу:
A = -1 1
1 -1 .
Рассмотрим игру размера mxn c матрицей А = (aij), и определим лучшую среди стратегий A1, A2, …, Am.
Выбирая стратегию Ai, игрок А должен рассчитывать , что игрок В ответит на нее той из стратегий Bj, для которой выигрыш игрока А минимален (игрок В стремится "навредить" игроку А).
Обозначим - наименьший выигрыш игрока А при выборе им стратегии Ai для всех возможных стратегий игрока В (наименьшее число в i-ой строке платежной матрицы), т.е.
Среди чисел ( ) выберем наибольшее . Назовем нижней ценой игры или максимальным выигрышем (максимином). Это гарантированный выигрыш игрока А при любой стратегии игрока В.
Итоговую формулу можно записать следующим образом:
Стратегия, соответствующая максимину, называется максиминной стратегией.
Аналогичные рассуждения могут быть выполнены и в отношении игрока B.
Игрок B заинтересован в том, чтобы уменьшить выигрыш игрока А.
Выбирая стратегию Bj, он учитывает, что игрок A будет стремиться к максимальному выигрышу.
Обозначим - наибольший проигрыш игрока B при выборе им стратегии Bj для всех возможных стратегий игрока A (наибольшее число в j-ой строке платежной матрицы).
Среди чисел ( ) выберем наименьшее и назовем верхней ценой игры или минимаксом. Это минимальный гарантированный проигрыш игрока В.
Таким образом:
Стратегия, соответствующая минимаксу, называется минимаксной стратегией.
Принцип, диктующий игрокам выбор наиболее "осторожных" максиминной и минимаксной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.
Игрок выбирает свои действия, предполагая, что противник будет действовать неблагоприятным образом, т.е. будет стараться "навредить".
Вернемся к примеру 1 и определим нижнюю и верхнюю цену игры в задаче "Поиск".
Рассмотрим платежную матрицу:
A = -1 1
1 -1 .
При выборе стратегии A1 (первая строка матрицы) минимальный выигрыш равен 1 = min (-1; 1) = -1 и соответствует стратегии B1 игрока B. При выборе стратегии A2 (вторая строка матрицы) минимальный выигрыш равен 2 = min (-1; 1) = -1, он достигается при использовании игроком B стратегии B2.
Гарантируя себе максимальный выигрыш при любой стратегии игрока B, т.е. нижнюю цену игры = max (1; 2) = max (-1; -1) = -1, игрок А может выбрать любую стратегию: A1 или A2, т.е. любая его стратегия является максиминной.
Выбирая стратегию B1 (первый столбец), игрок B понимает, что игрок А ответит стратегией A2, чтобы максимизировать свой выигрыш (проигрыш игрока B). Следовательно, максимальный проигрыш игрока B при выборе им стратегии B1 равен 1 = max (-1; 1) = 1.
Аналогично, максимальный проигрыш игрока B при выборе им стратегии B2 (второй столбец) равен 2 = max (1; -1) = 1.
Таким образом, при любой стратегии игрока А гарантированный минимальный проигрыш игрока B равен = min (1, 2) = min (1, 1) = 1 - верхней цене игры.
Любая стратегия игрока B является минимаксной.
Результаты наших рассуждений сведем в таблицу 2, которая представляет собой платежную матрицу с дополнительной строкой j и столбцом i. На их пересечении будем записывать верхнюю и нижнюю цену игры.
Таблица 2 - Платежная матрица игры "Поиск" с дополнительными строкой и столбцом B1 B2 iA1 -1 1 -1
A2 1 -1 -1
j1 1
Таким образом, в рассматриваемой задаче нижняя и верхняя цены игры различны: ≠ .
Если же верхняя и нижняя цены игры совпадают, то общее значение верхней и нижней цены v = = называется чистой ценой игры, или просто ценой игры. Максиминная и минимаксная стратегии, соответствующие цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением, или просто решением игры.
В этом случае игрок А получает максимальный гарантированный (не зависящий от поведения игрока В) выигрыш v, а игрок В добивается минимального гарантированного (не зависящего от поведения игрока А) проигрыша v. Говорят, что решение игры обладает устойчивостью, т.е., если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.
Пара чистых стратегий Ai и Bj дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент aij является одновременно наибольшим в своем столбце и наименьшим в своей строке.
Такая ситуация, если она существует, называется седловой точкой (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз - в другом).
Таким образом, для игры с седловой точкой нахождение решения заключается в выборе максиминной и минимаксной стратегии, которые и являются оптимальными.
Далее рассмотрим пример.
Пример 2. Определите нижнюю и верхнюю цену игры, которая задана следующей платежной матрицей:
A = 0,5 0,6 0,8
0,9 0,7 0,8
0,7 0,6 0,6.
Решение.
Выясним, имеет ли игра седловую точку. Решение удобно проводить в таблице. Таблица 3 включает платежную матрицу игры, а также дополнительные строку и столбец, которые иллюстрируют процесс поиска оптимальных стратегий.
Таблица 3 - Платежная матрица примера 2 с дополнительными строкой и столбцом
B1 B2 B3 iA1 0,5 0,6 0,8 0,5
A2 0,9 0,7 0,8 0,7
A3 0,7 0,6 0,6 0,6
j0,9 0,7 0,8 = = 0,7
Приведем некоторые пояснения.
Столбец i заполнен на основе анализа строк матрицы (стратегии игрока A): 1 = 0,5; 2 = 0,7; 3 = 0,6 - минимальные числа в строках.
Аналогично, 1 = 0,9; 2 = 0,7; 3 = 0,8 - максимальные числа в столбцах.
Нижняя цена игры = i = max (0,5; 0,7; 0,6) = 0,7 (наибольший элемент в столбце i).
Верхняя цена игры = j = min (0,9; 0,7; 0,8) = 0,7 (наименьший элемент в строке j). Эти значения равны, т.е. = , и достигаются на паре стратегий (A2,B2). Цена игры v = 0,7.
Таким образом, оптимальное решение состоит в выборе игроками А и В стратегий А2 и В2 соответственно.
Пример 5.2 наглядно демонстрирует свойство устойчивости решения. Можно убедиться, что если любой из игроков придерживается своей оптимальной стратегии, то другому заведомо невыгодно отступать от своей оптимальной стратегии.
5. Решение игр в смешанных стратегиях
Итак, для игры с седловой точкой нахождение решения состоит в выборе максиминной и минимаксной стратегий, которые и являются оптимальными.
Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. Например, в игре "Поиск" (пример 1) седловая точка отсутствует.
В этом случае можно получить оптимальное решение, чередуя чистые стратегии.
Смешанной стратегией игрока А называется применение чистых стратегий А1, А2, …, Аm c вероятностями u1, u2, …, um.
Обычно смешанную стратегию первого игрока обозначают как вектор: U = (u1, u2, …, um), а стратегию второго игрока как вектор: Z = (z1, z2, …, zm).
Очевидно, что:
ui ≥ 0, ,
zj ≥ 0, ,
ui = 1,
zj = 1.
Чистые стратегии можно считать частным случаем смешанных и задавать вектором, в котором единица соответствует чистой стратегии.
Оптимальное решение игры (или просто - решение игры) – это пара оптимальных стратегий U*, Z*, в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству:
≤ v ≤ ,
Справедлива следующая основная теорема теории игр.
Теорема Неймана. Каждая конечная игра с нулевой суммой имеет решение в смешанных стратегиях .Пусть U* = (, , ..., ) и Z* = (, , ..., ) - пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с вероятностью, отличной от нуля, то она называется активной.
Теорема об активных стратегиях. Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.
Эта теорема имеет большое практическое значение - она дает конкретные модели для нахождения оптимальных стратегий при отсутствии седловой точки.
Рассмотрим игру размера 2x2.
Такая игра является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение - это пара чистых стратегий, соответствующих этой точке.
Для игры, в которой отсутствует седловая точка в соответствии с теоремой Неймана, оптимальное решение существует и определяется парой смешанных стратегий U* = (, ) и Z* = (, ).
Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии U*, то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрок В. Для игры 2x2 любая чистая стратегия противника является активной, если отсутствует седловая точка.
Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание которой является ценой игры. Поэтому средний выигрыш игрока А (при использовании оптимальной стратегии) будет равен v и для первой, и для второй стратегии противника.
Пусть игра задача платежной матрицей:
A = a11 a12a21 a22 .
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию U* = (, ), а игрок В – чистую стратегию B1 (что соответствует первому столбцу платежной матрицы), равен цене игры v, т.е.:
a11 + a21 = v.
Тот же средний выигрыш получает игрок А, если противник применяет стратегию B2, т.е. a12 + a22 = v. Учитывая, что + = 1, получим систему уравнений:
a11+ a12= v, a21+ a22= v,
+= 1. (1)
Решая систему(1), можно найти оптимальную стратегию U* и цену игры v.
Аналогичная система уравнений может быть получена для определения оптимальной стратегии игрока В:
a11+ a12= v,
a21+ a22= v,
+= 1.
Далее вернемся к решению игры "Поиск" (пример 1).
Игра задана платежной матрицей без седловой точки:
A = -1 11 -1 , = -1, = 1.
Будем искать решение в смешанных стратегиях. Составим систему уравнений (1) для нахождения стратегий игрока А:
- + = v,
- = v, + = 1.
Выразим из третьего уравнения: = 1 - . Сделаем подстановку в другие уравнения:
- + 1 - = v, - 1 + = v,
преобразуя, получим:
2 + v = 1,
2 - v = 1,
сложим уравнения:
4 = 2, откуда = 1/2, v = 0, = 1/2.
Система уравнений для игрока B (система (2)):
- + = 0,
- = 0, + = 1,
откуда: = = 1/2.
Таким образом, оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии, выбирая каждое из убежищ с вероятностью 1/2, при этом гарантированный средний выигрыш каждого из игроков равен нулю.
Далее рассчитаем еще один пример.
Пример 3. Найдите решение игры, заданной платежной матрицей:
A = 2 5
6 4 .
Решение.
Прежде всего, проверим наличие седловой точки. Для этого найдем минимальные элементы в каждой из строк (2 и 4) и максимальные в каждом из столбцов (6 и 5). Таким образом, нижняя цена игры = max (2, 4) = 4, верхняя цена игры = min (6, 5) = 5. Поскольку ≠ , решение игры следует искать в смешанных стратегиях, при этом цена игры находится в следующих пределах: 4 ≤ v ≤ 5.
Предположим, что для игрока А стратегия задается вектором U = (u1, u2). Тогда на основании теоремы об активных стратегиях можно записать систему уравнений:
2 + 6 = v,
5 + 4 = v, + = 1.
Решая систему из трех уравнений с тремя неизвестными, получим: = 2/5, = 3/5, v = 22/5.
Теперь найдем оптимальную стратегию игрока В. Пусть стратегия данного игрока задается вектором Z = (z1, z2). Система уравнений (5.2), основанная на использовании теоремы об активных стратегиях, запишется следующим образом:
2 + 5 = 22/5,
6 + 4 = 22/5, + = 1.
Решая систему, состоящую из любых двух уравнений, взятых из последней системы, получим = 1/5, = 4/5.
Следовательно, решением игры примера 3 являются смешанные стратегии: U* = (2/5, 3/5), Z* = (1/5, 4/5), цена игры v = 22/5.
ЗАКЛЮЧЕНИЕ
В последние годы значение теории игр существенно возросло во многих областях экономических и социальных наук. В экономике она применима не только для решения общехозяйственных задач, но и для анализа стратегических проблем предприятий, разработок организационных структур и систем стимулирования.
В условиях альтернативы (выбора) очень часто нелегко принять решение и выбрать ту или иную стратегию. Исследование операций позволяет с помощью использования соответствующих математических методов принять обоснованное решение о целесообразности той или иной стратегии. Теория игр, имеющая в запасе арсенал методов решения матричных игр, позволяет эффективно решать указанные задачи несколькими методами и из их множества выбрать наиболее эффективные, а также упрощать исходные матрицы игр.
Уже в момент ее зарождения, которым считают публикацию в 1944 г. монографии Дж. Неймана и О. Моргенштерна “Теория игр и экономическое поведение”, многие предсказали революцию в экономических науках благодаря использованию нового подхода. Эти прогнозы нельзя было считать излишне смелыми, так как с самого начала данная теория претендовала на описание рационального поведения при принятии решений во взаимосвязанных ситуациях, что характерно для большинства актуальных проблем в экономических и социальных науках. Такие тематические области, как стратегическое поведение, конкуренция, кооперация, риск и неопределенность, являются ключевыми в теории игр и непосредственно связаны с управленческими задачами.
Первые работы по теории игр отличались упрощенностью предположений и высокой степенью формальной абстракции, что делало их малопригодными для практического использования. За последние 10 - 15 лет положение резко изменилось. Бурный прогресс в промышленной экономике показал плодотворность методов игр в прикладной сфере.
В последнее время эти методы проникли и в управленческую практику. Вполне вероятно, что теория игр наряду с теориями трансакционных издержек и “патрон - агент” будет восприниматься как наиболее экономически обоснованный элемент теории организации.
Следует отметить, что уже в 80-х годах М. Портер ввел в обиход некоторые ключевые понятия теории, в частности такие, как “стратегический ход” и “игрок”. Правда, эксплицитный анализ, связанный с концепцией равновесия, в этом случае еще отсутствовал.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Печерский С. Л. , Беляева А. А. Теория игр для экономистов. Вводный курс. Учебное пособие. — СПб.: Изд-во Европ. Ун-та в С.Петербурге. — 342 с.
2. Васин А. “Эволюционная теория игр и экономика. Часть i.” Принципы оптимальности и модели динамики поведения // Журнал Новой экономической ассоциации. — 2009. — № 3-4. — С. 10–27.
3. Горяшко А. П. ТЕОРИЯ ИГР: ОТ АНАЛИЗА К СИНТЕЗУ.ОБЗОР РЕЗУЛЬТАТОВ // Cloud of science . 2014. №1. URL: http://cyberleninka.ru/article/n/teoriya-igr-ot-analiza-k-sintezu-obzor-rezultatov (дата обращения: 23.12.2015).
4. Шиян А. А. Теоретико-игровая модель для управления эффективностью взаимодействия "преподаватель ВУЗ" // УБС . 2007. №18. URL: http://cyberleninka.ru/article/n/teoretiko-igrovaya-model-dlya-upravleniya-effektivnostyu-vzaimodeystviya-prepodavatel-vuz (дата обращения: 23.12.2015).
5. Тур Анна Викторовна Линейно-квадратичные неантагонистические дискретные игры // УБС . 2009. №26-1. URL: http://cyberleninka.ru/article/n/lineyno-kvadratichnye-neantagonisticheskie-diskretnye-igry (дата обращения: 23.12.2015).
6. Зенкевич Николай Анатольевич, Зятчин Андрей Васильевич Построение сильного равновесия в дифференциальной игре многих лиц // УБС . 2010. №31-1. URL: http://cyberleninka.ru/article/n/postroenie-silnogo-ravnovesiya-v-differentsialnoy-igre-mnogih-lits (дата обращения: 23.12.2015).
7. Клейменов Анатолий Федорович ПОСТРОЕНИЕ НЭШЕВСКИХ РЕШЕНИЙ В НЕАНТАГОНИСТИЧЕСКОЙ ПОЗИЦИОННОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ ДВУХ ЛИЦ // Вестник Тамбовского университета. Серия: Естественные и технические науки . 2009. №4. URL: http://cyberleninka.ru/article/n/postroenie-neshevskih-resheniy-v-neantagonisticheskoy-pozitsionnoy-differentsialnoy-igre-dvuh-lits (дата обращения: 23.12.2015).
8. Савина Т. Ф. ОПТИМАЛЬНЫЕ РЕШЕНИЯ В ИГРАХ С ОТНОШЕНИЯМИ ПРЕДПОЧТЕНИЯ // Изв. Сарат. ун-та Нов. сер. Сер. Математика. Механика. Информатика; Izv. Saratov Univ. (N.S.), Ser. Math. Mech. Inform. . 2011. №2. URL: http://cyberleninka.ru/article/n/optimalnye-resheniya-v-igrah-s-otnosheniyami-predpochteniya (дата обращения: 23.12.2015).
9. Корнев Дмитрий Васильевич ОБ ОДНОМ ЧИСЛЕННОМ МЕТОДЕ РЕШЕНИЯ ПОЗИЦИОННЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГР В СМЕШАННЫХ СТРАТЕГИЯХ // Вестник Тамбовского университета. Серия: Естественные и технические науки . 2013. №5-2. URL: http://cyberleninka.ru/article/n/ob-odnom-chislennom-metode-resheniya-pozitsionnyh-differentsialnyh-igr-v-smeshannyh-strategiyah (дата обращения: 23.12.2015).
10. Alexander, J. McKenzie, Evolutionary Game Theory // The Stanford Encyclopedia of Philosophy. – 2009. [Электронный ресурс]. URL: http://plato.stanford.edu/entries/game-evolutionary/ (дата обращения: 05.12.2012).
11. Kuhn, Steven, "Prisoner's Dilemma", The Stanford Encyclopedia of Philosophy. 2009, [Электронный ресурс]. URL: http://plato.stanford.edu/entries/prisoner-dilemma/ (дата обращения: 05.12.2012.
Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников
Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.
Цены ниже, чем в агентствах и у конкурентов
Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит
Бесплатные доработки и консультации
Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки
Гарантируем возврат
Если работа вас не устроит – мы вернем 100% суммы заказа
Техподдержка 7 дней в неделю
Наши менеджеры всегда на связи и оперативно решат любую проблему
Строгий отбор экспертов
К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»
Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован
Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн
Требуется разобрать ст. 135 Налогового кодекса по составу напогового...
Решение задач, Налоговое право
Срок сдачи к 5 дек.
Школьный кабинет химии и его роль в химико-образовательном процессе
Курсовая, Методика преподавания химии
Срок сдачи к 26 дек.
Реферат по теме «общественное мнение как объект манипулятивного воздействий. интерпретация общественного мнения по п. бурдьё»
Реферат, Социология
Срок сдачи к 9 дек.
Выполнить курсовую работу. Образовательные стандарты и программы. Е-01220
Курсовая, Английский язык
Срок сдачи к 10 дек.
Изложение темы: экзистенциализм. основные идеи с. кьеркегора.
Реферат, Философия
Срок сдачи к 12 дек.
Заполните форму и узнайте цену на индивидуальную работу!