Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Постановка задачі оптимального стохастичного керування

Тип Реферат
Предмет Коммуникации и связь
Просмотров
1044
Размер файла
315 б
Поделиться

Ознакомительный фрагмент работы:

Постановка задачі оптимального стохастичного керування

ПОСТАНОВКА ЗАДАЧІ ОПТИМАЛЬНОГО СТОХАСТИЧнОГО КЕРУВАННЯ


1. Загальні положення

Позначатимемо – простір станів, , .

Можливі керування є множиною припустимих керувань , яка у свою чергу є підмножиною простору керувань : , .

Послідовність керуючих функцій , , записана у вигляді

(1),

називається стратегією керування.

Задача оптимального керування системою (1) полягає в пошуку такої послідовності функцій керування , що мінімізує цільовий функціонал системи за кроків. Ця послідовність називається оптимальною стратегією керування.

Визначення. Якщо кількість кроків, на яких досліджується поведінка системи, є скінченною, то задача називається задачею зі скінченним горизонтом рішення. Якщо ж ми розв’язуємо задачу на нескінченному часовому інтервалі (), то горизонт рішення є нескінченним.

Задача оптимального стохастичного керування з дискретним часом випливає із детермінованої задачі, якщо система функціонує за умов випадкових збурень . У цьому випадку функція (1), що визначає стан системи на кожному наступному кроці, залежить від поточного стану , керування і випадкових збурень :

, . (2)


Збурення є елементами деякого ймовірнісного простору (де – простір збурень, – -алгебра підмножин з ) і має розподіл .

2 Критерії якості

Розглянемо спочатку критерії якості, які найчастіше використовуються в детермінованих дискретних задачах керування, а потім перейдемо до стохастичного випадку. Якщо на кожному кроці функціонування системи задана функція , що визначає витрати за один крок керування, то критерій якості руху матиме вигляд

. (3)

Величина , що називається коефіцієнтом дисконтування, визначає внесок витрат за всі попередні кроки на кожному поточному кроці.

Найчастіше критерій (3) використовується в тих випадках, коли необхідно розв’язувати задачі, пов'язані з витратами деяких видів ресурсів. Саме цей функціонал ми будемо використовувати надалі.

Крім критерію (3) розглядаються також критерії, які мінімізують горизонт системи і є аналогом часу руху для неперервних систем. У цьому випадку цільовий функціонал матиме вигляд

.

Також часто в дискретних задачах керування використовуються термінальні функціонали якості

або ,

де – заданий стан системи, – кінцевий стан системи.

Оскільки в задачі оптимального стохастичного керування збурення випадкові, то може бути тільки апріорна інформація про них, наприклад, у вигляді функції розподілу, відомої повністю або частково. У цьому випадку якість процесу керування оцінюється за допомогою формули

,

яка дорівнює математичному сподіванню функції .

3 Види функцій керування стохастичною системою

Задача детермінованого керування відрізняється від свого стохастичного аналога тим, що в першій відсутні неконтрольовані фактори , і еволюція системи однозначно визначається обраним керуванням . Отже, у задачі детермінованого керування для кожного початкового стану можна заздалегідь вибрати послідовність оптимальних керувань , , …, , застосування яких дає оптимальне значення функціонала .

Для стохастичної системи в загальному випадку цього зробити не можна, оскільки система переходить зі стану в стан не тільки під дією керування ; на неї на кожному кроці також впливають випадкові величини . Очевидно, що, по-перше, ці величини можуть так змінити траєкторію системи, що обране раніше за оптимальне керування в момент його застосування вже таким не буде, і, по-друге, інформація, одержувана на кожному кроці про впливи , що мали місце, може бути додатково використана для поліпшення якості керування (рис. 1).

Рисунок 1 – Еволюція стохастичної системи ( – заданийстан)

Отже, для розв’язання задач оптимального стохастичного керування доцільно використовувати стратегії , у яких – функція минулих станів системи. У цьому випадку схема визначення оптимального керування на кожному кроці наступна. Якщо – початковий стан системи, то за перше керування вибирається функція . Якщо мали місце стани , …, і були задані керування , …, , то керування на -му кроці вибирається як функція , ( для всіх ). Отже, для вибору керування використовується вся інформація, що є в наявності. Описана стратегія керування є позиційною, оскільки керування визначається залежно від реалізованих позицій (станів) системи, на відміну від програмного керування, коли послідовність керувань визначається заздалегідь, до початку процесу керування, і є функцією часу.

Розглянемо окремі випадки.

Якщо , , то керування називається стаціонарним керуванням. Такі стратегії найпростіші, оскільки є одним і тим же вектором для всіх моментів часу.

Керування , , називається марковською позиційною стратегією (стратегією, кожний елемент якої залежить тільки від поточного стану системи).

Керування , , називається напівмарковською позиційною стратегією (стратегією, кожний елемент якої залежить тільки від поточного і початкового станів системи).

Марковські та напівмарковські позиційні стратегії використовуються найчастіше.

Зрозуміло, що в загальному випадку кінцевий стан системи , згідно з формулою (2) , , залежить від початкового стану , керувань і збурень . Щоб переконатися в цьому, досить виразити в (2) через , потім через і т.д. Якщо ці перетворення можливо провести, то одержимо співвідношення . Це означає, що різним реалізаціям випадкового збурення для одного початкового стану відповідатимуть різні оптимальні стратегії керування .

4 Формальна постановка задачі оптимального стохастичного керування

Розглянемо систему (2) із цільовим функціоналом (3). Надалі, якщо інше не обговорено спеціально, будемо вважати, що оптимальні керування на кожному кроці позиційні: , і , .

За таких умов задача оптимального стохастичного керування полягає в пошуку оптимальної послідовності функцій керування , (тобто стратегії керування), що мінімізує сумарні витрати за увесь час функціонування системи.

Формальна постановка задачі оптимального стохастичного керування зі скінченним горизонтом у дискретному випадку має вигляд:

, (4)

. (5)

Розв’язання задачі оптимального стохастичного керування з нескінченним горизонтом полягає в пошуку послідовності керувань , які мінімізують сумарні витрати.

Формальна постановка задачі оптимального стохастичного керування з нескінченним горизонтом у дискретному випадку має вигляд:

, (6)

. (7)

Далі під час розв’язання задач оптимального керування вважатимемо, що границя у (6) існує для всіх і .

Будемо розглядати задачі (4) – (5) і (6) – (7) у стаціонарному випадку, тобто припускатимемо, що простори станів і керувань і , обмеження керування , функція і витрати не змінюються при переході від кожного кроку до наступного. Якщо ж це не так, то задача є нестаціонарною. Нестаціонарна задача може бути зведена до стаціонарної за допомогою спеціальних методів, тому далі мова йтиме тільки про стаціонарні задачі.

Зупинимося детальніше на позначеннях, зроблених вище.

Визначення. Функція називається функцією витрат за кроків при стратегії в задачі зі скінченним горизонтом . Аналогом цієї величини для задачі з нескінченним горизонтом є функція – функція витрат при стратегії .

Для фіксованого стану позначимо через і оптимальні витрати в цих задачах, тобто

,

.

Якщо останні співвідношення вірні для всіх , то функція називається оптимальною функцією витрат за кроків, а – оптимальною функцією витрат.

Стратегія називається оптимальною при горизонті в стані , якщо

,

і оптимальною в стані , якщо

.

Стратегія називається оптимальною при горизонті , якщо . Це означає, що стратегія доставляє оптимальне значення цільовому функціоналу при всіх .

Аналогічно, стратегія називається оптимальною, якщо

. (8)

Стратегія називається рівномірно оптимальною при горизонті , якщо стратегія оптимальна при горизонті для всіх . Отже, якщо стратегія рівномірно оптимальна при горизонті , то вона також оптимальна при горизонті . Зворотне твердження в загальному випадку невірно.

Стратегія називається стаціонарною стратегією, якщо .

Якщо у цьому випадку значення цільового функціонала в задачі оптимального стохастичного керування з нескінченним горизонтом отримано з використанням стаціонарної стратегії , то результат позначають . Отже, стаціонарна стратегія у задачі з нескінченним горизонтом оптимальна, якщо . Тут – оптимальне значення цільового функціонала задачі.

Розв’язання будь-якої задачі оптимального стохастичного керування здійснюється за шість етапів:

1. Змістовна постановка задачі.

2. Побудова моделі об'єкта керування, що включає вибір векторів станів і керувань, просторів станів і керувань, вектора і простору випадкових збурень; побудову функції витрат, що визначається метою керування.

3. Формальна постановка задачі.

4. Вибір і обґрунтування методу розв’язання задачі.

Обчислення оптимальної стратегії керування одним з методів.

6. Аналіз отриманих результатів.

5 Алгоритм розв’язання задачі оптимального стохастичного керування

Процедура пошуку оптимальних позиційних стратегій є досить складною задачею. Одним з головних питань, вирішення якого дозволяє у значній мірі полегшити цю процедуру, є наступне: чи можна обмежитися пошуком оптимальних стратегій у класі стаціонарних або марковских стратегій? Якщо це можливо, то структура керування значно спрощується, і, крім того, зменшується об'єм оброблюваної інформації: не потрібно запам'ятовувати керування , …, , попередні стани , …, і діставати залежність поточного керування від усіх цих величин. У цьому випадку для розв’язання дискретних задач оптимального керування зі скінченним горизонтом найчастіше використовується алгоритм, заснований на методі динамічного програмування, запропонованого Беллманом. Суть методу полягає в наступному:

, (9)

(10)

де математичне сподівання береться за мірою . Формули (9) – (10) є стохастичним аналогом детермінованого алгоритму методу динамічного програмування.

Величина – це оптимальні витрати, пов'язані з функціонуванням системи, за останні кроків, за умови, що перед першим із цих кроків система перебувала в стані . Стратегія , кожний елемент якої доставляє оптимальне значення (10) для всіх , , є оптимальною стратегією для кожного . Оптимальна функція витрат даної задачі визначається на -му кроці і дорівнює .

Для розв’язання задач оптимального стохастичного керування з нескінченним горизонтом, як правило, застосовуються чисельні методи, які дозволяють на кожній ітерації одержувати наближення до оптимального керування і оптимальної функції витрат. У цьому випадку можна показати, що оптимальна функція витрат задовольняє рівнянню Беллмана

.

6 Формулювання задачі оптимального керування в термінах відображень

Сформулюємо задачу оптимального стохастичного керування (4) – (5), а також алгоритм динамічного програмування за допомогою відображення , яке задане формулою:

.

Розглянемо оператори і , які відображують множину функцій, що приймають дійсні значення на , в себе:

,

, .

За таких позначень задачу оптимального стохастичного керування (4) – (5) можна записати у вигляді:

,

,

де , , а – суперпозиція операторів (нагадаємо, що суперпозицією відображень і називається відображення таке, що , ).

Алгоритм динамічного програмування (9) – (10) у термінах відображень можна записати у такий спосіб:

, ,

звідки випливає, що , де – -кратний добуток оператора на себе.

Задачу з нескінченним горизонтом (6)-(7) у термінах відображень
можна сформулювати в такий спосіб.


,

.

Функціональне рівняння Беллмана тепер буде еквівалентно рівності

, .


Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
История
Экономика
icon
149536
рейтинг
icon
3150
работ сдано
icon
1362
отзывов
avatar
Математика
Физика
История
icon
144442
рейтинг
icon
5909
работ сдано
icon
2669
отзывов
avatar
Химия
Экономика
Биология
icon
98454
рейтинг
icon
2054
работ сдано
icon
1280
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
57 288 оценок star star star star star
среднее 4.9 из 5
Финансово-экономический колледж
Все супер! Алексей выполняет уже не первую работу, всегда досрочно и без исправлений!
star star star star star
РЭУ им. Г.В. Плеханова
Большое спасибо за помощь в выполнении задания. Выполнено очень качественно и раньше срока.
star star star star star
политехнический университет
Работо выполнена раньше срока с незначительным недочетом. Исправил в этот же день и присла...
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Доступная среда жизнедеятельности инвалидов

Курсовая, право социального обеспечения

Срок сдачи к 27 дек.

2 минуты назад

60-100 вопросов

Контрольная, Органическая химия

Срок сдачи к 26 дек.

3 минуты назад

На время решить 60 вопросов

Другое, Органическая химия

Срок сдачи к 26 дек.

5 минут назад

Применение нейросетей в начальной школе

Поиск информации, литература

Срок сдачи к 1 янв.

11 минут назад

Оформление по госту

Диплом, Педагогика и психология

Срок сдачи к 26 дек.

11 минут назад

все написано на скриншотах

Лабораторная, Информатика и информационные технологии информационно-аналитических систем

Срок сдачи к 26 дек.

11 минут назад

Нужно решить задачи

Решение задач, Электроника и схемы

Срок сдачи к 31 дек.

11 минут назад

Выполнить практическую работу по деталям машин. Вариант 12.

Контрольная, Механика, детали машин и основы конструирования

Срок сдачи к 2 янв.

11 минут назад

ответить на контрольные вопросы

Другое, Операционные системы

Срок сдачи к 28 дек.

11 минут назад

Дифференциальные уравнения

Контрольная, Высшая математика

Срок сдачи к 19 янв.

11 минут назад

Первая мировая война

Курсовая, История

Срок сдачи к 17 янв.

11 минут назад

Анализ трафика

Решение задач, Основы компьютерных сетей

Срок сдачи к 28 дек.

11 минут назад

ПМ. 04 Составление и использование бухгалтерской отчетности

Другое, Пм. 04 составление и использование бухгалтерской отчетности.на базе фек.рф.учебная практика .7 дней

Срок сдачи к 28 дек.

11 минут назад

Спроектировать кинотеатр вместительностью 240 человек

Курсовая, Архитектура зданий и сооружений, строительство

Срок сдачи к 9 янв.

11 минут назад

разработка комплекта конструкторской документации на сборочную единицу кондуктор

Контрольная, основы конструкторской документации

Срок сдачи к 31 дек.

11 минут назад

Иммерсионное чтение

Реферат, Литература

Срок сдачи к 2 янв.

11 минут назад

какой хлеб был на руси

Презентация, технология приготовление хлеба, кулинария, история

Срок сдачи к 31 дек.

11 минут назад

Подготовить выступление на 7 минут. Задание: предположите

Доклад, Актуальные проблемы методики преподавания обществоведческих дисциплин, обществознание

Срок сдачи к 29 дек.

11 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно