Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Лаборатория № 2 >> Основные направления исследований >> Оценивание и управление дискретно-непрер...

Методы оценивания и управления дискретно-непрерывными стохастическими процессами по неполным данным

Динамические системы с импульсными или сингулярными управлениями образуют очень важный класс систем, в которых управления вызывают очень быстрые (почти мгновенные) изменения состояний. Они появляются во многих областях приложений, включая: динамику полета, рациональное использование ограниченных и возобновляемых ресурсов, химио- и радиотерапию в медицине, процессы передачи данных и теорию очередей, производство электроэнергии, управление запасами и финансовую математику, рекламную деятельность, управление наблюдениями. Общий подход к оптимизации таких систем был предложен в начале 70-х годов и основан на методе квазивариационных неравенств, который является обобщением классического метода динамического программирования. Однако, известные вычислительные сложности данного метода ограничивают его применимость, так что для стохастических систем были решены лишь очень простые задачи малой размерности с линейной зависимостью от импульсных управлений. Хотя необходимо отметить, что технически решение этих задач требовало весьма значительных усилий и развития соответствующих методов решения нелинейных дифференциальных уравнений в частных производных.

В тоже время для детерминированных систем в течение последних 20 лет были получены общие результаты, имеющие многочисленные приложения в таких различных областях как медицина, механика, экономика, квантовая электроника, планирование статистических экспериментов (управление наблюдениями). Этот успех объясняется двумя факторами: на первом этапе удалось выделить класс систем, устойчивых по отношению к вариациям мер-управлений, а затем был предложен оригинальный метод замены времени (зависящей, вообще говоря, от управления), который позволил свести задачи с разрывными решениями и импульсными управлениями к классическим и применить к ним весь известный арсенал методов теории оптимального управления. Более того, в последние годы этот метод был успешно распространен на стохастические системы с импульсными управлениями в сносе, которые в итоге приводят к системам с детерминированной зависимостью скачка от импульсного управления. В тоже время, для многих практически важных стохастических систем скачок является случайной функцией импульсного управления. Именно поэтому разработка методологии решения задач оптимального управления для нелинейных стохастических систем с импульсными управлениями в сносе и диффузии является актуальной задачей.

В рамках проведенных исследований сформулированы подходы к проблеме робастности, для стохастических дифференциальных уравнений с импульсными воздействиями в диффузионных членах, нелинейно зависящих от фазовых переменных. Показано, что достаточным условием робастности является обобщенное условие Фробениуса, формулируемое в терминах полной интегрируемости системы уравнений в частных производных первого порядка. Данное условие выполняется для целого класса практически важных систем, таких как системы, описывающие управление наблюдениями в нелинейной постановке для стохастических систем с ненаблюдаемыми состояниями, включающими непрерывный процесс, зависящий от конечного множества априорно неизвестных параметров. Предложено обобщение метода сингулярных пространственно-временных преобразований для задач с управляемыми односторонними ограничениями. Получено представление обобщенных решений в форме нелинейных дифференциальных уравнений с мерами, в котором в универсальном виде описываются как свободные непрерывные движения, так и удары об ограничение и режимы скольжения вдоль ограничений. Предложенный метод описания является базовым для доказательства теорем существования оптимальных решений в задачах оптимального управления с ударами об одностороннее ограничение. Решен ряд практически важных задач управления ограничением.

Разработан подход к управлению Марковскими цепями с конечным множеством состояний при наличии интегральных и терминальных ограничений. Задача рассматривается на конечном интервале времени с нестационарными внешними возмущениями, в этом состоит ее главное отличие от традиционных задач, решаемых в Марковской теории принятия решений. Показано, что исходная стохастическая задача может быть эквивалентным образом переформулирована как детерминированная, что позволяет применить известные методы, основанные на необходимых условиях оптимальности для задач с ограничениями. Показано, что в практически важных случаях задача обладает выпуклыми свойствами, что позволяет использовать численные методы решения, основанные на методологии решения двойственных задач. Исследован ряд практически важных постановок для задач управления доступом и скоростью обслуживания в системах массового обслуживания. Показано, что данная методология может быть использована и для задач с управлениями не ограниченными по амплитуде, но ограниченными интегрально (эти задачи естественным образом возникают при использовании схем активного управления очередями), и, следовательно, допускающими импульсные управления.

НОВОСТИ И ОБЪЯВЛЕНИЯ
Главный научный сотрудник Лаборатории квантовой физики и информации ИППИ РАН, директор Центра перспе...
Семинар лаб.9: 30 марта (четверг!) в 14.00 Алексей Викторович Чернавский, Вера Леонидовна Талис ...
Старший научный сотрудник Лаборатории квантовой физики и информации №5 ИППИ РАН, доцент Центра персп...
На портале РБК опубликовано мнение заместителя директора ИППИ РАН по научной работе Михаила Гельфанд...
Заместитель директора, руководитель учебно-научного центра "Биоинформатика" ИППИ РАН Михаил Гельфанд...
Семинар лаборатории № 8: 23 марта в 14:30 в ИПЭЭ РАН. Л.К. Римская-Корсакова: Прямая и обратная маск...
Семинар по теории кодирования: 21.03.2017 (вторник),19:00, ауд.307 ИППИ. Илья Воробьев (МГУ) "Неадап...
Семинар "Структурные модели и глубинное обучение": 21.03.2017 (вторник), ауд. 615 ИППИ,18:30. Алекса...
Все новости   
 

 

  © Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2017
Об институте  |  Контакты  |  Старая версия сайта