|
Схемы и модели формирования интеллектуального адаптивного поведения
Проект РФФИ 04-01-00179
Краткий отчет за 2006 год
Краткий отчет за 2005 год
Краткий отчет за 2004 год
Список публикаций
Краткий отчет за 2006 год
1) Разработаны и проанализированы архитектуры нейросетевой системы управления аниматами (искусственными организмами), основанные на теории функциональных систем П.К. Анохина. Система управления имеет блочно-иерархическую или многомодульную архитектуру. Каждый модуль системы управления соответствует отдельной функциональной системе и содержит две нейронные сети: Контроллер и Модель. Контроллер предназначен для формирования действий анимата. Модель обеспечивает прогноз будущей ситуации для заданной текущей ситуации и действия, формируемого Контроллером. Обучение происходит в форме самообучения (без учителя) на основе только подкреплений и наказаний, поступающих из внешней среды. Проведено предварительное компьютерное моделирование в рамках этих архитектур.
2) Разработана компьютерная модель поискового поведения биологических организмов, при котором в процессе поиска происходит инерционное переключение между двумя поисковыми тактиками (консервативной и стохастической поисковой). При этом имеется гистерезис в процессе переключения между тактиками. Модель апробирована на примере поискового поведения личинок ручейников, строящих чехол-домик. Продемонстрировано качественное подобие модели реальному поисковому поведению личинок ручейников.
3) Сделаны аналитические обзоры по моделям интеллектуального адаптивного поведения. Разработаны рекомендации и предложения по дальнейшим исследованиям интеллектуального адаптивного поведения.
Краткий отчет за 2005 год
В ходе выполнения проекта были получены следующие результаты:
1) Исследована модель эволюции популяции самообучающихся адаптивных агентов. Система управления каждого агента основана на нейросетевых адаптивных критиках, которые обеспечивают прогноз будущих ситуаций и принятие решений на основе прогноза. Адаптация системы управления происходит как в результате индивидуального обучения, так и результате эволюционной оптимизации. Проведено сравнение трех вариантов модели, в которых включены а) либо обучение и эволюция одновременно, б) либо отдельно эволюция, в) либо отдельно обучение. Показано, что в данной модели может наблюдаться эффект Болдуина, т.е. первоначально приобретаемые навыки агентов в процессе эволюции становятся наследуемыми. Проведено сравнение поведения модельных агентов с поисковым поведением простейших животных, продемонстрировано качественное подобие этих двух типов поведения.
2) Сделаны оценки эффективности эволюционных алгоритмов. Оценки сделаны для модели квазивидов М. Эйгена, которая соответствует генетическому алгоритму без скрещивания. Оценки сделаны следующим образом: сделаны грубые аналитические оценки и эти оценки проверены путем компьютерного моделирования. Показано, что для случая поиска экстремума унимодальной функции N бинарных переменных существуют эволюционные алгоритмы, обеспечивающие нахождение оптимума при анализе порядка N2 вариантов, при этом характерное время сходимости эволюционного алгоритма растет пропорционально N.
3) Разработана нейросетевая модель системы управления мобильного робота Khepera, имитирующего простейшие формы адаптивного поведения животных и проведены предварительные компьютерные эксперименты с этой моделью.
4) В процессе работы над проектом подготовлена монография:
Редько В.Г. Эволюция, нейронные сети, интеллект. Модели и концепции эволюционной кибернетики. М.: Изд-во УРСС, серия "Синергетика: от прошлого к будущему", 2005
Краткий отчет за 2004 год
В ходе выполнения проекта были получены следующие результаты:
1) Разработана иерархическая архитектура системы управления аниматом (модельным организмом, способным приспосабливаться к изменениям во внешней среде) на базе нейросетевых адаптивных критиков (adaptive critic designs), обучаемых на основе только поощрений/наказаний, поступающих из внешней среды.
2) Разработаны методы самообучения простых автономных адаптивных агентов на базе теории адаптивных критиков.
3) Разработаны модели самообучающихся мобильных роботов. Целевая функция робота состоит в выработке стереотипов поведения при обходе препятствий. Управляющая система робота построена на базе специальных нейроноподобных элементов и взаимосогласованно решает такие задачи, как автоматическая классификация, построение базы знаний, моделирование эмоций и принятие решений. Мобильный робот представлен программной моделью, имеет рулевое управление, реверсивный движитель, визуальные и тактильные датчики. Робот демонстрирует адаптивное (самообучаемое) управление в недетерминированной среде.
4) Разработаны принципы эволюционной оптимизации системы управления робота Khepera II.
5) Сделаны аналитические оценки эффективности эволюционных алгоритмов в постановке, соответствующей модели квазивидов М. Эйгена. Согласно этим оценкам для случая поиска экстремума унимодальной функции N бинарных переменных эволюционный алгоритм обеспечивает нахождение оптимума при анализе порядка N^2 вариантов.
6) Начато исследование взаимодействие обучения и эволюции в популяциях автономных адаптивных агентов.
Библиографический список публикаций по проекту 04-01-00179 (2004, 2005 гг.)
- Мосалов О.П., Прохоров Д.В., Редько В.Г. Модели принятия решений на основе нейросетевых адаптивных критиков // Девятая национальная конференция по искусственному интеллекту с международным участием КИИ-2004. Труды конференции в 3-х т. М.: Физматлит, 2004. т.3. С. 1156-1163.
- Мосалов О.П., Редько В.Г., Прохоров Д.В. Модель агента-брокера на основе нейросетевых адаптивных критиков // Сб. трудов Международной научно-технической конференции "Интеллектуальные системы, IEEE AIS'03", М.: Физматлит, 2004. Т. 1. С. 395-399.
- Мосалов О.П., Прохоров Д.В., Редько В.Г. Самообучающиеся агенты на основе нейросетевых адаптивных критиков // Искусственный интеллект. 2004, Т.3. С. 550-560.
- Red'ko V.G., Prokhorov D.V., Burtsev M.S. Theory of functional systems, adaptive critics and neural networks // International Joint Conference on Neural Networks, Proceedings, Budapest, 2004. PP. 1787-1792.
- Отоцкий П.Л., Редько В.Г. Модель обучения в иерархической структуре функциональных систем // Труды XLVII научной конференции МФТИ "Современные проблемы фундаментальных и прикладных наук". Часть I. Радиотехника и кибернетика. М.: МФТИ, 2004. С. 75-76.
- Попов Е.Е., Редько В.Г., Мосалов О.П., Непомнящих В.А. Модель поискового поведения анимата на основе простой схемы переключения тактик поисковой активности // Труды XLVII научной конференции МФТИ "Современные проблемы фундаментальных и прикладных наук". Часть I. Радиотехника и кибернетика. М.: МФТИ, 2004. С. 77-78.
- Редько В.Г. Задача моделирования когнитивной эволюции // Философия искусственного интеллекта. Материалы Всероссийской междисциплинарной конференции, М.: ИФ РАН, 2005. С. 321-323.
- Редько В.Г., Цой Ю.Р. Оценка эффективности эволюционных алгоритмов // Доклады АН. 2005. Т. 404. № 3. С. 312-315.
- Редько В.Г., Цой Ю.Р. Уточнение оценок эффективности эволюционных алгоритмов // Сб. трудов Международной научно-технической конференции "Интеллектуальные системы, IEEE AIS'03", М.: Физматлит, 2005. Т. 1. С. 7-11.
- Редько В.Г., Цой Ю.Р. Оценка эффективности простейшей версии генетического алгоритма. // Интегрированные модели и мягкие вычисления в искусственном интеллекте. Сборник трудов III-го Международного научно-практического семинара. М.: Физматлит, 2005. С. 281-286.
- Редько В.Г. Модели адаптивного поведения // Проблемы нейрокибернетики (материалы 14-й международной конференции по нейрокибернетике). Том 2. Ростов-на-Дону. Издательство ООО "ЦВВР". 2005. С. 160-163.
- Попов Е.Е., Редько В.Г., Непомнящих В.А. Моделирование поискового поведения анимата на основе принципов спонтанной активности // Проблемы нейрокибернетики (материалы 14-й международной конференции по нейрокибернетике). Том 2. Ростов-на-Дону. Издательство ООО "ЦВВР". 2005. С. 142-143.
- Red'ko V.G., Mosalov O.P., Prokhorov D.V. A model of Baldwin effect in populations of self-learning agents // International Joint Conference on Neural Networks, IJCNN 2005, Proceedings, Montreal, Canada. PP. 1355-1360.
- Редько В.Г. From Animal to Animat - направление исследований адаптивное поведение // От моделей поведения к искусственному интеллекту (Коллективная монография по ред. В.Г. Редько). М.: КомКнига (Изд-во УРСС, серия "Науки об искусственном"). 2006, С. 156-199.
- Редько В.Г. Проблема происхождения интеллекта и модели адаптивного поведения. // Научная сессия МИФИ - 2006. VIII Всероссийская научно-техническая конференция "Нейроинформатика-2006": Лекции по нейроинформатике. М.: МИФИ, 2006. С. 112-170.
- Мосалов О.П., Прохоров Д.В., Редько В.Г. Сравнение эволюции и обучения как методов адаптации агентов // Научная сессия МИФИ - 2006. VIII Всероссийская научно-техническая конференция "Нейроинформатика-2006": Сборник научных трудов. В 3-х частях. Ч.1. М.: МИФИ, 2006. С. 201-208..
- Редько В.Г. Модели адаптивного поведения - задел исследований когнитивной эволюции // Когнитивные исследования: Сборник научных трудов: Вып.1 / Под ред. В.Д. Соловьева. М.: Издательство "Институт психологии РАН", 2006. С. 49-68.
- Редько В.Г. Задача моделирования когнитивной эволюции // Искусственный интеллект: междисциплинарный подход. Под ред. Д.И. Дубровского и В.А. Лекторского - М.: ИИнтеЛЛ, 2006. С. 243-258.
- Red'ko V.G., Anokhin K.V., Burtsev M.S., Manolov A.I., Mosalov O.P., Nepomnyashchikh V.A., Prokhorov D.V. Project "Animat Brain": Designing the Animat Control System on the Basis of the Functional Systems Theory // The Ninth International Conference on the Simulation of Adaptive Behavior (SAB'06), 25 - 29 September 2006, CNR, Roma, Italy, Third Workshop on Anticipatory Behavior in Adaptive Learning Systems (ABiALS 2006), Proceedings.
- Редько В.Г. Каков естественный путь к искусственному интеллекту? // Психология. Журнал Высшей школы экономики. 2006. Т.3, № 2. С.95-101.
- Red'ko V.G. Neural Network Models of Adaptive Behavior // Математическая биология и биоинформатика: I Международная конференция, г. Пущино, 9-15 октября 2006 г.: Доклады / под ред. В.Д. Лахно. - М.: МАКС Пресс, 2006. С. 104-105.
- Редько В.Г. Модели адаптивного поведения // Математическая биология и биоинформатика: I Международная конференция, г. Пущино, 9-15 октября 2006 г.: Доклады / под ред. В.Д. Лахно. - М.: МАКС Пресс, 2006. С. 106-107.
- Мосалов О.П., Редько В.Г., Прохоров Д.В. Моделирование эволюции автономных адаптивных агентов // Математическое моделирование (принято в печать).
- Редько В.Г. Как промоделировать сознание? // Сборник по материалам Симпозиума "Сознание и Мозг" - Институт философии РАН, 30 ноября, 2006 (принято в печать).
|