Научным коллективом сотрудников Института компьютерных технологий и информационной безопасности ЮФУ под руководством профессора Курейчика В.М. в 2018-2021 гг. выполнен междисциплинарный проект РФФИ № 18-29-22019 «Разработка интеллектуальных систем-ассистентов, обеспечивающих безопасность и эффективность деятельности обучающегося в Интернет-пространстве, на основе биологически правдоподобных методов машинного обучения».
На первом годовом этапе выполнения проекта были в комплексе решены все поставленные задачи. Основными полученными научными результатами являются:
Достигнутые цели поддерживают фундаментальную научную проблему необходимости развития биологически правдоподобных методов машинного обучения, моделирования, прогнозирования и сопровождения эффективной и психологически безопасной информационно-образовательной деятельности человека. Принципиальным отличием полученных научных результатов от имеющихся аналогов является создание условий для возникновения прорывных и перспективных технологий разработки интеллектуальных информационных систем.
Полученные результаты первого годового этапа проекта опубликованы в 21 научной работе, в том числе в 5-ти коллективных монографиях; в 5-ти статьях в изданиях из перечня ВАК и в 5-ти статьях, проиндексированных в базах Web of Science и Scopus. Коллектив принял участие в 8-ми научных мероприятиях по тематике проекта, на которых были представлены: 1 пленарный и 8 секционных докладов. Получено 2 результата-объекта интеллектуальной собственности.
На втором годовом этапе выполнения проекта были в комплексе решены все поставленные задачи. Основными полученными научными результатами являются:
1. Определены ключевые индивидуальные предикторы, обусловливающие эффективность и безопасность информационно-образовательной деятельности обучающихся в Интернет-пространстве. Эмпирически изучены и систематизированы индивидуальные сценарии поведения обучающихся в информационно-образовательном Интернет-пространстве в зависимости от индивидуальных особенностей. Разработаны типовые сценарии поведения обучающихся в информационно-образовательном Интернет-пространстве.
2. Построена онтологическая структура междисциплинарного информационного пространства на основе системы семантических отношений между понятиями Интернет-контента для выявления и анализа скрытых закономерностей, указывающих на виктимное воздействие Интернет-пространства на пользователя. Создана информационная модель и разработан метод интеграции знаний на основе принципа силовой релаксации с использованием подсистемы оценки обстановки коалицией интеллектуальных агентов для определения высокоуровневых, семантически и прагматически значимых критериев безопасности и эффективности взаимодействия пользователя с Интернет- пространством. Разработан метод онтологического описания структуры знаний междисциплинарного информационного пространства, позволяющий устранить структурные и семантические конфликты в процессе накопления и обработки элементов знаний, извлекаемых из предметных областей с устойчивыми междисциплинарными связями.
3. Разработаны методологические основы изучения и моделирования поведения обучающегося в Интернет-пространстве, а также обоснованы обусловленности этих моделей индивидуальными личностными особенностями. Построены конкретные информационные модели, проведено их обоснование и выявление педагогических условий для повышения эффективности взаимодействия обучающегося и Интернет-пространства. Спроектирована и разработана микросервисная архитектура интеллектуальных интернет-сервисов, использующих объектно-ориентированные структуры данных о поведении пользователей, собираемых из разнородных источников, в том числе с применением систем считывания нейрофизиологических показателей.
4. Разработана биологически правдоподобная модель и метод коллаборативной и контентной фильтрации для онлайновых рекомендательных систем-ассистентов, отличающийся масштабируемостью, способностью обрабатывать разреженные данные, нечувствительностью к «холодному старту». Построена модель рекомендательной системы, сочетающей преимущества гибридной модели фильтрации и свободной от недостатков и ограничений коллаборативной фильтрации, с поиском оптимизированных решений на основе применения биоинспирированного алгоритма.
5. Разработаны эффективные алгоритмы кластеризации знаний в интеллектуальных системах-ассистентах, основанных на канонических роевых моделях поведения стаи обезьян и стаи волков, способных находить решение с заданным уровнем точности при обработке Интернет-контента. Основным преимуществом данных алгоритмов является новый механизм передвижения агентов во время осуществления поисковых процедур и оригинальная кодировка решений.
Также были получены следующие дополнительные научные результаты:
– проведен анализ угроз, связанных с определенными сценариями реализации поисковых процедур, проявляющихся в поисковой деятельности;
– описаны критерии оценки неэффективных и эффективного сценариев поиска. Среди признаков, указывающих на возможность наличия угрозы, выделены следующие основные: уход от решения задачи в бесцельную навигацию или к привлекательным ресурсам, поверхностный поиск, отсутствие смыслового погружения в решение поисковой задачи, хаотичные действия при поиске;
– для определения наличия неблагоприятных признаков построена система показателей. Сформулированы признаки эффективного сценария организации поиска в Интернет-пространстве, описаны варианты наличия неявных угроз для подобной ситуации;
– представлен подход идентификации описанных угроз с учетом заданных критериев оценки различных сценариев поведения пользователя в глобальном информационном пространстве. Разработан алгоритм машинного обучения для идентификации проблемных сценариев путем сравнения с ключевыми паттернами поведения;
– создана программная реализация подсистемы идентификации информационных угроз, проведены экспериментальные исследования для подтверждения эффективности подсистемы.
Получены теоретическая и экспериментальная оценки эффективности разработанных моделей, методов, архитектур, сценариев и алгоритмов. Для проведения экспериментальных исследований на высокопроизводительных вычислительных системах разработан программно-алгоритмический комплекс, реализующий разработанные методы и алгоритмы, как на уровне работы кластера, так и на уровне компьютерной реализации.
Достигнутые цели поддерживают фундаментальную междисциплинарную научную проблему необходимости развития биологически правдоподобных методов машинного обучения, моделирования, прогнозирования и сопровождения эффективной и психологически безопасной информационно-образовательной деятельности человека. Принципиальным отличием полученных научных результатов от имеющихся аналогов является создание условий для возникновения прорывных и перспективных технологий разработки интеллектуальных информационных систем.
Полученные результаты второго годового этапа проекта опубликованы в 15 научных работах, в том числе в главе 1-ой коллективной монографии; в 6-ти статьях в изданиях из перечня ВАК и в 4-х статьях, проиндексированных в базах Web of Science и/или Scopus. Коллектив принял участие в 7-ми научных мероприятиях по тематике проекта, на которых были представлены: 3 пленарных и 5 секционных докладов. Получен 1 результат-объект интеллектуальной собственности.
На финальном этапе выполнения междисциплинарного проекта были в комплексе решены все поставленные задачи:
1. Выявлен спектр способов, форм и содержания сопровождения информационно-образовательной деятельности обучающихся в интернет-пространстве. На основе разработанных на втором этапе типовых сценариев поведения обучающихся в информационно-образовательном Интернет-пространстве создание обогащенного сценария эффективной и безопасной поисково-познавательной деятельности обучающегося в интернет-пространстве, характеризующего коррекцию рискогенных действий и желаемую динамику в условиях сопровождающих воздействий.
2. Построена многоуровневая архитектура интеллектуальной системы-ассистента для обработки междисциплинарных ресурсов распределенных разнородных знаний на основе интеллектуального анализа Интернет-контента и поисковых запросов пользователя с использованием комплекса хранилищ данных онтологии предметных областей, case- моделей и прецедентов успешных информационных процессов в Интернет-сервисах, позволяющая идентифицировать неявные зависимости и закономерности на множестве распределенных разнородных элементов знаний на основе поиска и обработки опосредованных отношений.
3. Разработаны и исследованы ситуационные и имитационные модели и сценарии поведения на основе технологий виртуальной и дополненной реальности для поддержки психологически безопасного поведения в информационном пространстве и расширения функциональных возможностей когнитивных ассистентов в области визуализации процессов интеллектуального анализа данных и принятия решений в целях парирования деструктивных нейрокогнитивных воздействий результатов реализации процедур обработки информационных ресурсов большой размерности, позволяющие проанализировать значительное количество альтернативных решений.
4. Разработан биологически правдоподобный алгоритм для задач оптимизации и обработки больших данных в Интернет-пространстве. Предложены процедуры интеграции созданного биологически правдоподобного алгоритма в разработанную на предыдущих этапах рекомендательную систему-ассистента для решения задач оптимизации и обработки больших данных в Интернет-пространстве. Новизна алгоритма заключается в объединении преимуществ иерархической структуры популяции и когнитивного оператора мутации для поддержки разнообразия популяции и использованию перспективных областей поискового пространства. Проведено экспериментальное сравнение алгоритма с конкурирующими методами, оценка точности и времени работы алгоритма для решения задач трудных многоэкстремальных оптимизационных задач на известных многомерных оптимизационных функциях-бенчмарках.
5. Разработан метод оценки семантической близости элементов знаний междисциплинарного информационного пространства с целью развития технологий интеллектуального анализа Интернет-контента на основе биологически правдоподобных алгоритмов машинного обучения, позволяющий повысить достоверность определяемой системы отношений между знаниями и снизить из избыточность.
6. Разработан программный комплекс. Проведены экспериментальные исследования. Полученные результаты сопоставлены с аналогами. Получены теоретическая и экспериментальная оценки разработанных моделей, методов и алгоритмов. Определена научная новизна и значимость результатов выполнения проекта. Выработаны рекомендации по эффективному использованию разработанных алгоритмов и программ, а также даны предложения по их дальнейшему развитию и совершенствованию.