Аналитическая платформа выявления и прогнозирования девиантного поведения пользователей социальных сетей на основе композиции и сопоставления неструктурированных данных различных медиаресурсов

Проект по Соглашению о предоставлении субсидии от 03.10.2016 г. № 14.578.21.0196 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» 

Тема: «Аналитическая платформа выявления и прогнозирования девиантного поведения пользователей социальных сетей на основе композиции и сопоставления неструктурированных данных различных медиаресурсов» 

Цель проекта 

1. Разработка научных и программно-технических решений для сбора, обработки и анализа больших объемов данных в социальных сетях и иных медийных ресурсах Интернета с целью выявления пользователей со скрытым девиантным поведением для обеспечения промышленности и населения новыми видами информационных услуг. 

2. Вывод на рынок новой научно-технической продукции мирового уровня - информационных сервисов поиска и анализа информации в Интернет на основе аналитической платформы выявления и прогнозирования девиантного поведения пользователей социальных сетей. 

Основные результаты проекта 

1. Информационная модель агрегированного пространственно-временного профиля поведения субъекта в сети Интернет, отражающая особенности его эмоционального состояния и топологической структуры связей. 

2. Математическая модель агрегированного пространственно-временного профиля поведения субъекта в сети Интернет, в параметрической форме учитывающая динамику изменения эмоционального состояния субъекта и структуру связи. 

3. Метод идентификации параметров математической модели агрегированного профиля на популяционном уровне на основе семантического поиска, сопоставления и агрегации данных о деятельности субъекта в различных социальных медиа. 

4. Метод выявления потенциально девиантного поведения на основе статистического сравнения характеристик профиля субъекта с эталонными классами. 

5. Предметно-ориентированный язык программирования (набор лексических, синтаксических и семантических правил, а также методов их трансляции) для унифицированной высокоуровневой формализации запросов и сценариев сбора данных в различных социальных медиа. 

6. Экспериментальный образец аналитической платформы для выявления и прогнозирования девиантного поведения пользователей социальных сетей на основе композиции и сопоставления неструктурированных данных различных медиаресурсов. 

Основными характеристиками полученных результатов являются: 

- возможность использования разработанной моделей для описания профиля поведения пользователя, как на популяционном уровне, так и на индивидуальном с четырьмя основными классами критериев (статистических, сентимент-семантичеких, пространственно-временных, топологических). 

- возможность применения методов выявления девиантного поведения для неограниченных классов с использованием разработанного алгоритма предварительного расширения девиантной выборки с привлечением эксперта и алгоритма идентификации девиантов на основе экспертно подтвержденной выборки. 

- возможность выполнения запросов поиска в рамках трех выделенных стратегий одновременно по разнородным источникам, 

используя унифицированный предметно-ориентированный язык (DSL) и введенные высокоуровневые сущности. 

- разработанный программный комплекс имеет распределенную масштабируемую архитектуру, что позволяет при достаточной пропускной способности внешнего канала и достаточном количестве служебных учетных записей существенно превышать показатели по скорости сбора данных установленные в рамках ТЗ. 

Полученные результаты обладают высокой научной новизной, что подтверждают публикации в международных изданиях, индексируемых в базе данных Scopus. 

Соответствие полученных результатов требованиям к выполняемому проекту подтверждается, как соблюдением формальных требований технического задания, так и результатами экспериментальных исследований, демонстрирующих целесообразность использования выбранных подходов для решения задач проекта и достижения целевых показателей разрабатываемых решений. 

Решение, реализуемое в рамках проекта, не имеет прямых аналогов, поскольку сочетает в себе комплексность сбора и обработки разнородных источников больших данных (VK, Twitter, Instagram) на основе уникальной вычислительной платформы и разработанную методологию выявления девиантного поведения пользователей медиаресурсов для различных практических задач. 

Назначение и область применения результатов проекта 

1) Областью применения результатов проекта является создание инструментальной платформы для решения задач, связанных с выявлением девиантного поведения как на индивидуальном, так и на популяционном уровне. Эта платформа может быть использована: 

- как составная часть многофункциональной системы поддержки принятия решения, оперирующая результатами анализа данных медиа ресурсов; 

- как инструмент для анализа и моделирования процессов девиантного поведения в различных предметных областях, имеющих отражение в цифровом пространстве, объединяющем разнородные источники данных, в том числе, социальные сети (VK, Twitter, Instagram), информационные порталы (Lenta.ru, News.yandex), форумы (antijob) и другие онлайн сервисы (Avito). 

2) Комплекс разрабатываемых научно-технических решений может применятся для организации перспективных распределенных архитектур обработки неоднородных социальных медиа источников в едином пространстве представления данных для задач выявления девиантных отклонений в различных предметных областях. 

3) Учитывая темпы развития информационных технологий в области анализа данных и искусственного интеллекта, а также публичных интернет сервисов массового обслуживания с интегрированными механизмами в их основе, прогноз эффектов от влияния данной разработки на существующие научно-технические и социально-экономические системы затруднен.

Эффекты от внедрения результатов проекта 

Практическое внедрение результатов может быть целесообразно в составе систем аналитической поддержки HR-служб, кадровых агентств, службы безопасности финансовых учреждений, а также органы государственной власти. Эффект от применения результатов проекта будет заключатся в повышении качества отбора приема новых сотрудников, повышения дисциплины, и как следствие работоспособности сотрудников компании, выявление отклонений в различных социальных вопросах города, в том числе наркомании. 

Формы и объемы коммерциализации результатов проекта 

Формой коммерциализации результатов проекта является аналитическая платформа в виде набора облачных сервисов под управлением платформы CLAVIRE, что обеспечивает его применимость даже для компаний среднего и малого бизнеса. 

Основными потребителями коммерческих услуг будут организации, специализирующиеся на разработке программного обеспечения, а также системные интеграторы. Их клиентами могут быть различные группы компаний, деятельность которых непосредственно связана с человеческим капиталом или оказанием услуг частным лицам. Также предполагается разработать ТЗ на выполнение ОКР. 

Комиссия Минобрнауки России признала обязательства по Соглашению на отчетном этапе исполненными надлежащим образом.