Ученые ТПУ ищут лидеров мнений в соцсетях с помощью методов машинного обучения
Научная группа под руководством доцента отделения информационных технологий Елены Луневой разрабатывает сервис, с помощью которого можно идентифицировать в социальных сетях пользователей – экспертов в заданной предметной области.
Программный сервис (веб-приложение) можно будет использовать для выполнения социологических, политических и других исследований. Он позволит оценивать компетентность выбранного пользователя в определенной теме, а также подбирать группы потенциальных участников для проведения экспертиз в предметных областях. Приложение пригодится компаниям и организациям для решения задач антитеррористической направленности, политической аналитики, прогнозирования репутационных рисков, оценки спроса на товар или услугу, мониторинга общественного мнения.
Приложение позволит пользователям выгружать данные из соцсетей, визуализировать их, выявлять экспертов, сохранять полученные результаты в личном кабинете и экспортировать их.
На сегодня, по словам Елены Луневой, разработана часть методов, способов и алгоритмов, которые могут лечь в основу сервиса. Например — способ идентификации экспертов, учитывающий количественные данные их активности в социальной сети. В отличие от существующих, этот способ позволяет получить дополнительные сведения о тех, кто находится под влиянием лидеров мнений, а также скрытых экспертах. Кроме того, разработан способ определения в группе лидеров пользователей с предвзятой оценкой или признаками поведения интернет-тролля.
"Тролли могут быть очень популярными, и к их мнению прислушиваются, однако их публикации часто направлены лишь на создание социальной провокации для достижения большей узнаваемости авторов. Таким образом, строя социальный граф, полученный по публикациям в соцсети (мы использовали Twitter), мы сначала очищаем его от пользователей-троллей и только потом применяем методы для идентификации пользователей-экспертов", — говорит руководитель группы.
Создана алгоритмическая база, а также архитектура классификатора текстовых сообщений на основе нейронных сетей CNN и LSTM. Ансамблевая архитектура повышает точность классификации эмоционального тона сообщений, а алгоритмы предварительной проверки входных данных на уровне слов и символов позволяют выполнять настройку классификатора для большей достоверности результата.
Работа началась несколько лет назад во время стажировки Елены Луневой в университете Саутгемптона (Англия), в 2017-2018 годы авторы получили поддержку РФФИ. Сейчас научная группа планирует привлечь к работе инициативных студентов и аспирантов.
"Влияние соцсетей на формирование общественного мнения сложно переоценить. В ТПУ активно поддерживается направление анализа данных средствами машинного обучения и искусственного интеллекта, поэтому я надеюсь, что наш проект будет развиваться", — говорит Елена Лунева.
Досье "Цифровой экономики"
Социальный граф — это основной актив социальных сетей, узлы которого — аккаунты пользователей в социальной сети, а ребра — связи между ними.