© ComNews
19.11.2019

"Билайн" (ПАО "ВымпелКом") и Contrapunto при поддержке "Яндекса" запустили проект, в рамках которого была разработана нейросеть, позволяющая анализировать тексты произведений классической литературы и рэп-хитов.

Чтобы найти и обработать массивы данных, "Билайн" обратился к специалистам из "Яндекса", которые предложили уникальное технологическое решение, состоящее из двух этапов работы. На первом использовали технологии machine learning: строили проекции предложений в векторы в пространстве semantic sentence embedding, и затем в этом пространстве искали ближайших соседей при помощи собственных наработок "Яндекса" в этой области. На втором этапе результаты подвергались ручной фильтрации и доработке.

Таким образом получилось проанализировать треки популярных рэп-исполнителей и наглядно отобразить литературные отсылки в их хитах. Например, Big Baby Tape заимствует строки у Бродского, ЛСП отсылает к Пушкину и Экзюпери, а Хаски и ATL — к Пелевину.

Благодаря проведенному анализу текстов песен и произведений литературы, составлен список книг, которые рекомендовано прочитать, чтобы лучше понимать русский рэп. Для удобства пользователей ко всем цитатам добавлены ссылки на соответствующие произведения на Bookmate.

"Практически сразу после выхода клипа Noize MC "Почитай старших" на YouTube появились видео с разбором песни: блогеры искали в ней цитаты классиков и расшифровывали неявные отсылки. Вообще декодировать рэп — это одно из любимых занятий фанатов: в сети полно роликов, где интерпретируют строчки из рэп-хитов и ищут скрытые смыслы. Поэтому мы решили сделать свой "мета-разбор" и показать связи рэпа и литературы масштабно и наглядно — с применением machine learning. Это как нельзя лучше отражает идею всего проекта "Почитай старших" о литературных заимствованиях и необходимости постоянно расширять свой читательский опыт, чтобы понимать их", - рассказала копирайтер Contrapunto Алина Зарипова.

"Мы постоянно работаем над тем, чтобы находить максимально полезное применение новейших разработок для наших клиентов. Проект "Почитай старших" стал ярким примером такого использования технологий: machine learning находит взаимосвязь между рэп-хитами и литературными произведениями. После запуска клипа мы увидели первую реакцию пользователей и поняли, что создали интересный продукт — люди с большим удовольствием анализируют тексты сами, вспоминают стихи и произведения, угадывают стиль писателей. Мы обрались в "Яндекс", чтобы сделать этот процесс более технологичным и увлекательным. Это значит, что читающих клиентов "Билайн" станет больше", - отметила руководитель департамента интегрированных коммуникаций ПАО "ВымпелКом" Оксана Трофимова.