Название работы: | Разработка веб-сервиса персонализированных рекомендаций для систематизации и управления знаниями |
Автор: | Копытов Павел Вячеславович |
Научный руководитель: | Пикулев Виталий Борисович |
Группа: | 21417 |
Год выпуска: | 2021 |
Статус работы: | ВКР на соискание степени бакалавра, защищена на "отлично" |
Ключевые слова: | Natural Language Processing, рекомендательные системы, векторное представление слов, Word2Vec, Doc2Vec |
Оригинальность от Антиплагиат.ВУЗ: | 99% |
Реферат: |
Цель работы — исследование и разработка рекомендательной системы с использованием современных методов векторизации слов для статей из различных источников. Система собирает новые статьи с доверенных сайтов, а также прочие статьи, прошедшие модерацию, обрабатывает их, а затем — рекомендует пользователю в соответствии с внутренними правилами. Для рекомендаций используется векторизация документов, при которой каждый документ представляется в виде вектора в n-мерном пространстве (общем для всех документов). Вектора документов — результат обучения нейросетевой модели (техника Doc2Vec). После обучения с векторами документов возможно производить математические операции, например, найти ближайший к текущему вектор документа. При этом, «ближайший» в векторном пространстве документ будет близок к данному семантически. Именно на этом принципе и основана рекомендательная система. В ходе работы проведён аналитический обзор современной научно-технической литературы, затрагивающей следующие проблемы: извлечение текстовой информации с веб-страниц, обработка и очистка текстовой информации, технологии векторизации слов, рекомендательные системы (в том числе — с использованием векторизации слов). В первом разделе рассматриваются теоретические основы работы, методы извлечения и обработки текста, а также возможности создания рекомендательной системы с использованием современных нейросетевых методов. Во втором разделе рассматриваются существующие инструменты для работы с текстом (обработка и подготовка). Исследуется время обучения модели Doc2Vec в зависимости от ряда параметров. Проектируется и разрабатывается рекомендательная система на основе техник векторизации. |
Ссылка на файл текста дипломной работы доступна только зарегистрированным пользователям: |