Тема: АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ГЛАВА 1. МЕТОДЫ ПРЕДСТАВЛЕНИЯ ТЕКСТА В ВИДЕ ВЕКТОРНОГО ПРОСТРАНСТВА 5
1.1 Bag of words 5
1.2 Word2Vec 7
1.3 Doc2Vec 11
ГЛАВА 2. МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ ТЕКСТА 14
2.1 Рекуррентные нейронные сети 14
2.2 Random Forest 22
2.3 Support vector machine 24
ГЛАВА 3. ПРИМЕНЕНИЕ КЛАССИФИКАТОРОВ В АНАЛИЗЕ ТОНАЛЬНОСТИ ТЕКСТОВ 29
3.1 Условия проводимого эксперимента 29
3.2 Модели векторного представления пространства 31
3.3 Обучение и сравнение классификаторов 35
ЗАКЛЮЧЕНИЕ 41
СПИСОК ЛИТЕРАТУРЫ 42
ПРИЛОЖЕНИЕ 43
ЛИСТИНГ
📖 Введение
Одним из таких подходов для обработки данных является анализ эмоциональной окраски текста. Он позволяет оценить отношение автора текста к объекту, о котором он ведет речь. Анализ тональности, применённый к различному контенту, оставляемому пользователем в сети, позволяет разным организациям судить о качестве своей работы, а также предоставлять для пользователей контент, основанный на их предпочтениях.
Эмоциональная окраска текста может определяться различным образом. В данной работе рассматривается бинарный случай этой задачи. То есть, является ли отношение автора текста к описываемому объекту позитивным или негативным. Так же возможно задавать значение по вещественной шкале.
Целью данной работы является определение эмоциональной окраски рецензий к кинофильмам. С помощью построенной модели можно быстро и эффективно определять настроение широкой аудитории по отношению к той или иной кинокартине
Существует несколько различных подходов и методов для построения алгоритма определения эмоциональной окраски. Одними из самых популярных и сильно развивающихся в последнее время являются методы с использованием машинного обучения с учителем.
Для того, чтобы компьютер мог «понять» смысл текста, предоставленного для определения тональности, нужно сначала перевести естественный язык в понятный для компьютера формат. Для представления слов и документов в векторный вид, будем использовать различные инструменты для преобразования текста, такие как Bag of Words, Word2Vec, Doc2Vec.
Структура. Выпускная работа состоит’ из введения, трех глав, заключения, списка используемой литературы и приложения. В первой главе рассмотрены теоретические моменты моделей для построения векторного пространства. Во второй - рассмотрена структура классификаторов. А в третьей - проведен анализ и сравнение классификаторов, рассмотренных во второй главе. Тексты рецензий и соответствующие оценки взяты с сервиса Kinopoisk. После построения модели на обучающей выборке и получении хороших результатов на тестовой выборке, модели с наилучшими результатами проверялись на неразмеченных данных.



