📄Работа №185542

Тема: ИСПОЛЬЗОВАНИЕ ДИФФУЗИОННОЙ МОДЕЛИ ДЛЯ РАЗРЕШЕНИЯ КОРЕФЕРЕНЦИЙ

Характеристики работы

Тип работы Бакалаврская работа
Программирование
Предмет Программирование
📄
Объем: 49 листов
📅
Год: 2024
👁️
Просмотров: 65
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

АННОТАЦИЯ 3
Перечень условных обозначений, символов, сокращений, терминов 4
Введение 7
1. Структурное предсказание 9
1.1. Применение в бизнесе 9
1.2. Разрешение кореференций 10
2. Языковые модели 11
2.1. Основная идея языковых моделей 11
2.2. Токенизация 11
2.3. LLM 15
2.4. Диффузионные модели 17
3. DiffusionNER 20
3.1. Подход 20
3.2. Функция потерь 22
4. Решение задачи Preference resolution 23
4.1. Предыдущие работы 23
4.2. Набор данных 24
4.3. Анализ данных 24
4.4. Подход к решению задачи 26
4.5. Задача о назначениях 28
4.6. Функция потерь 29
5. Используемые метрики 31
5.1. Precision, Recall, F1 31
5.2. Пример кластеризации 32
5.3. MUC 33
5.4. B3 33
5.5. CEAFe 33
6. Имплементация 35
6.1. Ключевые библиотеки и фреймворки 35
6.2. Архитектура 35
6.3. Обучение 36
7. Тестирование разработанного подхода 38
7.1. Метрики качества 38
7.2. Скорость работы 39
7.3. Гиперпараметры 39
7.4. Среда для обучения модели 40
8. Результаты 41
Заключение 42
Список использованных источников и литературы 43

📖 Введение

Разрешение кореференций (Coreference resolution, [23]) - классическая задача в области обработки естественного языка (Natural Language Processing, NLP), которая заключается в выделении всех упоминаний одного и того же объекта в тексте. Разрешение кореференций — сложная задача, поскольку требует хорошего понимания контекста и способности распознавать сложные взаимосвязи между словами и фразами. Однако эта задача имеет решающее значение во многих приложениях, таких, как поиск информации [7], обобщение текста [20], ответы на вопросы [21], анализ настроений [16] и машинный перевод [27].
В данной работе исследуются возможности решения данной задачи с помощью языковой модели, использующей диффузионный подход, широко используемый в области компьютерного зрения.
Исследование данного подхода может помочь не только в понимании его перспективности, но и создать общий подход к решению задачи разрешения кореференций.
Данная работа вдохновлена работой [8], решающей задачу NER. на основе диффузионного подхода в пространстве низкой размерности, который описан в главе 4. Мы применяем аналогичный подход к решению задачи разрешения кореференций.
Проверка качества разработанного подхода производилась на англоязычной части датасета Ontonotes [28] с использованием устоявшихся для решаемой задачи метрик B-cube, CEAFe и MUC, описанных в главе 5.
С учетом вышесказанного, были выделены следующие основные задачи работы.
Задачи работы:
1. Проверить работоспособность решения для задачи NER, на основе которого делается работа.
2. Преобразовать датасет Ontonotes в подходящий для модели формат и разделить на обучающую, валидационную и тестовую выборки.
3. Сформировать и проверить гипотезы по способам адаптации выбранного решения к задаче разрешения кореференций.
4. Измерить метрики качества работы модели и проанализировать результаты.
5. Сформулировать выводы касательно эффективности разработанного подхода в сравнении с альтернативными решениями.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

Описанное решение реализовано в виде программного модуля с возможностью запуска экспериментов с различными гиперпараметрами.
Качество работы представленного подхода работает хорошо для локализаций упоминаний и удовлетворительно для связывания упоминаний между собой, поэтому следует продолжить исследование способов связывания упоминаний.
Примененный к локализации подход возможно использовать в других задачах, где требуется нахождение промежутков токенов в тексте
Результаты данной работы оформлены в статью «Диффузионное разрешение кореференций» и будут опубликованы в сборнике в рамках XXI Международной научно-практической конференции студентов, аспирантов и молодых ученых «МОЛОДЕЖЬ И СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ» [22].

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Марковъ А.А. ПримЬръ статистическаго изслЬдовашя надъ текстомъ “Евгешя ОнЬгина”, иллюстрирующш связь испытаны въ цЬпь // ИзвЬстхя Императорской Академы Наукъ. VI серхя. 1913. Vol. 7, № 3. P. 153-162.
2. Машинное обучение : сайт. - URL:
https://education.yandex.ru/handbook/ml/article/mashinnoye-obucheniye (дата
обращения: 07.02.2024)
3. Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is all you need. In Advances in Neural Information Processing Systems, volumes 2017- Decem, pages 5999-6009.
4. Attention is All you Need / A. Vaswani, N. Shazeer, N. Parmar [и др.] // Advances in Neural Information Processing Systems 30 . - Long Beach California USA : Curran Associates Inc., 2017. - С. 6000-6010.
5. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding / J. Devlin, M.W. Chang, K. Lee, K. Toutanova // Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). - Minneapolis, Minnesota : Association for Computational Linguistics, 2019. - С. 4171-4186.
6. Bohnet B., Alberti C., Collins M. Coreference Resolution through a seq2seq Transition-Based System //Transactions of the Association for Computational Linguistics. - 2023. - Т. 11. - С. 212-226.
7. Brack A. et al. Coreference resolution in research papers from multiple domains //Advances in Information Retrieval: 43rd European Conference on IR Research, ECIR 2021, Virtual Event, March 28-April 1, 2021, Proceedings, Part I 43. - Springer International Publishing, 2021. - С. 79-97.
8. DiffusionNER: Boundary Diffusion for Named Entity Recognition / Y. Shen, K. Song, X. Tan [и др.] // Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). - Toronto, Canada : Association for Computational Linguistics, 2023. - С. 3875-3890.
9. Dobrovolskii V. Word-level coreference resolution //arXiv preprint arXiv:2109.04127.-2021.
10. Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel, C., Shazeer, N., Roberts, A., N. Shazeer, A. Roberts [и др.] // Journal of machine learning research. - 2020. - № 21. - С. 1-67.
11. Harris, Z. Distributional structure / Z. Harris // Word. - 1954. - Т. 10, № 2-3. - С. 146-162.
12. Ho, J. Denoising diffusion probabilistic models / J. Ho, A. Jain, P. Abbeel // Proceedings of the 34th International Conference on Neural Information Processing Systems . - Red Hook NY US : Curran Associates Inc., 2020. - С. 6840-6851. - ISBN 9781713829546
13. Improving Language Understanding by Generative Pre-Training / A. Radford, K. Narasimhan, T. Salimans, I. Sutskever // Open AI Index : электронный журнал.
- URL: https://openai.com/index/language-unsupervised/. - Дата публикации: 11.06.2018.
14. J. Sohl-Dickstein, E. Weiss, N. Maheswaranathan, and S. Ganguli. Deep unsupervised learning using nonequilibrium thermodynamics. In International Conference on Machine Learning, pages 2256-2265, 2015.
15. Kirstain Y., Ram O., Levy O. Coreference resolution without span representations //arXiv preprint arXiv:2101.00434. - 2021.
..29

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.
Предоставляемые услуги, в том числе данные, файлы и прочие материалы, подготовленные в результате оказания услуги, помогают разобраться в теме и собрать нужную информацию, но не заменяют готовое решение.
Укажите ник или номер. После оформления заказа откройте бота @workspayservice_bot для подтверждения. Это нужно для отправки вам уведомлений.

©2026 Cервис помощи студентам в выполнении работ