Тип работы:
Предмет:
Язык работы:


ИСПОЛЬЗОВАНИЕ ДИФФУЗИОННОЙ МОДЕЛИ ДЛЯ РАЗРЕШЕНИЯ КОРЕФЕРЕНЦИЙ

Работа №185542

Тип работы

Бакалаврская работа

Предмет

программирование

Объем работы49
Год сдачи2024
Стоимость4490 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
18
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 3
Перечень условных обозначений, символов, сокращений, терминов 4
Введение 7
1. Структурное предсказание 9
1.1. Применение в бизнесе 9
1.2. Разрешение кореференций 10
2. Языковые модели 11
2.1. Основная идея языковых моделей 11
2.2. Токенизация 11
2.3. LLM 15
2.4. Диффузионные модели 17
3. DiffusionNER 20
3.1. Подход 20
3.2. Функция потерь 22
4. Решение задачи Preference resolution 23
4.1. Предыдущие работы 23
4.2. Набор данных 24
4.3. Анализ данных 24
4.4. Подход к решению задачи 26
4.5. Задача о назначениях 28
4.6. Функция потерь 29
5. Используемые метрики 31
5.1. Precision, Recall, F1 31
5.2. Пример кластеризации 32
5.3. MUC 33
5.4. B3 33
5.5. CEAFe 33
6. Имплементация 35
6.1. Ключевые библиотеки и фреймворки 35
6.2. Архитектура 35
6.3. Обучение 36
7. Тестирование разработанного подхода 38
7.1. Метрики качества 38
7.2. Скорость работы 39
7.3. Гиперпараметры 39
7.4. Среда для обучения модели 40
8. Результаты 41
Заключение 42
Список использованных источников и литературы 43

Разрешение кореференций (Coreference resolution, [23]) - классическая задача в области обработки естественного языка (Natural Language Processing, NLP), которая заключается в выделении всех упоминаний одного и того же объекта в тексте. Разрешение кореференций — сложная задача, поскольку требует хорошего понимания контекста и способности распознавать сложные взаимосвязи между словами и фразами. Однако эта задача имеет решающее значение во многих приложениях, таких, как поиск информации [7], обобщение текста [20], ответы на вопросы [21], анализ настроений [16] и машинный перевод [27].
В данной работе исследуются возможности решения данной задачи с помощью языковой модели, использующей диффузионный подход, широко используемый в области компьютерного зрения.
Исследование данного подхода может помочь не только в понимании его перспективности, но и создать общий подход к решению задачи разрешения кореференций.
Данная работа вдохновлена работой [8], решающей задачу NER. на основе диффузионного подхода в пространстве низкой размерности, который описан в главе 4. Мы применяем аналогичный подход к решению задачи разрешения кореференций.
Проверка качества разработанного подхода производилась на англоязычной части датасета Ontonotes [28] с использованием устоявшихся для решаемой задачи метрик B-cube, CEAFe и MUC, описанных в главе 5.
С учетом вышесказанного, были выделены следующие основные задачи работы.
Задачи работы:
1. Проверить работоспособность решения для задачи NER, на основе которого делается работа.
2. Преобразовать датасет Ontonotes в подходящий для модели формат и разделить на обучающую, валидационную и тестовую выборки.
3. Сформировать и проверить гипотезы по способам адаптации выбранного решения к задаче разрешения кореференций.
4. Измерить метрики качества работы модели и проанализировать результаты.
5. Сформулировать выводы касательно эффективности разработанного подхода в сравнении с альтернативными решениями.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Описанное решение реализовано в виде программного модуля с возможностью запуска экспериментов с различными гиперпараметрами.
Качество работы представленного подхода работает хорошо для локализаций упоминаний и удовлетворительно для связывания упоминаний между собой, поэтому следует продолжить исследование способов связывания упоминаний.
Примененный к локализации подход возможно использовать в других задачах, где требуется нахождение промежутков токенов в тексте
Результаты данной работы оформлены в статью «Диффузионное разрешение кореференций» и будут опубликованы в сборнике в рамках XXI Международной научно-практической конференции студентов, аспирантов и молодых ученых «МОЛОДЕЖЬ И СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ» [22].



1. Марковъ А.А. ПримЬръ статистическаго изслЬдовашя надъ текстомъ “Евгешя ОнЬгина”, иллюстрирующш связь испытаны въ цЬпь // ИзвЬстхя Императорской Академы Наукъ. VI серхя. 1913. Vol. 7, № 3. P. 153-162.
2. Машинное обучение : сайт. - URL:
https://education.yandex.ru/handbook/ml/article/mashinnoye-obucheniye (дата
обращения: 07.02.2024)
3. Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is all you need. In Advances in Neural Information Processing Systems, volumes 2017- Decem, pages 5999-6009.
4. Attention is All you Need / A. Vaswani, N. Shazeer, N. Parmar [и др.] // Advances in Neural Information Processing Systems 30 . - Long Beach California USA : Curran Associates Inc., 2017. - С. 6000-6010.
5. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding / J. Devlin, M.W. Chang, K. Lee, K. Toutanova // Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). - Minneapolis, Minnesota : Association for Computational Linguistics, 2019. - С. 4171-4186.
6. Bohnet B., Alberti C., Collins M. Coreference Resolution through a seq2seq Transition-Based System //Transactions of the Association for Computational Linguistics. - 2023. - Т. 11. - С. 212-226.
7. Brack A. et al. Coreference resolution in research papers from multiple domains //Advances in Information Retrieval: 43rd European Conference on IR Research, ECIR 2021, Virtual Event, March 28-April 1, 2021, Proceedings, Part I 43. - Springer International Publishing, 2021. - С. 79-97.
8. DiffusionNER: Boundary Diffusion for Named Entity Recognition / Y. Shen, K. Song, X. Tan [и др.] // Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). - Toronto, Canada : Association for Computational Linguistics, 2023. - С. 3875-3890.
9. Dobrovolskii V. Word-level coreference resolution //arXiv preprint arXiv:2109.04127.-2021.
10. Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel, C., Shazeer, N., Roberts, A., N. Shazeer, A. Roberts [и др.] // Journal of machine learning research. - 2020. - № 21. - С. 1-67.
11. Harris, Z. Distributional structure / Z. Harris // Word. - 1954. - Т. 10, № 2-3. - С. 146-162.
12. Ho, J. Denoising diffusion probabilistic models / J. Ho, A. Jain, P. Abbeel // Proceedings of the 34th International Conference on Neural Information Processing Systems . - Red Hook NY US : Curran Associates Inc., 2020. - С. 6840-6851. - ISBN 9781713829546
13. Improving Language Understanding by Generative Pre-Training / A. Radford, K. Narasimhan, T. Salimans, I. Sutskever // Open AI Index : электронный журнал.
- URL: https://openai.com/index/language-unsupervised/. - Дата публикации: 11.06.2018.
14. J. Sohl-Dickstein, E. Weiss, N. Maheswaranathan, and S. Ganguli. Deep unsupervised learning using nonequilibrium thermodynamics. In International Conference on Machine Learning, pages 2256-2265, 2015.
15. Kirstain Y., Ram O., Levy O. Coreference resolution without span representations //arXiv preprint arXiv:2101.00434. - 2021.
..29


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ