🔍 Поиск готовых работ

🔍 Поиск работ

МЕТОДИКА СНЯТИЯ КОНЦЕПТУАЛЬНОЙ НЕОДНОЗНАЧНОСТИ В ТЕКСТАХ ПРЕДМЕТНОЙ ОБЛАСТИ «ИССЛЕДОВАНИЕ ИНТЕГРАТИВНОЙ ФИЗИОЛОГИИ СПОРТСМЕНОВ»

Работа №202401

Тип работы

Дипломные работы, ВКР

Предмет

лингвистика

Объем работы68
Год сдачи2023
Стоимость4200 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
16
Не подходит работа?

Узнай цену на написание


Введение
ГЛАВА 1 КОНЦЕПТУАЛЬНАЯ НЕОДНОЗНАЧНОСТЬ КАК
ПРОБЛЕМА АВТОМАТИЧЕСКОЙ РАЗМЕТКИ ТЕКСТА 7
1.1 Разметка корпуса текстов 7
1.1.1 Понятие разметки 7
1.1.2 Автоматическая разметка 13
1.1.3 Проблемы автоматической разметки 14
1.2 Концептуальная неоднозначность 15
1.2.1 Неоднозначность и способы её разрешения 15
Выводы по главе 1 20
ГЛАВА 2 СНЯТИЕ КОНЦЕПТУАЛЬНОЙ НЕОДНОЗНАЧНОСТИ 21
2.1 Корпусы текстов 21
2.2 Базы данных 21
2.2.1 База предложений 22
2.2.2 База фраз 22
2.2.3 База параллельных корпусов 23
2.2.4 База неоднозначностей 23
2.3 Анализ 24
2.3.1 Концепт «Продукты жизнедеятельности» (OD) 25
2.3.2 Концепт «Единица измерения» (MU) 28
2.3.3 Концепт «Параметры измерения» (MP) 31
2.3.4 Концепт «Медикаментозное лечение» (TM) 33
2.3.5 Концепт «Исследование» (J) 35
2.3.6 Концепт «Результат обследования» (ER) 38
2.3.7 Концепт «Прочее» (O) 41
2.3.8 Концепт «Процесс лечения» (TR) 44
2.3.9 Тэг «Предикативная группа» (R) 46
2.3.10 Тэг «Именная группа» (PO) 49
Выводы по главе 2 52
ЗАКЛЮЧЕНИЕ 54
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 55


В последние десятилетия наблюдается взрывное увеличение объема текстов, которые создает человек. Каждый день миллионы людей пишут сообщения в социальных сетях, статьи в блогах, электронные письма, отзывы, комментарии и многое другое. Непрерывный поток информации ставит перед нами неподъёмные задачи по анализу этих текстов.
Контент-анализ представляет собой мощный инструмент для изучения и систематического анализа текстовых данных. Он позволяет проводить объективное и качественное исследование содержания текстов с целью выявления паттернов, трендов и зависимостей.
Лингвисты, маркетологи и социологи активно используют методы контент-анализа для анализа социальных медиа, массовых коммуникаций, рекламных текстов, политических выступлений и других текстовых материалов. Это позволяет им понимать настроения общества здесь и сейчас.
Однако, несмотря на все достижения, контент-анализ сталкивается с рядом технических проблем, которые затрудняют его применение. Одной из таких проблем является концептуальная неоднозначность, которая возникает в текстах в результате полисемичности, синтаксической неоднозначности и прочих причин.
Концептуальная неоднозначность усложняет интерпретацию текста. Использование автоматических методов и алгоритмов для разрешения концептуальной неоднозначности представляет собой сложную задачу, требующую учета контекста, семантических связей и специфических особенностей языка.
В свете всего вышеперечисленного, разработка эффективных методов и инструментов для разрешения концептуальной неоднозначности в контент- анализе является активной областью исследований. Повышение точности и надежности анализа текстовых данных поможет исследователям получать более достоверные результаты и делать более обоснованные выводы на основе анализа текстов в различных сферах деятельности.
Актуальность исследования обусловлена тем, что в настоящее время активно развиваются системы автоматической обработки контента, для которой используется метод семантической разметки. В процессе автоматической разметки возникает концептуальная неоднозначность. Данное исследование позволит по-новому взглянуть на тему и расширить знание об этой проблемной области.
Цель настоящего исследования через анализ причин концептуальной неоднозначности выявить методику решения конкретных случаев.
Объектом исследования является концептуальная неоднозначность.
Предметом исследования являются алгоритмы решения самых частотных случаев концептуальной неоднозначности.
Гипотеза исследования — предположение, что на решение концептуальной неоднозначности в текстах по интегративной физиологии влияет узкий набор факторов.
Проблема, цель, объект, предмет и гипотеза исследования определяют следующие задачи:
1) изучить понятие «разметка корпуса текстов»;
2) изучить виды лингвистической разметки;
3) рассмотреть способы снятия разных типов неоднозначности;
4) собрать базу данных из корпусов текстов;
5) проанализировать причины появления неоднозначности в предметной области «Исследование интегративной физиологии спортсменов»;
6) сформулировать алгоритмы решения случаев неоднозначности;
7) определить факторы, значимые для решения неоднозначности.
...

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной исследовательской работе была собрана статистика из материала размеченных корпусов текстов. Был проведён анализ и выявлены алгоритмы решения концептуальной неоднозначности. Таким образом, проведённое исследование помогает выяснить основные тенденции в концептуальной неоднозначности в текстах предметной области «Исследование интегративной физиологии спортсменов».
Данная работа позволяет сделать вывод, что разрешение неоднозначности в компьютерной лингвистике — сложная и важная задача, которая решается с помощью автоматической и ручной обработки текстов. Автоматическое разрешение неоднозначности основано на анализе контекста и использовании лингвистических данных, таких как синтаксические связи и семантические значения. Однако автоматический анализ не является безошибочным, и качество разметки зависит от типа текста. Разработка эффективных методов и повышение качества разметки являются активной областью исследований, позволяющей улучшить точность и надежность автоматического анализа текстов и расширить его применение в различных сферах.
Практическая значимость исследования заключается в том, что было выяснено, что при решении концептуальной неоднозначности важно учитывать регистр, падеж и наличие/отсутствие числительных, так как они влияют на интерпретацию фразы и выбор правильного тэга. Регистр отражает лексическое значение и категорию слова, падеж указывает на грамматическое значение и семантические роли, а числительные могут указывать на роль слова в предложении. Анализ этих факторов поможет более точно определить значение слова в контексте.
В заключении отметим, что дальнейшее исследование данной предметной области является очень важным для развития корпусной лингвистики в целом и контент-анализа в частности.


1. Аскольдов, С. А. Концепт и слово: учебное пособие / С. А. Аскольдов; под ред. В. П. Нерознака. - М.: Языки русской культуры, 1997. - 269 с.
2. Боярская, Е. Л. Концептуальное моделирование процесса разрешения
полисемии с использованием корпуса [Электронный ресурс] / Е. Л. Боярская // Концептуальное моделирование процесса разрешения полисемии с использованием корпуса — URL:
https:ZZcyberleninka.ru/articleZn/kontseptualnoe-modelirovanie-protsessa- razresheniya-polisemii-s-ispolzovaniem-korpusa, свободный. — Загл. с экрана (дата обращения: 23.12.2022).
3. Ванюшкин, А. С. О разметке корпусов текстов ключевыми словами
[Электронный ресурс] / А. С. Ванюшкин, Л.А. Гращенко // О разметке корпусов текстов ключевыми словами — URL:
https:ZZcyberleninka.ru/articleZn/o-razmetke-korpusov-tekstov-klyuchevymi- slovami, свободный. — Загл. с экрана (дата обращения: 23.12.2022).
4. Гатауллин, Р. Р. Методы, модели и программный инструментарий
разрешения многозначности в текстах [Текст] : автореф. дис. ... канд. тех. наук / Р. Р. Гатауллин ; Каз. фед. ун.. — Казань : [б. и.], 2019. — 25 с. — Режим доступа: https://www.dissercat.com/content/metody-modeli-i-programmnyi-
instrumentarii-razresheniya-mnogoznachnosti-v-tekstakh/read, (дата обращения:
23.12.2022) .
5. Годжаева, М. А. К. Синтаксическая неоднозначность и контекст
[Электронный ресурс] / М. А. К. Годжаева // Синтаксическая неоднозначность и контекст. - URL:
https:ZZcyberleninka.ruZarticleZn/sintaksicheskaya-neodnoznachnost-i-kontekst, свободный. - Загл. с экрана (дата обращения: 23.12.2022).
6. Драгой, О. В. Разрешение синтаксической неоднозначности предложений с определительным придаточным в русском языке [Текст] : автореф. дис. ... канд. филол. наук / О. В. Драгой ; МГУ им. Ломоносова. —
М. : [б. и.], 2001. — 23 с. — Режим доступа: https://new-
disser.ru/_avtoreferats/01003357086.pdf, (дата обращения: 23.12.2022).
7. Загорулько, М. Ю. Система семантической разметки корпуса текстов в ограниченной предметной области [Текст] / М.Ю. Загорулько, И.С. Кононенко и Е.А. Сидорова // Сборник Труды международной конференции «Диалог 2012» - Москва, 2012. - С. 674-685.
8. Захаров, В. П. Корпусная лингвистика : учебник / В. П. Захаров, С. Ю.
Богданова. - 3-е изд., перераб. - Санкт-Петербург : СПбГУ, 2020 - 234 с. - ISBN 978-5-288-05997-1. - Текст : электронный. - URL:
https://znanium.com/catalog/product/1244746 (дата обращения: 23.12.2022). - Режим доступа: по подписке.
9. Зиновьева, А. Ю. Концептуальная неоднозначность в англоязычных
текстах о терроризме: причины возникновения и методы разрешения [Электронный ресурс] / А. Ю. Зиновьева // Концептуальная неоднозначность в англоязычных текстах о терроризме: причины возникновения и методы разрешения - URL: https://cyberleninka.ru/article/n/kontseptualnaya-
neodnoznachnost-v-angloyazychnyh-tekstah-o-terrorizme-prichiny- vozniknoveniya-i-metody-razresheniya/viewer, свободный. - Загл. с экрана (дата обращения: 23.12.2022).
10. Каныгин, Г. В. Проблемы построения знания о социально­
экономической предметной области [Электронный ресурс] / Г. В. Каныгин, В.С. Корецкая // Проблемы построения знания о социально-экономической предметной области — URL: https://cyberleninka.ru/article/n/problemy-
postroeniya-znaniya-o-sotsialno-ekonomicheskoy-predmetnoy-oblasti, свободный. — Загл. с экрана (дата обращения: 23.12.2022).
11. Кобрицов, Б. П. Снятие семантической многозначности глаголов с использованием моделей управления, извлеченных из электронных толковых словарей [Электронный ресурс] / Б. П. Кобрицов, О.Н. Ляшевская, С.Ю. Толдова // Снятие семантической многозначности глаголов с использованием моделей управления, извлеченных из электронных толковых словарей —
URL: https://ruscorpora.ru/media/uploads/2022/04/21/r18.pdf, свободный. —
Загл. с экрана (дата обращения: 23.12.2022).
12. Кобрицов, Б. П. Модели многозначности русской предметной лексики: глобальные и локальные правила разрешения омонимии [Текст] : автореф. дис. ... канд. филол. наук / Б. П. Кобрицов ; РНИМУ им. Н.И. Пирогова. — М. : [б. и.], 2004. — 21 с. — Режим доступа: https://new- disser.ru/_avtoreferats/01002770163.pdf, (дата обращения: 23.12.2022).
13. Кустова, Г.И. Семантическая разметка лексики в национальном корпусе русского языка: принципы, проблемы, перспективы / Кустова Г.И., Ляшевская О. Н., Падучева Е. В., Рахилина Е. В. // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. - М.: Изд-во «Индрик»,
2005. - С. 155-174.
14. Линь, Ц. Ручная разметка корпуса для изучения статистики концептов [Текст] / Ц. Линь, Д. М. Семенова, С. Л. Пущин, Т. Г. Петров, М. Н. Бабарико и С. В. Чебанов // Сборник Международной научной конференции «Корпусная лингвистика-2019» - Санкт-Петербург, 2019 - С. 248- 257.
... всего 35 источников


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ