Тема:
Разработка поисковой системы для базы данных MEDLINE выполняющей ранжирование результатов поиска с позиции доказательной медицины и системы критериев GRADE
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
ℹ️Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.
Введение 4
Постановка задачи 13
Обзор литературы 17
Глава 1. Обзор алгоритмов 21
1.1. Описание применяемых алгоритмов 21
1.2. Используемые метрики качества 24
1.3. Предварительная обработка аннотаций 26
1.4. Архитектура поисковой системы 26
Глава 2. Подготовка обучающего множества 29
2.1. Подготовка обучающего множества для задачи классификации 29
2.2. Подготовка обучающего множества для задачи извлечения фактов .... 33
2.3. Генерация синтетических аннотаций при помощи модели Latent
Dirichlet Allocation 35
Глава 3. Описание модуля классификации 37
3.1. Классификация MEDLINE аннотаций по уровням доказательности .... 37
3.2. Фильтрация клинических исследований 37
3.3. Классификации аннотаций на “обзорные” и “с вмешательством” 40
3.4. Классификации аннотаций по 2 и 3 уровням доказательности 41
3.5. Классификация по подтипам медицинских вмешательств 44
Глава 4. Описание поискового модуля 46
4.1. Формирование инвертированного индекса 46
4.2. Модуль обработки запросов 48
4.3. Модуль ранжирования по уровням доказательности 48
4.4. Модуль извлечения фактов 49
Глава 5. Проведение экспериментов 50
5.1. Эксперименты с классификацией аннотаций на “обзорные” и “с
вмешательством” 50
5.2. Эксперименты с классификацией по уровням доказательности 54
5.3. Классификация по подтипам медицинских вмешательств 61
5. 4. Эксперименты с извлечением фактов 64
Заключение 68
Список литературы
📖 Введение
На данный момент в медицинской практике активно развивается подход, именуемый доказательной медициной [1]. Данный подход требует от специалиста основываться при выборе метода лечения пациента на имеющиеся доказательства достоверности и эффективности рассматриваемого метода. Сложность применения доказательной медицины на практике заключается в оценке уровня качества и надежности уже существующих медицинских исследований. Для оценки качества медицинского исследования в доказательной медицине используется шкала, ранжирующая исследования по уровню доказательности.
Для удобного описания в дальнейшем уровней доказательности введем понятие рандомизированное контролируемое исследование (РКИ). Данное понятие описывает медицинское исследование, выполненное в соответствии с рядом требований:
1. в процессе проведения исследования формирование групп пациентов происходило случайным образом (рандомизированно);
2. в процессе проведения исследования применялись техники ослепления.
Под техникой ослепления понимается процесс, при котором пациент (группа пациентов) не знает о медицинском вмешательстве, которое получает в процессе проведения эксперимента. Под медицинским вмешательством понимается выбор подхода при лечении пациента. Стандартным примером РКИ является исследование, в котором медицинским вмешательством является разрабатываемый лекарственный препарат, а процесс ослепления заключается в том, что одной группе пациентов дают исследуемый препарат, а другой - плацебо, при этом пациенты в группах не знают о том, какой из двух препаратов они принимают. Такой способ проведения эксперимента дает более качественные и надежные результаты эксперимента.
✅ Заключение
Разработанная поисковая система основана на комбинации классификаторов, определяющих уровень доказательности аннотации и подтип медицинского вмешательства. Предсказания, полученные от классификаторов, позволяют представлять результаты поиска в матричной форме. При этом в строке, соответствующей определенному подтипу медицинского вмешательства, и в столбце, соответствующем уровню доказательности, расположены аннотации, отсортированные в порядке убывания оценки релевантности аннотации запросу. Оценка релевантности найденной аннотации запросу считается при помощи функции tf-idf. На данный момент реализованная поисковая система, ранжирующая MEDLINE аннотации по уровням доказательности тестируется медицинскими экспертами.
В процессе разработки данной системы были опубликованы результаты экспериментов, в том числе классификации MEDLINE аннотаций по подтипам медицинских вмешательств [49] и сравнение стандартных алгоритмов кластеризации с применением алгоритмов выбора признаков для задачи кластеризации MEDLINE аннотаций по подтипам медицинских вмешательств [19, 50].
В дальнейшем планируется:
1. улучшить качество работы модуля фильтрации;
2. повысить качество работы модуля классификации;
3. учитывать в алгоритме ранжирования ошибку классификаторов;
4. учитывать в алгоритме ранжирования критерии оценок GRADE;
5. улучшить качество извлечения фактов.