Тема: Диагностика заболеваний по электрокардиограмме с использованием методов машинного обучения
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Введение 3
Постановка задачи 6
Обзор литературы 7
Глава 1. Обзор данных и их препроцессинг 8
§1.1 PTB Diagnostic ECG Database 8
§1.2 Детрендинг сигнала 10
§1.3 Фильтрация методом Савицкого-Голея 13
§1.4 Характеристики ЭКГ 17
§1.5 Алгоритм определения положений зубцов 18
§1.6 Полученные результаты и преобразование данных 23
Глава 2. Многослойный персептрон 25
§2.1 Архитектура 25
§2.2 Некоторые определения 27
§2.3 Слои сети 28
§2.4 Метод обратного распространения ошибки 29
Глава 3. Реализация алгоритма классификации 30
§3.1 Используемые библиотеки 30
§3.2 Алгоритм Oversampling 31
§3.3 Вид подаваемых на обучение данных 32
§3.4 Обучение модели и полученные результаты 33
Заключение 35
Приложение 37
Список использованной литературы 41
📖 Введение
Электрокардиографией называется метод исследования и регистрации электрической активности сердца для диагностики различных патологий [11]. История развития электрокардиографии уходит в далёкий 1842 год, когда немецким физиологом Дюбоис-Реймондом были обнаружены электрические сигналы, испускаемые при сокращениях сердца лягушки. Это открытие положило начало исследованиям электрической активности сердечной мышцы. Позднее, в 1872 году английским учёным Огустом Валлером была записана электрическая активность этого органа с использованием капиллярного электрометра люксембургского физика Г абриэля Липпмана, а в 1887 году на международном конгрессе физиологов в Лондоне голландский физиолог Вильям Эйнтховен провёл демонстрацию кривой потенциала действия сердца человека, записанной на изобретённом им струнном гальванометре. Далее последовала череда знаменательных открытий в области электрокардиографии, причём многие результаты которых используются и в наши дни.
Однако, несмотря на то что современная медицина позволяет с высокой точностью диагностировать практически любые отклонения в правильной работе сердца, анализ электрокардиограммы и постановка диагноза осуществляются медицинским работником, и этот факт, даже невзирая на профессионализм и многолетний опыт работы отдельных специалистов, не позволяет полностью исключить фактор человеческой ошибки. Комбинация различных видов заболеваний, внешние шумы в сигнале, специфичность заболевания - эти и множество других факторов могут стать существенным препятствием в постановке правильного диагноза, что может стоить жизни пациенту.
В цифровую эпоху множество сфер человеческой деятельности оказываются автоматизированы - люди пытаются упростить, минимизировать ручную работу и оптимизировать рабочие процессы, предоставив решение этих задач компьютерам. Компьютерные алгоритмы позволяют обрабатывать информацию гораздо быстрее, чем это может сделать человек. Особенно это становится заметно, когда дело касается больших объемов данных. Сердце человека как раз является “генератором” таких данных - из его последовательных сокращений можно получить достаточно объемный набор информации, который может быть обработан машиной, при этом обработка займёт гораздо меньше времени, чем анализ человеком. Таким образом возникает вопрос - возможно ли реализовать программное средство, способное производить диагностику сердечной мышцы и диагностировать патологии, помогая медработнику принять решение и одновременно минимизируя его непосредственное участие?
Реализация данного программного комплекса состоит из двух задач. Первой задачей является препроцессинг - предварительная обработка данных для представления их в удобном виде. Его принципы описаны в первой главе. Не всегда данные имеют общий формат, а также зачастую из необработанных данных невозможно выделить общие для каждого элемента характеристики. Препроцессинг призван решить эту проблему и преобразовать данные таким образом, чтобы их они стали пригодными для использования в дальнейшем этапе исследования.
Во второй главе описывается разработка алгоритма, способного осуществлять диагностику. В данном случае под диагностикой фактически понимается решение задачи классификации. Существует ряд алгоритмов, получающих на вход некий набор данных и возвращающих информацию о том, к каком из определенных классов эти данные соответствуют [20]. В качестве примера можно привести искусственные нейронные сети - математические модели, основанные на принципах организации биологических нейронных сетей. В наши дни подобные алгоритмы используются для обширного класса задач: управления, распознавания образов, прогнозирования и многих других [20]. В этом исследовании будет описан процесс создания и использования одной из таких моделей для анализа полученных на этапе препроцессинга данных электрокардиограмм и установления факта принадлежности ее к одному из заданных классов. В работе, в качестве примера, рассматривается три класса. Два из них соответствуют наиболее распространенным сердечно-сосудистым заболеваниям (аритмия, инфаркт), по которым накоплен достаточно большой объем электрокардиографических исследований, а третий класс соответствует электрокардиограммам без патологических изменений.
Постановка задачи
Целью данной работы является реализация программного комплекса для диагностирования инфаркта и аритмии по электрокардиограмме (ЭКГ) с использованием методов машинного обучения. Для достижения поставленной цели необходимо решить следующие задачи:
• Найти набор данных, содержащий достаточное количество примеров ЭКГ с состояниями инфаркта, аритмии, а также ЭКГ здоровых людей;
• Осуществить обработку данных, заключающуюся в удалении шумов и смещений с использованием известных алгоритмов фильтрации сигнала;
• Определить ключевые точки на ЭКГ (положения зубцов);
• Преобразовать полученные значения в набор характеристик, сохранить данные в формате, удобном для дальнейшего использования;
• Разработать модель искусственной нейронной сети, получающую на вход вышеописанный набор данных;
• Обучить модель на этих данных и оценить полученные результаты.
✅ Заключение
Обученная система показывала точность более чем 90% на всех рассматриваемых классах - людях без заболеваний, с аритмией и с инфарктом миокарда.
Более совершенные алгоритмы препроцессинга кардиограмм позволят расширить круг детектируемых заболеваний и повысить точность распознавания, что говорит о том, что в данной области есть еще множество задач, которые необходимо решить. Узкая применимость разработанной модели в большой степени обусловлена достаточно ограниченным набором данных, поэтому любые добровольцы, готовые внести свой вклад в развитие этой области посредством пополнения датасета своими примерами кардиограмм, дали бы толчок к новым исследованиям. Также можно рассмотреть дополнительные отведения кардиограмм (II, III и грудные), что в перспективе позволит увеличить точность алгоритма.
Несмотря на достаточно высокую точность распознавания, всегда стоит стоит помнить о том, что система для распознавания заболеваний очень чувствительна к ошибкам, и любой неверный прогноз может стоить жизней многим пациентам. Но тем не менее, такие системы уже сейчас могут использоваться в современных медучреждениях для увеличения скорости распознавания заболеваний, а значит - повышения эффективности системы здравоохранения.



