РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ГЕМАТОЛОГИЧЕСКОГО АНАЛИЗА НА ОСНОВЕ КРИВОЙ ПРАЙС-ДЖОНСА
|
ВВЕДЕНИЕ 3
1 ОБЗОР ТЕМЫ ГЕМАТОЛОГИЧЕСКОГО АНАЛИЗА МЕДИЦИНСКИХ
ИЗОБРАЖЕНИЙ 6
1.1 Гематологический анализ 6
1.2 Компьютерное представление и обработка изображений 7
1.3 Компьютерная обработка изображений. Области применения
обработки изображений 9
1.4 Сегментация изображений 12
1.5 Проблемы обрaботки изобрaжений 17
1.6 Кривая Прайс-Джонса 19
1.7 Актуальность 21
1.8 Современное состояние 22
1.9 Постановка задачи 23
2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ 29
2.1 Алгоритм гематологического анализа клеток крови 29
2.2 Смена цветового пространства 30
2.3 Удаление заднего фона 32
2.4 Бинаризация изображения 35
2.5 Определение контуров объектов на бинарном изображении 36
2.6 Выделение каждой клетки в свой класс 37
3 РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ 39
3.1 Структура программы 39
3.2 Описание реализации программы 40
4 ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ 47
ЗАКЛЮЧЕНИЕ 55
СПИСОКИСПОЛЬЗУЕМОЙЛИТЕРАТУРЫ 57
ПРИЛОЖЕНИЕ
1 ОБЗОР ТЕМЫ ГЕМАТОЛОГИЧЕСКОГО АНАЛИЗА МЕДИЦИНСКИХ
ИЗОБРАЖЕНИЙ 6
1.1 Гематологический анализ 6
1.2 Компьютерное представление и обработка изображений 7
1.3 Компьютерная обработка изображений. Области применения
обработки изображений 9
1.4 Сегментация изображений 12
1.5 Проблемы обрaботки изобрaжений 17
1.6 Кривая Прайс-Джонса 19
1.7 Актуальность 21
1.8 Современное состояние 22
1.9 Постановка задачи 23
2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ 29
2.1 Алгоритм гематологического анализа клеток крови 29
2.2 Смена цветового пространства 30
2.3 Удаление заднего фона 32
2.4 Бинаризация изображения 35
2.5 Определение контуров объектов на бинарном изображении 36
2.6 Выделение каждой клетки в свой класс 37
3 РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ 39
3.1 Структура программы 39
3.2 Описание реализации программы 40
4 ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ 47
ЗАКЛЮЧЕНИЕ 55
СПИСОКИСПОЛЬЗУЕМОЙЛИТЕРАТУРЫ 57
ПРИЛОЖЕНИЕ
В настоящее время интенсивно развиваются интеллектуальные системы, предназначенные для автоматической обработки медицинских изображений. Автоматизированная обработка и анализ медицинских изображений являются универсальным инструментом медицинской диагностики [1][2]. Современные системы гематологического анализа позволяют выполнить предварительную классификацию клеток крови. Например, такие системы эффективно сортируют лейкоциты (8-10% ошибок) и обеспечивают более детальную информативность анализов крови [3][4].
Классификация клеток крови на микроскопическом изображении представляет собой, в терминах компьютерного зрения, задачу распознавания объектов.
Кровь - сложная функциональная система, обеспечивающая своевременную доставку кислорода и питательных веществ клеткам тканей и удаление продуктов метаболизма из органов и интерстициальных пространств [5]. Система крови тонко реагирует на воздействия факторов среды набором специфических и неспецифических компонентов [11]. Важная характеристика физиологии и патологии системы крови - количественный и качественный состав эритроцитарной популяции [6].
Визуальная оценка морфологических характеристик клеток крови является неотъемлемой частью анализа крови человека. Определение количества форменных элементов крови разного типа, их соотношения является важным и наиболее частым тестом клинической лабораторной диагностики.
Исторически идентификация и счет клеток крови производились с использованием микроскопа в «ручном» режиме, при этом исследуемый образец крови находился в статическом состоянии.
В последние годы интенсивно развивается иной подход к идентификации и счету форменных элементов крови - метод цифровой микроскопии. В настоящее время это перспективное направление находится в стадии проработки, поиска соответствующих оптимальных алгоритмов и программ для минимизации ошибок при счете форменных элементов крови. В работах [2]-[4] рассмотрена задача подсчета эритроцитов на изображениях препаратов крови, полученных с помощью цифрового микроскопа. Достигнутая точность счета эритроцитов по отношению к «ручному» способу составляет 96-98 %.
Автоматическая сегментация и счет эритроцитов на основе анализа микроизображений клеток крови выполнены в работах [16]-[18]. Более сложной по сравнению с идентификацией и счетом эритроцитов является задача распознавания лейкоцитов. В работе [10] представлен алгоритм, позволяющий вести счет клеток крови с учетом сложности и произвольности их формы.
Таким образом, цель работы - это разработка принципов идентификации и счета эритроцитов, на основе цифровой микроскопии. Решение задач, позволяющих обеспечить достижение этой цели является актуальным и востребованным в настоящее время.
В данной работе рассматривается задача постановки возможного диагноза по гематологическому анализу цифрового изображения эритроцитов. Описываются шаги по предварительной обработке изображения для уменьшения шумов и точности сегментации объектов клеток на классы. Для каждого этапа приведены примеры работы фильтров. Заключительным шагом является построение гистограммы распределения площадей объектов клеток - кривая Прайс-Джонса. По форме гистограммы можно предположить о наличии заболевания у человека, у которого взяли препарат крови на исследование. В заключении статьи приводятся описания типичных заболеваний, которые могу быть выявлены с помощью такого рода анализа. Для реализации анализа реализована программа на языке Python 2.7 с библиотеками OpenCV и Seaborn.
В первой главе производится обзор гематологического анализа медицинских изображений. Представлено несколько видов сегментации изображений, отмечены свои плюсы и минусы. Доступным текстом представлена информация о гематологическом анализе медицинских изображений. Представлены эталонные кривые Прайс-Джонса здорового и больного человека. Произведен обзор областей применения компьютерной обработки изображений. Также проанализированы проблемы, с которыми можно столкнуться во время обработки изображений. Для подтверждения актуальности рассмотрено современное состояние и критичные недостатки текущего состояния системы. Конкретно выделена цель и задачи, которые полностью соответствует теме выпускной квалификационной работе.
Во второй главе рассматриваются основные математические операции, которые являются главным инструментом в обработке изображений. В каждой функции OpenCV реализован сложный математический аппарат, в данной главе раскрывается математику каждой использованной функции, которая входит в разработанный алгоритм.
В третьей главе идет описание разработанного программного обеспечения. Наиболее важные части кода (функции обработки изображений) представлены на листингах, также после описания разработки каждого этапа алгоритма приведены примеры на рисунках.
В четвертой главе произведен вычислительный эксперимент работы алгоритма.
В заключении сделан вывод о степени достижения поставленных целей и задач.
Данная выпускная квалификационная работа содержит 62 страницы, 30 рисунков, 1 таблицу, 9 формул, 8 листингов кода и 1 приложение.
Классификация клеток крови на микроскопическом изображении представляет собой, в терминах компьютерного зрения, задачу распознавания объектов.
Кровь - сложная функциональная система, обеспечивающая своевременную доставку кислорода и питательных веществ клеткам тканей и удаление продуктов метаболизма из органов и интерстициальных пространств [5]. Система крови тонко реагирует на воздействия факторов среды набором специфических и неспецифических компонентов [11]. Важная характеристика физиологии и патологии системы крови - количественный и качественный состав эритроцитарной популяции [6].
Визуальная оценка морфологических характеристик клеток крови является неотъемлемой частью анализа крови человека. Определение количества форменных элементов крови разного типа, их соотношения является важным и наиболее частым тестом клинической лабораторной диагностики.
Исторически идентификация и счет клеток крови производились с использованием микроскопа в «ручном» режиме, при этом исследуемый образец крови находился в статическом состоянии.
В последние годы интенсивно развивается иной подход к идентификации и счету форменных элементов крови - метод цифровой микроскопии. В настоящее время это перспективное направление находится в стадии проработки, поиска соответствующих оптимальных алгоритмов и программ для минимизации ошибок при счете форменных элементов крови. В работах [2]-[4] рассмотрена задача подсчета эритроцитов на изображениях препаратов крови, полученных с помощью цифрового микроскопа. Достигнутая точность счета эритроцитов по отношению к «ручному» способу составляет 96-98 %.
Автоматическая сегментация и счет эритроцитов на основе анализа микроизображений клеток крови выполнены в работах [16]-[18]. Более сложной по сравнению с идентификацией и счетом эритроцитов является задача распознавания лейкоцитов. В работе [10] представлен алгоритм, позволяющий вести счет клеток крови с учетом сложности и произвольности их формы.
Таким образом, цель работы - это разработка принципов идентификации и счета эритроцитов, на основе цифровой микроскопии. Решение задач, позволяющих обеспечить достижение этой цели является актуальным и востребованным в настоящее время.
В данной работе рассматривается задача постановки возможного диагноза по гематологическому анализу цифрового изображения эритроцитов. Описываются шаги по предварительной обработке изображения для уменьшения шумов и точности сегментации объектов клеток на классы. Для каждого этапа приведены примеры работы фильтров. Заключительным шагом является построение гистограммы распределения площадей объектов клеток - кривая Прайс-Джонса. По форме гистограммы можно предположить о наличии заболевания у человека, у которого взяли препарат крови на исследование. В заключении статьи приводятся описания типичных заболеваний, которые могу быть выявлены с помощью такого рода анализа. Для реализации анализа реализована программа на языке Python 2.7 с библиотеками OpenCV и Seaborn.
В первой главе производится обзор гематологического анализа медицинских изображений. Представлено несколько видов сегментации изображений, отмечены свои плюсы и минусы. Доступным текстом представлена информация о гематологическом анализе медицинских изображений. Представлены эталонные кривые Прайс-Джонса здорового и больного человека. Произведен обзор областей применения компьютерной обработки изображений. Также проанализированы проблемы, с которыми можно столкнуться во время обработки изображений. Для подтверждения актуальности рассмотрено современное состояние и критичные недостатки текущего состояния системы. Конкретно выделена цель и задачи, которые полностью соответствует теме выпускной квалификационной работе.
Во второй главе рассматриваются основные математические операции, которые являются главным инструментом в обработке изображений. В каждой функции OpenCV реализован сложный математический аппарат, в данной главе раскрывается математику каждой использованной функции, которая входит в разработанный алгоритм.
В третьей главе идет описание разработанного программного обеспечения. Наиболее важные части кода (функции обработки изображений) представлены на листингах, также после описания разработки каждого этапа алгоритма приведены примеры на рисунках.
В четвертой главе произведен вычислительный эксперимент работы алгоритма.
В заключении сделан вывод о степени достижения поставленных целей и задач.
Данная выпускная квалификационная работа содержит 62 страницы, 30 рисунков, 1 таблицу, 9 формул, 8 листингов кода и 1 приложение.
Кривая Прайса-Джонса у здоровых людей имеет правильную треугольную форму с высокой вершиной и узким основанием. При этом преобладают эритроциты с диаметром 6-8 мкм, которые составляют 70-75% всех эритроцитов. На долю микроцитов (клетки диаметром меньше 6 мкм) и макроцитов (диаметр более 8мкм) приходится приблизительно одинаковое количество 12-15%, ширина кривой отражает степень анизоцитоза, а положение максимума - средний диаметр эритроцита.
При микроцитозе (характерном, например, для железодефицитоной анемии) эритроцитометрическая кривая сдвигается влево, кривая становится ассиметричной, ширина ее увеличивается.
При макроцитозе (например, сопровождающем В12 и фолиеводефицитную анемию) кривая Прайс-Джонса сдвигается вправо, уплощается, основание ее расширяется.
Построение кривой Прайс-Джонса вручную - чрезвычайно трудоемкая процедура. Поэтому разработанная система гематологического анализа позволяем в автоматическом режиме быстро и с высокой точностью построить кривую Прайса-Джонса, что дает возможность увидеть процентное соотношение всех видов красных кровяных телец. Это позволяет достаточно быстро выявить анизоцитоз у больного и подобрать соответствующие методы его лечения.
Разработанный алгоритм обработки медицинских изображений клеток крови позволил реализовать счет форменных объектов в мазке, по единой их фотографии. Использование предложенных алгоритмов позволило выполнить качественную предварительную обработку медицинские изображения клеток крови для уменьшения шумов и повышения точности сегментации объектов клеток на классы. Алгоритм пороговой сегментации изображения и выделения каждой клетки в свой класс показал возможность идентификации и счета форменных элементов клеток крови.
Вычислительные эксперименты по распознаванию форменных объектов на медицинских изображениях клеток крови выполнялись с использованием программного обеспечения, реализованного на языке Python 2.7 и библиотек OpenCV и Seaborn. Результаты вычислительных экспериментов продемонстрировали работоспособность и эффективность разработанных алгоритмов.
Построение кривой Прайс-Джонса вручную - весьма трудоемкая задача. Поэтому разработанная система гематологического анализа позволяет в автоматическом режиме быстро и с высокой точностью построить кривую Прайс-Джонса, что дает возможность увидеть процентное соотношение всех видов красных кровяных телец, что облегчает возможность своевременного выявления аницитоза у больных, подбирает соответствующие методы их лечения, и в целом ускорить выздоровление, сделать жизнь многих пациентов полноценной.
При микроцитозе (характерном, например, для железодефицитоной анемии) эритроцитометрическая кривая сдвигается влево, кривая становится ассиметричной, ширина ее увеличивается.
При макроцитозе (например, сопровождающем В12 и фолиеводефицитную анемию) кривая Прайс-Джонса сдвигается вправо, уплощается, основание ее расширяется.
Построение кривой Прайс-Джонса вручную - чрезвычайно трудоемкая процедура. Поэтому разработанная система гематологического анализа позволяем в автоматическом режиме быстро и с высокой точностью построить кривую Прайса-Джонса, что дает возможность увидеть процентное соотношение всех видов красных кровяных телец. Это позволяет достаточно быстро выявить анизоцитоз у больного и подобрать соответствующие методы его лечения.
Разработанный алгоритм обработки медицинских изображений клеток крови позволил реализовать счет форменных объектов в мазке, по единой их фотографии. Использование предложенных алгоритмов позволило выполнить качественную предварительную обработку медицинские изображения клеток крови для уменьшения шумов и повышения точности сегментации объектов клеток на классы. Алгоритм пороговой сегментации изображения и выделения каждой клетки в свой класс показал возможность идентификации и счета форменных элементов клеток крови.
Вычислительные эксперименты по распознаванию форменных объектов на медицинских изображениях клеток крови выполнялись с использованием программного обеспечения, реализованного на языке Python 2.7 и библиотек OpenCV и Seaborn. Результаты вычислительных экспериментов продемонстрировали работоспособность и эффективность разработанных алгоритмов.
Построение кривой Прайс-Джонса вручную - весьма трудоемкая задача. Поэтому разработанная система гематологического анализа позволяет в автоматическом режиме быстро и с высокой точностью построить кривую Прайс-Джонса, что дает возможность увидеть процентное соотношение всех видов красных кровяных телец, что облегчает возможность своевременного выявления аницитоза у больных, подбирает соответствующие методы их лечения, и в целом ускорить выздоровление, сделать жизнь многих пациентов полноценной.



