Тип работы:
Предмет:
Язык работы:


Кластеризация биоинформатических данных

Работа №31334

Тип работы

Магистерская диссертация

Предмет

математика

Объем работы28
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
234
Не подходит работа?

Узнай цену на написание


Введение 3
2 Основные понятия и определения 3
3 Кластеризация данных 5
3.1 Постановка задачи кластеризации
биоинформатических данных 5
3.2 Алгоритм кластеризации K-means 5
4 Метрики на генах 7
4.1 Метрика Хемминга 7
4.2 Метрика Левенштейна 8
5 Код программы и документация 9
5.1 Общее описание 9
5.2 Clustal Omega 10
5.3 NucleotidClass.py 11
5.4 DNKSeqClass.py 13
5.5 GeneratingTestData.py 15
5.6 ReadSequencesFromFile.py 16
5.7 Clusterization.py 17
5.8 PlotFunction.py 21
6 Результаты работы программы 25
7 Заключение 26
Литература

Биоинформатика - молодая, бурноразвивающаяся наука. Мощный толчок к развитию она получила благодаря применению математических методов в биологии, до этого применявшихся в основном в физике. Целью данной работы является решение задачи биологии современными средствами математики и программирования.
В работе будет произведена кластеризация генов на к компонент методом средних. До этого предпринимались аналогичные попытки малазийскими учеными. Их труды были представлены в университетском журнале [7] , а также на научной конференции в Сингапуре [6]. Особенностью данной работы будут использование языка программирования BBicoKoro уровня Python с применением технологии параллельного программирования, основанного на создании множества процессов, а также координатное представление нуклеотида, в котором нуклеотиду соответствует пятимерный вектор из вещественных чисел, принадлежащих интервалу [0,1].


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе был реализован алгоритм K-means для кластеризации генов. Для удобства вычислений нуклеотиды были заменены их векторными представлениями и на них была введена псевдометрика. Это сделало код гораздо более удобочитаемым и компактным, так как отпала необходимости вводить правило суммы для 16 возможных состояний нуклеотида. Результаты работы программах говорят нам о том, что количество кластеров и диаметр кластера зависят друг от друга по линейному закону, что ясно видно на полученных графиках. В ходе работах были применено множество библиотек Python


[1] Марк Лутц - Программирование на Python. Том 1, 4-е издание. Символ-Плюс, 2011
[2] Марк Лутц - Изучаем Python. Символ-Плюс, 2011
[3] Дурбин Р, Эдди Ш, Крог А, Митчисон Г. «Анализ биологических последовательностей>. — М.-Ижевск: НИЦ «Регулярная и хаотичная динамика», 2006. — 480 с.
[4] Бородовский М., Екишева С. «Задачи и решения по анализу биологических последовательностей». — М.-Ижевск: НИЦ «Регулярная и хаотичная динамика», 2008. — 420 с
[5] Питер Брюс и Эндрю Брюс. “Практическая статистика для специалистов Data Science", 2015
[6] Azilah Othman, Rosni Abdullah, Nur Aini Abdul Rashid, and Rosalina Abdul Salam - Parallel К-Means Clustering Algorithm on DNA Dataset, Conference: Parallel and Distributed Computing: Applications and Technologies, 5th International Conference, PDCAT 2004, Singapore, December 8-10, 2004, Proceedings
[7] Muhammad Faiz, Mohamed Saaid, Zuwairie Ibrahim, Marzuki Khalid, and NorHanizaSarmin - K-MEANS CLUSTERING FOR DNA COMPUTING READOUT METHOD IMPLEMENTEDON LIGHTCYCLER SYSTEM, UniversitiTeknologiMalaysia, 2003
[8] Chaoming Song, Shlomo Havlin, Hernan A. Makse - Self-similarity of complex networks, Journal Nature, Jan 27 2005
[9] M. Garey ; D. Johnson ; H. Witsenhausen - The complexity of the generalized Lloyd - Max problem, Published in: IEEE Transactions on Information Theory, 1982
[10] Adam Coates, Honglak Lee, Andrew Y. Ng - An Analysis of Single-Layer Networks in Unsupervised Feature Learning, Stanford University, 2011
[11] Bruce Alberts, Alexander Johnson, Julian Lewis, Martin Raff, Keith Roberts, and Peter Walter - Molecular Biology of the Cell, 4th edition,New York: Garland Science; 2002.
[12] Ilzins, O., Isea, R. and Hoebeke, J. Can Bioinformatics Be Considered as an Experimental Biological Science, 2015


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ