Тема: Анализ данных при помощи web-сервисов Amazon
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ГЛАВА 1. АНАЛИЗ ДАННЫХ 6
1.1. Введение в анализ данных 6
1.2. Big data как новая ступень развития анализа данных 11
1.3. Применение Big data в реальной жизни 16
ГЛАВА 2. ИНСТРУМЕНТЫ ДЛЯ АНАЛИЗА ДАННЫХ 26
2.1. Язык программирования Python 26
2.2. Онлайн ресурсы для анализа данных 32
ГЛАВА 3 АНАЛИЗ ДАННЫХ В МЕДИЦИНЕ 36
3.1. Нейронные сети 36
3.2. Практический пример 40
Заключение 47
Список литературы 49
Приложения
📖 Введение
Другие ученые: Джон Чэмберс, Билл Кливленд и Лео Брейман независимо друг от друга повторно предложили академической статистики расширить свою область за пределы классической теоретической статистики. Чэмберс предложил уделять большое внимание подготовке и представлению данных, а не статистическому моделированию. Брейман считал нужным сделать большой упор на предсказание, а не на умозаключение. Кливленд предложил громкое название «Наука о данных» для предполагаемой научной области. В конце 80х - начале 90х другой известный ученый Григорий Пятецкий-Шапиро внес большой вклад в становление новой науки «Анализ данных», которая приобрела уже современный вид.
Сфера применения анализа данных не имеет ограничений - она повсюду, где есть какие-нибудь данные. В первую очередь методы анализа данных сильно заинтересовали коммерческие организации, которые развертывают проекты на основе информационных хранилищ данных. Опыт большого количества подобных предприятий показывает, что отдача от внедрения анализа данных может доходить до 1000%. Можно найти сведения о проекте в 20 миллионов долларов США, который смог окупиться за рекордные 4 месяца. Другим примером является годовая экономия около 700 тысяч долларов благодаря внедрению анализа данных в сеть универсамов в Великобритании.
Актуальность данной работы обусловлена тем, что анализ данных представляет огромную ценность не только для руководителей и аналитиков в их ежедневной деятельности, а еще и для простых работников. В частности, в данной работе будет рассмотрено применение анализа данных в медицинской сфере. Бурный рост технологий и методов анализа данных начинает плотно внедряться в медицину. Медицинская отрасль собирает огромное количество различных данных, поэтому для их обработки нужно на высоком уровне владеть компьютерными методами анализа данных, чтобы оптимизировать работу врачей и улучшить качество лечения пациентов.
Целью данной работы является создания программы на языке программирования Python по анализу данных. Главными задачами этой программы являются обнаружение и подсчет количества глазных желез на специально подготовленных фотографиях. На практике эта программа поможет упростить жизнь врачам-офтальмологам.
Чтобы достигнуть заданных целей были поставлены следующие задачи:
• Изучение специализированных библиотек языка программирования Python.
• Изучение онлайн-курсов по машинному обучению с использованием web-сервисов Amazon.
• Изучение книг и интернет ресурсов, посвященных анализу данных.
• Выбор задания по анализу данных и решение его при помощи полученных знаний.
Объектом исследования являются сырые данные, состоящие из фотографий человеческих глаз.
Предметом исследования является анализ полученных данных с целью получения информации о глазных железах.
Практическая ценность работы обусловлена важностью выбранной тематики для анализа данных. Данный анализ основывается на реальных задачах медицины и настоящих исходных данных.
Методологическую основу выпускной квалификационной работы составили следующие методы исследований:
• Изучение учебных материалов
• Изучение онлайн ресурсов, различных публикаций и статей
• Теоретический метод
• Практический метод
Выпускная квалификационная работа содержит в себе: введение, три главы, заключение, список использованной литературы и приложения.
Первая глава полностью посвящена теоретическим сведениям об анализе данных. Данная глава затрагивает понятие Big data и его методы. Также в этой главе представлены примеры использования анализа данных в реальной жизни.
Вторая глава рассказывает об инструментах для проведения анализа данных. В частности, в данной главе рассказывается теория о языке программирования Python, приводятся практические примеры. Также в этой главе идет речь об онлайн ресурсах для анализа данных.
Третья глава содержит теорию про нейронные сети. Также в ней рассказывается про практическое задание.
В заключение работы содержаться результаты и выводы.
✅ Заключение
Концепция Big data предусматривает решение задач в 3х приоритетных направлениях:
1. Хранение и управление данными в сотни и тысячи терабайтов, которые обычные базы данных не могут эффективно использовать.
2. Организация неупорядоченных наборов данных, которые состоят из документов, изображений, аудио, видео и прочих видов файлов.
3. Обработка имеющихся данных с целью их структурирования, формирования аналитических отчетов, создание высокоточных прогнозов.
Также возросла потребность в квалифицированных специалистах по анализу данных (data scientist) и в ближайшее время будет только расти. Ведь мало иметь только мощную технику и новые передовые технологии, нужно иметь также специалистов, которые грамотно будут со всем этим работать.
В ходе выполнения данной работы было реализовано практическое задание по анализу данных. Тема выбранного анализа крайне важная потому что связана с медициной. Были подобраны данные, обучена нейронная сеть и написаны необходимые скрипты для выполнения анализа. Данное задание остается пока больше учебным, но при соответствующей доработке может быть полезно в офтальмологии.



