Тема: Высокопроизводительный поиск широкозонных полупроводников с использованием методов машинного обучения
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 5
ГЛАВА 1. ОБЗОР ЛИТЕРАТУРЫ 7
1.1. Полупроводники и их классификация 7
1.2 Машинное обучение 8
1.2.1 Категории машинного обучения 8
1.2.2 Гиперпараметры и проверка модели 9
1.3 Модели машинного обучения 10
1.3.1 Наивная байесовская классификация 10
1.3.2 Г ребневая регрессия 12
1.4 Базы данных 13
ГЛАВА 2. Python 15
2.1 Язык программирования Python 15
2.2 Модули или библиотеки Python 16
2.3 Модули для машинного обучения и работы с данными. 18
2.3.1 Json 18
2.3.2 Python Materials Genomics 19
2.3.3 DScribe 20
2.3.4 NumPy 25
2.3.5 Scikit-learn (sklearn) 26
2.3.6 Pandas 28
2.3.7 matplotlib 29
2.3.8 Requests 30
2.3.9 qmpy_rester 30
ГЛАВА 3. ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ 31
3.1 Работа с данными 31
3.1.1 Материал 31
3.1.2 Работа с базами данных 32
3.1.3 Обработка данных 33
3.2 Создание дескрипторов 34
3.3 Создание классификаторов
3.4 Создание регрессии 35
ЗАКЛЮЧЕНИЕ 38
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 39
ПРИЛОЖЕНИЕ 42
📖 Введение
С развитием вычислительной мощности и быстрым развитием вычислительных алгоритмов научное сообщество прибегает к моделированию материалов, чтобы исследовать скрытый потенциал тысяч возможно полезных неизвестных материалов в короткие сроки, тогда как настоящие эксперименты могут занять огромное количество времени или просто невыполнимы.
В этом контексте высокопроизводительный компьютерный расчет материалов стал полезным инструментом для ускорения открытия материалов, особенно в области оптоэлектронных полупроводников. Одним из важных результатов является создание ряда баз данных материалов, содержащих широкий спектр функциональных материалов с их разнообразными физическими свойствами и сферами применения. И главное, что большинство этих баз данных являются открытыми и информацию оттуда может получить любой пользователь. [2]
Актуальность работы: электроника участвует во многих сферах нашей жизни и сейчас трудно представить её без полупроводниковых приборов. И всё еще остаётся актуальным поиск всё новых и новых материалов с совершенно разнообразными свойствами. Машинное обучение позволить сэкономить огромное количество времени и средств, а рост вычислительных мощностей техники и совершенствование алгоритмов машинного обучения лишь поспособствуют этому.
Целью данной работы является ознакомление с основами языка программирования Python и основными моделями машинного обучения, а также реализация некоторых из них с целью изучения свойство полупроводниковых соединений.
Для достижения этой цели нужно пройти несколько шагов:
1. знакомство с основами языка Python;
2. подбор исследуемых материалов;
3. создание набора данных;
4. поиск оптимальных модулей и библиотек;
5. анализ основных моделей машинного обучения, реализованных на языке Python, и выбор подходящих для исследования наборов данных;
6. реализация выбранных алгоритмов машинного обучения в виде программ на языке Python.
✅ Заключение
2) Были представлены основные модули, используемые для написания программы машинного обучения на языке программирования Python.
3) С помощью описанных модулей и наборов данных, полученных из баз данных материалов, были написаны программы для нескольких классификаторов и одной регрессии.





