Анализ цветового распределения и тональности текста на изображениях в социальной сети «ВКонтакте»
|
ВВЕДЕНИЕ 5
1 ОБЗОР СОВРЕМЕННОГО СОСТОЯНИЯ ИССЛЕДОВАНИЯ В ОБЛАСТИ
АНАЛИЗА ИЗОБРАЖЕНИЙ 8
1.1 Анализ основных понятий анализа изображений 8
1.2 Обзор литературы по анализу изображений 9
1.3 Анализ психологического воздействия цвета 12
1.4 Выбор средств автоматизации сбора изображений 16
2 МАТЕМАТИЧЕСКИЕ МЕТОДЫ ДЛЯ АНАЛИЗА ЦВЕТОВОГО
РАСПРЕДЕЛЕНИЯ И ТОНАЛЬНОСТИ ТЕКСТА НА ИЗОБРАЖЕНИЯХ... 18
2.1 Обзор методов анализа и выявления содержимого на изображении 18
2.2 Обзор математических методов кластеризации 24
2.3 Неиерархическая кластеризация данных с использованием k-means 27
2.4 Сегментации изображений 31
2.5 Распознавание слов 34
2.6 Оценка тональности текста 36
3 АНАЛИЗ ЭМОЦИОНАЛЬНОЙ СОСТАВЛЯЮЩЕЙ ИЗОБРАЖЕНИЙ ИЗ
СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ 38
3.1 Алгоритм работы программного обеспечения 38
3.2 Тестирование программного обеспечения 42
3.3 Программный код 48
ЗАКЛЮЧЕНИЕ 53
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 54
1 ОБЗОР СОВРЕМЕННОГО СОСТОЯНИЯ ИССЛЕДОВАНИЯ В ОБЛАСТИ
АНАЛИЗА ИЗОБРАЖЕНИЙ 8
1.1 Анализ основных понятий анализа изображений 8
1.2 Обзор литературы по анализу изображений 9
1.3 Анализ психологического воздействия цвета 12
1.4 Выбор средств автоматизации сбора изображений 16
2 МАТЕМАТИЧЕСКИЕ МЕТОДЫ ДЛЯ АНАЛИЗА ЦВЕТОВОГО
РАСПРЕДЕЛЕНИЯ И ТОНАЛЬНОСТИ ТЕКСТА НА ИЗОБРАЖЕНИЯХ... 18
2.1 Обзор методов анализа и выявления содержимого на изображении 18
2.2 Обзор математических методов кластеризации 24
2.3 Неиерархическая кластеризация данных с использованием k-means 27
2.4 Сегментации изображений 31
2.5 Распознавание слов 34
2.6 Оценка тональности текста 36
3 АНАЛИЗ ЭМОЦИОНАЛЬНОЙ СОСТАВЛЯЮЩЕЙ ИЗОБРАЖЕНИЙ ИЗ
СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ 38
3.1 Алгоритм работы программного обеспечения 38
3.2 Тестирование программного обеспечения 42
3.3 Программный код 48
ЗАКЛЮЧЕНИЕ 53
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 54
В настоящее время компьютеры применяются во всех сферах деятельности человека, при этом важнейшую роль играют компьютерная обработка фотографий и растровая графика в целом.
Современное программное обеспечение в сфере цифровой обработки изображений позволяют человеку ежедневно создавать большое число фотографий, которые затем заполняют собой профили пользователей в различных социальных сетях, являясь основным информационным контентом.
Эта форму контента по сути является своеобразной презентацией пользователя, так как представляемые в профиле изображения человек выбирает на уровне подсознания, основываясь на принципе «нравится - не нравится».
Формируемый в профиле пользователя информационный контент соотносится с ключевыми особенностями личности пользователя, с его эмоциональной составляющей, с его психологическими потребностями.
Значительное количество пользователей по всему миру пользуется разнообразными социальных сетями, постоянно наполняя свой профиль актуальным информационным содержимым, в первую очередь, новыми фотографиями и видеоматериалами.
Посторонний человек имеет возможность дать психоэмоциональную оценку представленному профилю в социальной сети путём проведения визуального анализа.
Современные компьютерные технологии предоставляют возможность провести подобный анализ огромного количества профилей социальной сети за приемлемое время.
Чтобы автоматизировать такой анализ, требуется обучить электронно-вычислительную машину воспринимать визуальный контент также, как его воспринимают пользователи социальной сети.
На основе использования цифровой обработки можно решить целый комплекс задач: повысить качество изображений, выполнить распознавание, в том числе текстовой информации на изображении и много других.
В бакалаврской работе цифровая обработка изображений позволяет проанализировать психоэмоциональную составляющую фотографий, типизировать изображения по цветовому распределению и текстовой информации, оценив таким образом тональность фотографии.
Затем фотографии типизируют, и вычисляется психоэмоциональная характеристика аккаунта на основе количества «агрессивных», «нейтральных», «отрицательных» и «положительных» фотоизображений.
Целью бакалаврской работы является разработка алгоритма вычисления психоэмоциональной характеристики профиля пользователя на основе типизации фотоизображений в социальной сети «ВКонтакте» путём анализа цветового распределения и тональности текста на фотоизображениях.
Для достижения поставленной цели требуется выполнение следующих задач.
1. Проанализировать воздействие цветового распределения на психоэмоциональное состояние.
2. Автоматизировать получение фотоизображений пользователей социальной сети.
3. Разработать алгоритм типизации фотоизображений на основе цветового распределения.
4. Разработать алгоритм типизации фотоизображений по тональности текста на изображениях.
5. Интерпретировать результаты типизации с реальным психоэмоциональным воздействием на пользователя.
Актуальность бакалаврской работы вызвана тем обстоятельством, что в современных условиях каждый руководитель желает принять на работу наиболее надёжных, эмоционально устойчивых работников, готовых работать на результат.
Разработанный алгоритм позволит кадровым службам организации экономно расходовать ресурсы, направленные на набор команды ответственных работников, а сотрудникам организаций в сфере образования - обеспечить безопасность и требуемую атмосферу в группе обучающихся.
Разработанный алгоритм можно использовать для выявления пограничных состояний у детей старшего и среднего школьного возраста, в том числе имеющих проблемы с речью. Это связано с воздействием цветов на психоэмоциональное состояние личности.
Цветовое распределение может быть привлекающим, отталкивающим, взбадривающим, успокаивающим.
Данные о том, какие цветовые оттенки предпочитает тот или иной пользователь, получить просто - люди на эмоциях ежедневно или еженедельно наполняют имеющиеся профили в социальных сетях фотографиями.
Автоматически анализируя это информационное наполнение, можно оперативно получать психоэмоциональные характеристики.
В первой главе рассматривается анализ изображений с точки зрения психологии, анализируется воздействие цветового распределения на психоэмоциональное состояние. Выбираются источник получения изображений для последующего анализа, цветовая модель для задания цвета, инструментарий для получения изображений, метод этого инструментария.
Во второй главе рассматриваются подходы к анализу изображений по цветовому распределению и к анализу тональности текста. Выбираются библиотеки для реализации программного обеспечения.
В третьей главе представлена разработка программы на основе анализа размещённых пользователем в открытом доступе изображений.
Современное программное обеспечение в сфере цифровой обработки изображений позволяют человеку ежедневно создавать большое число фотографий, которые затем заполняют собой профили пользователей в различных социальных сетях, являясь основным информационным контентом.
Эта форму контента по сути является своеобразной презентацией пользователя, так как представляемые в профиле изображения человек выбирает на уровне подсознания, основываясь на принципе «нравится - не нравится».
Формируемый в профиле пользователя информационный контент соотносится с ключевыми особенностями личности пользователя, с его эмоциональной составляющей, с его психологическими потребностями.
Значительное количество пользователей по всему миру пользуется разнообразными социальных сетями, постоянно наполняя свой профиль актуальным информационным содержимым, в первую очередь, новыми фотографиями и видеоматериалами.
Посторонний человек имеет возможность дать психоэмоциональную оценку представленному профилю в социальной сети путём проведения визуального анализа.
Современные компьютерные технологии предоставляют возможность провести подобный анализ огромного количества профилей социальной сети за приемлемое время.
Чтобы автоматизировать такой анализ, требуется обучить электронно-вычислительную машину воспринимать визуальный контент также, как его воспринимают пользователи социальной сети.
На основе использования цифровой обработки можно решить целый комплекс задач: повысить качество изображений, выполнить распознавание, в том числе текстовой информации на изображении и много других.
В бакалаврской работе цифровая обработка изображений позволяет проанализировать психоэмоциональную составляющую фотографий, типизировать изображения по цветовому распределению и текстовой информации, оценив таким образом тональность фотографии.
Затем фотографии типизируют, и вычисляется психоэмоциональная характеристика аккаунта на основе количества «агрессивных», «нейтральных», «отрицательных» и «положительных» фотоизображений.
Целью бакалаврской работы является разработка алгоритма вычисления психоэмоциональной характеристики профиля пользователя на основе типизации фотоизображений в социальной сети «ВКонтакте» путём анализа цветового распределения и тональности текста на фотоизображениях.
Для достижения поставленной цели требуется выполнение следующих задач.
1. Проанализировать воздействие цветового распределения на психоэмоциональное состояние.
2. Автоматизировать получение фотоизображений пользователей социальной сети.
3. Разработать алгоритм типизации фотоизображений на основе цветового распределения.
4. Разработать алгоритм типизации фотоизображений по тональности текста на изображениях.
5. Интерпретировать результаты типизации с реальным психоэмоциональным воздействием на пользователя.
Актуальность бакалаврской работы вызвана тем обстоятельством, что в современных условиях каждый руководитель желает принять на работу наиболее надёжных, эмоционально устойчивых работников, готовых работать на результат.
Разработанный алгоритм позволит кадровым службам организации экономно расходовать ресурсы, направленные на набор команды ответственных работников, а сотрудникам организаций в сфере образования - обеспечить безопасность и требуемую атмосферу в группе обучающихся.
Разработанный алгоритм можно использовать для выявления пограничных состояний у детей старшего и среднего школьного возраста, в том числе имеющих проблемы с речью. Это связано с воздействием цветов на психоэмоциональное состояние личности.
Цветовое распределение может быть привлекающим, отталкивающим, взбадривающим, успокаивающим.
Данные о том, какие цветовые оттенки предпочитает тот или иной пользователь, получить просто - люди на эмоциях ежедневно или еженедельно наполняют имеющиеся профили в социальных сетях фотографиями.
Автоматически анализируя это информационное наполнение, можно оперативно получать психоэмоциональные характеристики.
В первой главе рассматривается анализ изображений с точки зрения психологии, анализируется воздействие цветового распределения на психоэмоциональное состояние. Выбираются источник получения изображений для последующего анализа, цветовая модель для задания цвета, инструментарий для получения изображений, метод этого инструментария.
Во второй главе рассматриваются подходы к анализу изображений по цветовому распределению и к анализу тональности текста. Выбираются библиотеки для реализации программного обеспечения.
В третьей главе представлена разработка программы на основе анализа размещённых пользователем в открытом доступе изображений.
В ходе работы была проанализирована различная литература по теме исследования. Рассмотрен анализ изображений с точки зрения психологии, проанализировано воздействие цветового распределения на психоэмоциональное состояние.
Был разработан алгоритм классификации эмоциональной составляющей изображений. Алгоритм включает в себя автоматизированный сбор изображений из социальной сети «ВКонтакте», определении в изображениях доминирующих цветов путем кластеризации пикселей методом k-means, определение наличия текста на изображениях и анализ его тональности. Выходными данными алгоритма является классификация изображений по четырем классам: «позитивные» изображения, «нейтральные», «грустные» и «агрессивные».
Предложенный алгоритм был реализован на языке программирования Python с использованием VK API для получения изображений выбранного пользователя, API «Google Cloud Vision» для обнаружения и распознавания текста и библиотеки TextBlob для анализа тональности текста.
Разработанный алгоритм классификации изображений контента аккаунта социальной сети может быть использован в образовательных учреждениях с целью своевременного контроля перепадов психического состояния учащихся для поддержания безопасности окружающих. Также будет удобен кадровым специалистам в выявлении наиболее подходящего кандидата на конкретную вакансию.
Был разработан алгоритм классификации эмоциональной составляющей изображений. Алгоритм включает в себя автоматизированный сбор изображений из социальной сети «ВКонтакте», определении в изображениях доминирующих цветов путем кластеризации пикселей методом k-means, определение наличия текста на изображениях и анализ его тональности. Выходными данными алгоритма является классификация изображений по четырем классам: «позитивные» изображения, «нейтральные», «грустные» и «агрессивные».
Предложенный алгоритм был реализован на языке программирования Python с использованием VK API для получения изображений выбранного пользователя, API «Google Cloud Vision» для обнаружения и распознавания текста и библиотеки TextBlob для анализа тональности текста.
Разработанный алгоритм классификации изображений контента аккаунта социальной сети может быть использован в образовательных учреждениях с целью своевременного контроля перепадов психического состояния учащихся для поддержания безопасности окружающих. Также будет удобен кадровым специалистам в выявлении наиболее подходящего кандидата на конкретную вакансию.



