ПРИМЕНЕНИЕ МЕТОДОВ КОРПУСНОЙ ЛИHГВИСТИКИ ДЛЯ АНАЛИЗА ЧАСТОТНЫХ НАРУШЕНИИ ОРФОГРАФИЧЕСКИХ НОРМ (НА МАТЕРИАЛЕ КОММЕНТАРИЕВ СОЦИАЛЬНОЙ СЕТИ ..ВКОНТАКТЕ»)
|
ВВЕДЕНИЕ 3
ГЛАВА 1. ПОНЯТИЕ НОРМ РУССКОГО ЯЗЫКА И ИХ НАРУШЕНИЕ 8
1.1. Языковая норма как лингвистическая категория 8
1.2. Классификация языковых норм 12
1.3. Нарушение языковых норм 17
ГЛАВА 2. МЕТОДЫ КОРПУСНОЙ ЛИНГВИСТИКИ В АНАЛИЗЕ ЧАСТОТНЫХ НАРУШЕНИЙ ОРФОГРАФИЧЕСКИХ НОРМ 30
2.1. Корпусная лингвистика как подраздел прикладной лингвистики 30
2.2. Особенности аннотирования корпусов 37
2.3. Создание корпуса комментариев для поиска частотных нарушений
орфографических норм 42
ГЛАВА 3. ЧАСТОТНЫЕ ОРФОГРАФИЧЕСКИЕ НАРУШЕНИЯ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ 46
3.1. Распределение частотных нарушений по частям речи 46
3.2. Распределение по виду нарушенной нормы 47
3.3. Явление намеренного искажения графико-орфографического
облика слов 53
ЗАКЛЮЧЕНИЕ 55
ЛИТЕРАТУРА 59
Приложение 1 66
Приложение 2 66
ГЛАВА 1. ПОНЯТИЕ НОРМ РУССКОГО ЯЗЫКА И ИХ НАРУШЕНИЕ 8
1.1. Языковая норма как лингвистическая категория 8
1.2. Классификация языковых норм 12
1.3. Нарушение языковых норм 17
ГЛАВА 2. МЕТОДЫ КОРПУСНОЙ ЛИНГВИСТИКИ В АНАЛИЗЕ ЧАСТОТНЫХ НАРУШЕНИЙ ОРФОГРАФИЧЕСКИХ НОРМ 30
2.1. Корпусная лингвистика как подраздел прикладной лингвистики 30
2.2. Особенности аннотирования корпусов 37
2.3. Создание корпуса комментариев для поиска частотных нарушений
орфографических норм 42
ГЛАВА 3. ЧАСТОТНЫЕ ОРФОГРАФИЧЕСКИЕ НАРУШЕНИЯ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ 46
3.1. Распределение частотных нарушений по частям речи 46
3.2. Распределение по виду нарушенной нормы 47
3.3. Явление намеренного искажения графико-орфографического
облика слов 53
ЗАКЛЮЧЕНИЕ 55
ЛИТЕРАТУРА 59
Приложение 1 66
Приложение 2 66
Вторая половина XX века была ознаменована началом новой информационной эпохи, компьютерной революции, проявившейся в создании, а далее и в повсеместном распространении персональных компьютеров и глобальной сети Интернет. Менее чем за 50 лет - с момента создания первого электронного персонального компьютера Генри Робертсом в 70-х годах и вплоть до сегодняшнего дня - компьютерные технологии стремительно проникали во все сферы человеческой жизни, трансформируя их: образование и политика, экономика, наука и искусство - каждая из названных областей человеской деятельности уже совершенно немыслима без компьютерных возможностей сверхбыстрого поиска, обработки и защищённого хранения информации.
Ещё сравнительно недавно поиск нужного языкового материала для лингвистических исследований был весьма непростой задачей: для этого требовалось просмотреть большое количество печатных изданий, параллельно выписывая подходящие примеры, что предполагало обширные временные затраты и не всегда отвечало в итоге требованиям репрезентативности.
Современные технологии позволяют довольно быстро решить эту задачу методами такой дисциплины, как корпусная лингвистика. По определению В.П. Захарова, корпусная лингвистика - «это один из разделов компьютерной лингвистики, который занимается разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с применением компьютерных технологий» [Захаров 2011: 5].
Т. МакЭнери и А. Уилсон дают следующее определение корпусу: «корпус - это собрание языковых фрагментов, отобранных в соответствии с четкими языковыми критериями для использования в качестве модели языка» [McEnery, Wilson 2001: 12].
К достоинствам корпусов в проведении языковых исследований следует отнести тот несомненный факт, что они позволяют не только подтвердить или опровергнуть существование в языке каких-либо феноменов, но и найти в качестве доказательства достаточное количество релевантного эмпирического материала.
Данная работа посвящена применению методов корпусной лингвистики для анализа частотных нарушений орфографических норм на материале комментариев социальной сети Вконтакте. В ней исследуются наиболее частые орфографические нарушения пользователей социальной сети Вконтакте, которые были собраны из комментариев, размещённых в сообществе «Подслушано». Чтобы найти эти нарушения, на материале сообщества нами был создан корпус комментариев.
Актуальность работы обусловлена возрастающим интересом научного сообщества к созданию электронных корпусов как в России, так и за рубежом, что по техническим причинам было невозможно в недавнем прошлом. Об актуальности избранной тематики говорит и большое число научных публикаций в области когнитивной лингвистики, психолингвистики, социолингвистики, лексикологии, методики обучения иностранному языку, а также методики обучения переводу, которые основываются на материале корпусов.
Цель работы: выявить наиболее частотные нарушения орфографических норм пользователями социальной сети Вконтакте при помощи корпуса комментариев. Для достижения поставленной цели работы решались следующие задачи:
1. Изучение языковой нормы русского языка как лингвистической категории.
2. Анализ классификации языковых норм.
3. Анализ нарушения языковых, в частности орфографических, норм.
4. Создание корпус комментариев посетителей сообщества «Подслушано» [Подслушано] при помощи специальных программных средств.
5. Токенизация корпуса (разбиение входящих в него предложений на отдельные слова).
6. Частеречная и морфологическая разметка корпуса.
7. Из 10 000 наиболее употребительных лексем корпуса, не зафиксированных в частотном словаре [Ляшевская], выявить и рассмотреть наиболее частотные случаи нарушения орфографических норм.
Источником материала исследования послужили письменные комментарии посетителей сообщества «Подслушано» к публикуемым постам, размещённые в период с 03 марта 2012 года по 13 декабря 2018 года.
Методы работы были определены поставленными целями и задачами. Использовались: описательный метод, который включает классификацию и теоретическое обобщение собранного материала, метод индукции, систематизации, интерпретации фактов, метод количественного анализа, корпусный метод. Подробно они рассматриваются в параграфе 2.4.
Объектом исследования являются комментарии пользователей, размещённые в публичном пространстве и находящиеся в свободном доступе.
Предмет исследования - особенности нарушения орфографических норм, выявленные в комментариях посетителей сообщества «Подслушано» [Подслушано].
Теоретическую базу данной работы составили фундаментальные труды и исследования, посвящённые языковым и - в частности - орфографическим нормам, таких учёных, как Д.Э. Розенталь, М.А. Теленкова, В.В. Виноградов, Н.М. Шанский, А.Н. Тихонов, И.Б. Голуб, Э.А. Балалыкина, Л.А. Введенская, Д.Д. Данцев, Н.С. Валгина, Е.М. Хакимова, С.Ю. Харченко, А.Д. Шмелев. Теория лингвистической ошибки подробно рассматривается в работах Т.М. Балыхиной, О.П. Игнатьевой, Д.А. Заманстанчук, Н.Д. Голева и др. К исследованию языковых особенностей интернет-коммуникации обращались М.Б. Бергельсон, Г. Гусейнов, Е.И. Горошко, Л.Ю. Иванов, Л.В. Марченко, Ю.В. Уткин и др. В области корпусной лингвистики для данного исследования большое значение имеют работы А.Н. Баранова, В.П. Захарова, B. А. Плунгяна, М. Копотева, Н.Р. Добрушиной, С.А. Анохиной, C. В. Абрамовой, Г.И. Кустовой, О.Н. Ляшевской, С.О. Савчука, С.А. Шарова, В.И. Беликова, Н.Ю. Копылова, McEnery, Wilson и других исследователей.
Научная новизна заключается: а) в создании корпуса комментариев, б) в применении уже существующих ранее методов исследования к новому эмпирическому материалу, т.е. к комментариям пользователей социальной сети, в) в изучении нового аспекта существующего знания: частотности тех или иных орфографических нарушений в контексте интернет-коммуникации,
г) в получении новых результатов на базе нового, не использовавшегося ранее материала.
Практическая значимость работы: результаты исследования могут быть использованы при обучении русскому языку в школе, так как основываются на частотных ошибках, а следовательно, дают представление о правилах и нормах, которые вызывают наибольшие затруднения у людей, уже освоивших школьную программу: более половины участников сообщества, на базе которого был создан корпус, входят в возрастную категорию 21-30 лет (56,2%). Материалы работы и её результаты могут быть полезны также и при обучении русскому языку как иностранному. Корпус комментариев представляет собой ценный материал для проведения различных исследований в области лексики пользователей интернетсообществ. Также он может быть использован в качестве обучающего набора для алгоритмов машинного обучения (чат-боты).
Структура: работа состоит из введения, трёх глав, заключения, списка литературы и трёх приложений. Первая глава рассматривает языковую норму как лингвистическую категорию, также в ней даётся классификация языковых норм и рассматривается явление их нарушения в интернет коммуникации. Вторая глава посвящена корпусной лингвистике, корпусам и их созданию. Описывается методология и технология создания корпуса комментариев сообщества «Подслушано», размещённого в социальной сети Вконтакте.
В третьей главе выделяются найденные с помощью корпуса случаи нарушения орфографических норм. Приложения включают в себя списки орфографических нарушений, найденные на материале корпуса, графики и схемы.
Ещё сравнительно недавно поиск нужного языкового материала для лингвистических исследований был весьма непростой задачей: для этого требовалось просмотреть большое количество печатных изданий, параллельно выписывая подходящие примеры, что предполагало обширные временные затраты и не всегда отвечало в итоге требованиям репрезентативности.
Современные технологии позволяют довольно быстро решить эту задачу методами такой дисциплины, как корпусная лингвистика. По определению В.П. Захарова, корпусная лингвистика - «это один из разделов компьютерной лингвистики, который занимается разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с применением компьютерных технологий» [Захаров 2011: 5].
Т. МакЭнери и А. Уилсон дают следующее определение корпусу: «корпус - это собрание языковых фрагментов, отобранных в соответствии с четкими языковыми критериями для использования в качестве модели языка» [McEnery, Wilson 2001: 12].
К достоинствам корпусов в проведении языковых исследований следует отнести тот несомненный факт, что они позволяют не только подтвердить или опровергнуть существование в языке каких-либо феноменов, но и найти в качестве доказательства достаточное количество релевантного эмпирического материала.
Данная работа посвящена применению методов корпусной лингвистики для анализа частотных нарушений орфографических норм на материале комментариев социальной сети Вконтакте. В ней исследуются наиболее частые орфографические нарушения пользователей социальной сети Вконтакте, которые были собраны из комментариев, размещённых в сообществе «Подслушано». Чтобы найти эти нарушения, на материале сообщества нами был создан корпус комментариев.
Актуальность работы обусловлена возрастающим интересом научного сообщества к созданию электронных корпусов как в России, так и за рубежом, что по техническим причинам было невозможно в недавнем прошлом. Об актуальности избранной тематики говорит и большое число научных публикаций в области когнитивной лингвистики, психолингвистики, социолингвистики, лексикологии, методики обучения иностранному языку, а также методики обучения переводу, которые основываются на материале корпусов.
Цель работы: выявить наиболее частотные нарушения орфографических норм пользователями социальной сети Вконтакте при помощи корпуса комментариев. Для достижения поставленной цели работы решались следующие задачи:
1. Изучение языковой нормы русского языка как лингвистической категории.
2. Анализ классификации языковых норм.
3. Анализ нарушения языковых, в частности орфографических, норм.
4. Создание корпус комментариев посетителей сообщества «Подслушано» [Подслушано] при помощи специальных программных средств.
5. Токенизация корпуса (разбиение входящих в него предложений на отдельные слова).
6. Частеречная и морфологическая разметка корпуса.
7. Из 10 000 наиболее употребительных лексем корпуса, не зафиксированных в частотном словаре [Ляшевская], выявить и рассмотреть наиболее частотные случаи нарушения орфографических норм.
Источником материала исследования послужили письменные комментарии посетителей сообщества «Подслушано» к публикуемым постам, размещённые в период с 03 марта 2012 года по 13 декабря 2018 года.
Методы работы были определены поставленными целями и задачами. Использовались: описательный метод, который включает классификацию и теоретическое обобщение собранного материала, метод индукции, систематизации, интерпретации фактов, метод количественного анализа, корпусный метод. Подробно они рассматриваются в параграфе 2.4.
Объектом исследования являются комментарии пользователей, размещённые в публичном пространстве и находящиеся в свободном доступе.
Предмет исследования - особенности нарушения орфографических норм, выявленные в комментариях посетителей сообщества «Подслушано» [Подслушано].
Теоретическую базу данной работы составили фундаментальные труды и исследования, посвящённые языковым и - в частности - орфографическим нормам, таких учёных, как Д.Э. Розенталь, М.А. Теленкова, В.В. Виноградов, Н.М. Шанский, А.Н. Тихонов, И.Б. Голуб, Э.А. Балалыкина, Л.А. Введенская, Д.Д. Данцев, Н.С. Валгина, Е.М. Хакимова, С.Ю. Харченко, А.Д. Шмелев. Теория лингвистической ошибки подробно рассматривается в работах Т.М. Балыхиной, О.П. Игнатьевой, Д.А. Заманстанчук, Н.Д. Голева и др. К исследованию языковых особенностей интернет-коммуникации обращались М.Б. Бергельсон, Г. Гусейнов, Е.И. Горошко, Л.Ю. Иванов, Л.В. Марченко, Ю.В. Уткин и др. В области корпусной лингвистики для данного исследования большое значение имеют работы А.Н. Баранова, В.П. Захарова, B. А. Плунгяна, М. Копотева, Н.Р. Добрушиной, С.А. Анохиной, C. В. Абрамовой, Г.И. Кустовой, О.Н. Ляшевской, С.О. Савчука, С.А. Шарова, В.И. Беликова, Н.Ю. Копылова, McEnery, Wilson и других исследователей.
Научная новизна заключается: а) в создании корпуса комментариев, б) в применении уже существующих ранее методов исследования к новому эмпирическому материалу, т.е. к комментариям пользователей социальной сети, в) в изучении нового аспекта существующего знания: частотности тех или иных орфографических нарушений в контексте интернет-коммуникации,
г) в получении новых результатов на базе нового, не использовавшегося ранее материала.
Практическая значимость работы: результаты исследования могут быть использованы при обучении русскому языку в школе, так как основываются на частотных ошибках, а следовательно, дают представление о правилах и нормах, которые вызывают наибольшие затруднения у людей, уже освоивших школьную программу: более половины участников сообщества, на базе которого был создан корпус, входят в возрастную категорию 21-30 лет (56,2%). Материалы работы и её результаты могут быть полезны также и при обучении русскому языку как иностранному. Корпус комментариев представляет собой ценный материал для проведения различных исследований в области лексики пользователей интернетсообществ. Также он может быть использован в качестве обучающего набора для алгоритмов машинного обучения (чат-боты).
Структура: работа состоит из введения, трёх глав, заключения, списка литературы и трёх приложений. Первая глава рассматривает языковую норму как лингвистическую категорию, также в ней даётся классификация языковых норм и рассматривается явление их нарушения в интернет коммуникации. Вторая глава посвящена корпусной лингвистике, корпусам и их созданию. Описывается методология и технология создания корпуса комментариев сообщества «Подслушано», размещённого в социальной сети Вконтакте.
В третьей главе выделяются найденные с помощью корпуса случаи нарушения орфографических норм. Приложения включают в себя списки орфографических нарушений, найденные на материале корпуса, графики и схемы.
В данной работе были исследованы наиболее частотные орфографические нарушения пользователей социальной сети Вконтакте, которые оставляли свои комментарии к постам сообщества «Подслушано» в период с 3 марта 2012 года по 13 декабря 2018 года.
В первой главе рассматривалась языковая норма как лингвистическая категория, также в ней была представлена классификация языковых норм и описаны особенности их нарушения в интернет-коммуникации. Вторая глава была посвящена корпусной лингвистике, корпусам и их созданию. Также в ней был изложен метод создания корпуса комментариев сообщества «Подслушано», размещённого в социальной сети Вконтакте, и способ поиска ошибок с его помощью. В третьей главе были выделены и рассмотрены найденные в корпусе случаи ненамеренного и намеренного нарушения орфографических норм, а также рассматриваются причины подобных нарушений. Приложения 1, 2, включают в себя списки орфографических нарушений, намеренные, а также случайные, найденные в созданном корпусе.
Целью данной работы было выявление наиболее частых случаев нарушения орфографической нормы, которые были допущены пользователями сообщества «Подслушано». Для достижения данной цели последовательно были решены следующие задачи: во-первых, были рассмотрены языковые, в частности орфографические, нормы как лингвистическая категория, а также явления случайного и намеренного нарушения норм. Во-вторых, программными средствами был создан корпус комментариев пользователей сообщества «Подслушано», на материале которого мы и проводили данное исследование. В-третьих, выделены случаи нарушения орфографических норм.
Корпус, созданный для поиска языковых нарушений, состоит в общей сложности более чем из 4,5 млн (4842279) словоформ. В рамках данного исследования было выявлено 640 ненамеренных орфографических ошибок, а также 536 случаев намеренного искажения графического и орфографического облика слов.
Мы выяснили, в каких именно правилах пользователи социальной сети наиболее часто совершали орфографические ошибки: бесспорными лидерами по количеству совершённых ошибок в нашем «антирейтинге» грамотности стали правила, касающиеся слитного/раздельного или дефисного написания, правила, регулирующие написание удвоенных согласных в корне и на стыке приставки и корня, а также правила написания заимствованных слов. Подробно узнать о наиболее распространённых орфографических нарушениях пользователей социальных сетей можно из третьей главы настоящей работы.
Рассмотрев типичные случаи орфографических ошибок пользователей, мы выделили их основные источники.
Первый источник орфографических ошибок - это руководство комментаторов фонетическим принципом русской орфографии. Наиболее часто его пытались реализовать в рамках правил, касающихся проверяемых гласных корня, непроверяемых гласных корня, правописания заимствованных слов, непроизносимых согласных корня и др.
Второй источник ошибок - явление гиперкоррекции, когда существующее орфографическое правило применялось к неподходящей орфограмме. Например, правописанием приставок при-, пре-, пере- пищущий пытается проверить слово «периодически» и приходит к ложному выводу о том, что верное написание - «переодически».
Третий источник - нейтрализация согласных фонем. Это проявляется, к примеру, в ситуации, когда свистящие, находящиеся в сигнификативно слабой позиции, перед шипящими перестают различаться и произносятся слитно. Как в словах «сумасшедший» и «сногсшибательный» (прим. в корпусе комментариев данные слова были написаны без «с»).
Четвертый источник - неверное написание по аналогии со словами сходного звучания/строения. Пишущий проводит неверную аналогию проверяемого слова с его паронимом, на основании чего избирается неверное написание. Так, эспрессо мог быть написан «экспрессо», по аналогии с экспрессом, а эскалатор, похожий звучанием на «экскаватор» - «экскалатор».
Также в результате исследования обширного эмпирического материала, который мы получили, создав корпус комментариев, было выяснено, что только часть орфографических ошибок, допускаемых пользователями сообщества «Подслушано», являются случайными, или ненамеренными. Другая же часть ошибок совершается намеренно, что, как отмечает в своих исследованиях Л.В.Дубинина, является «стилистически маркированным средством виртуальной коммуникации» [Дубинина 2013: 177].
Среди намеренных орфографических ошибок частотны случаи предпочтения слитного написания раздельному или дефисному в служебных частях речи, что создает эффект сближения письменной речи с устной. Многие исследователи особенностей интернет-коммуникации указывают на существование данного феномена, подчеркивая, что в интернет-дискурсе границы письменной и устной речи размыты. Этому феномену в своих работах уделили внимание М.Б. Бергельсон, Е.И. Литневская, С.А. Лысенко и др. [Бергельсон 2002: 24; Литневская 2009: 65; Лысенко 2007: 182]. О сближении устной и письменной речи свидетельствуют и такие особенности написаний, зафиксированные в комментариях сообщества «Подслушано», как графическое «растяжение» слов, а также фонетическое письмо.
Несмотря на то, что комментарии в социальной сети нельзя отнести к форме литературного русского языка, подавляющее большинство лексем, содержащих орфографические ошибки и являющихся предметом нашего исследования, относятся к общеупотребительной лексике, которая функционирует также и в рамках литературной формы языка.
Результаты исследования могут быть использованы в процессе преподавания русского языка, так как они представляют собой базу данных частотных ошибок, а следовательно, дают представление о правилах и нормах, которые вызывают наибольшие затруднения у людей, уже освоивших школьную программу. Материалы работы и её результаты могут быть полезны также и при обучении русскому языку как иностранному. Корпус комментариев представляет собой ценный материал для проведения исследований в области лексики пользователей интернет-сообществ. Также он может быть использован в качестве обучающего набора для создания алгоритмов машинного обучения (чат-ботов).
В первой главе рассматривалась языковая норма как лингвистическая категория, также в ней была представлена классификация языковых норм и описаны особенности их нарушения в интернет-коммуникации. Вторая глава была посвящена корпусной лингвистике, корпусам и их созданию. Также в ней был изложен метод создания корпуса комментариев сообщества «Подслушано», размещённого в социальной сети Вконтакте, и способ поиска ошибок с его помощью. В третьей главе были выделены и рассмотрены найденные в корпусе случаи ненамеренного и намеренного нарушения орфографических норм, а также рассматриваются причины подобных нарушений. Приложения 1, 2, включают в себя списки орфографических нарушений, намеренные, а также случайные, найденные в созданном корпусе.
Целью данной работы было выявление наиболее частых случаев нарушения орфографической нормы, которые были допущены пользователями сообщества «Подслушано». Для достижения данной цели последовательно были решены следующие задачи: во-первых, были рассмотрены языковые, в частности орфографические, нормы как лингвистическая категория, а также явления случайного и намеренного нарушения норм. Во-вторых, программными средствами был создан корпус комментариев пользователей сообщества «Подслушано», на материале которого мы и проводили данное исследование. В-третьих, выделены случаи нарушения орфографических норм.
Корпус, созданный для поиска языковых нарушений, состоит в общей сложности более чем из 4,5 млн (4842279) словоформ. В рамках данного исследования было выявлено 640 ненамеренных орфографических ошибок, а также 536 случаев намеренного искажения графического и орфографического облика слов.
Мы выяснили, в каких именно правилах пользователи социальной сети наиболее часто совершали орфографические ошибки: бесспорными лидерами по количеству совершённых ошибок в нашем «антирейтинге» грамотности стали правила, касающиеся слитного/раздельного или дефисного написания, правила, регулирующие написание удвоенных согласных в корне и на стыке приставки и корня, а также правила написания заимствованных слов. Подробно узнать о наиболее распространённых орфографических нарушениях пользователей социальных сетей можно из третьей главы настоящей работы.
Рассмотрев типичные случаи орфографических ошибок пользователей, мы выделили их основные источники.
Первый источник орфографических ошибок - это руководство комментаторов фонетическим принципом русской орфографии. Наиболее часто его пытались реализовать в рамках правил, касающихся проверяемых гласных корня, непроверяемых гласных корня, правописания заимствованных слов, непроизносимых согласных корня и др.
Второй источник ошибок - явление гиперкоррекции, когда существующее орфографическое правило применялось к неподходящей орфограмме. Например, правописанием приставок при-, пре-, пере- пищущий пытается проверить слово «периодически» и приходит к ложному выводу о том, что верное написание - «переодически».
Третий источник - нейтрализация согласных фонем. Это проявляется, к примеру, в ситуации, когда свистящие, находящиеся в сигнификативно слабой позиции, перед шипящими перестают различаться и произносятся слитно. Как в словах «сумасшедший» и «сногсшибательный» (прим. в корпусе комментариев данные слова были написаны без «с»).
Четвертый источник - неверное написание по аналогии со словами сходного звучания/строения. Пишущий проводит неверную аналогию проверяемого слова с его паронимом, на основании чего избирается неверное написание. Так, эспрессо мог быть написан «экспрессо», по аналогии с экспрессом, а эскалатор, похожий звучанием на «экскаватор» - «экскалатор».
Также в результате исследования обширного эмпирического материала, который мы получили, создав корпус комментариев, было выяснено, что только часть орфографических ошибок, допускаемых пользователями сообщества «Подслушано», являются случайными, или ненамеренными. Другая же часть ошибок совершается намеренно, что, как отмечает в своих исследованиях Л.В.Дубинина, является «стилистически маркированным средством виртуальной коммуникации» [Дубинина 2013: 177].
Среди намеренных орфографических ошибок частотны случаи предпочтения слитного написания раздельному или дефисному в служебных частях речи, что создает эффект сближения письменной речи с устной. Многие исследователи особенностей интернет-коммуникации указывают на существование данного феномена, подчеркивая, что в интернет-дискурсе границы письменной и устной речи размыты. Этому феномену в своих работах уделили внимание М.Б. Бергельсон, Е.И. Литневская, С.А. Лысенко и др. [Бергельсон 2002: 24; Литневская 2009: 65; Лысенко 2007: 182]. О сближении устной и письменной речи свидетельствуют и такие особенности написаний, зафиксированные в комментариях сообщества «Подслушано», как графическое «растяжение» слов, а также фонетическое письмо.
Несмотря на то, что комментарии в социальной сети нельзя отнести к форме литературного русского языка, подавляющее большинство лексем, содержащих орфографические ошибки и являющихся предметом нашего исследования, относятся к общеупотребительной лексике, которая функционирует также и в рамках литературной формы языка.
Результаты исследования могут быть использованы в процессе преподавания русского языка, так как они представляют собой базу данных частотных ошибок, а следовательно, дают представление о правилах и нормах, которые вызывают наибольшие затруднения у людей, уже освоивших школьную программу. Материалы работы и её результаты могут быть полезны также и при обучении русскому языку как иностранному. Корпус комментариев представляет собой ценный материал для проведения исследований в области лексики пользователей интернет-сообществ. Также он может быть использован в качестве обучающего набора для создания алгоритмов машинного обучения (чат-ботов).



