Введение 3
1. Определения 3
1.1. Базовые определения комбинаторики слов 3
1.2. Используемые слова 5
2. Основные результаты 7
3. Открытые задачи и дальнейшие обобщения 9
Список литературы 9
Функция факторной сложности pu (n) бесконечного слова, сопоставляющая числу n количество различных факторов длины n слова и, была впервые введена в работе Морса и Хендлунда [11]. Они доказали, что апериодические слова имеют сложность минимум n + 1 для всякого n; этот результат известен как теорема Морса-Хендлунда. Также они показали, что слова с такой сложностью существуют, и в литературе они распространены под названием слова Штурма. Это семейство слов имеет много эквивалентных характеризаций, в частности, это в точности бинарные, апериодические и сбалансированные слова [6]. Хотя понятие факторной сложности было введено давно и хорошо изучено, остается много открытых проблем, например, классификация возможных функций сложности [4].
Помимо этого, есть и другие виды сложности, например, абелева сложность pUb(n) [6], считающая количество абелевых классов длины n слова и, и циклическая сложность [3], считающая количество классов сопряженности длины n слова и. В статье [3] исследовался нижний предел циклической сложности для разных классов слов.
В работе [5] вводится общая конструкция групповой сложности, частными случаями которых являются факторная, циклическая и абелева сложности. Рассматривается бесконечная последовательность ш групп Gn, где каждая Gn С Sn. Функция групповой сложности считает количество классов эквивалентности под действием Gn для длины n. Таким образом, факторная сложность задается последовательностью Idn, абелева сложность — последовательностью (Sn), а циклическая — (Cn). На эту конструкцию была расширена теорема Морса-Хендлунда и характеризация слов Штурма.
Из определения группой сложности следует, что для любого n, для любой Gn, для любого слова и верно, что pUb(n) 6 /и'' (n) 6 pu(n). Возникает вопрос, можно ли для какого-нибудь слова и, для каждой длины n, для каждого m, pcUb(n) 6 m 6 pu(n) подобрать такую группу Gn, что pGn (n) = m. В этой работе показывается, что для слов Штурма (см., например, Главу 2 в [10]) это утверждение выполняется. Кроме того, оказывается, что для целого класса слов — слов, замкнутых относительно инверсии — такое свойство не может выполнятся для бесконечного количества значений n. Помимо этого, основываясь на численных результатах, выдвигаются гипотезы относительно слова Трибоначчи и слова удвоения периода — а именно, что они удовлетворяют исследуемому свойству.
Перейдем к результатам работы. Следующая теорема говорит о том, что действительно существуют слова, для которых можно для любой длины получить все значения между абелевой сложностью и факторной сложностью, и примером слов, удовлетворяющих этому свойству, являются слова Штурма.
Теорема 1. Для любого слова Штурма, для любой длины n 2 N для любого t, 2 6 t 6 n + 1, можно подобрать такую подгруппу G группы перестановок Sn, что pG(n) = t.
Доказательство. Рассмотрим слово Штурма и и произвольное натуральное число n 2 N. Выпишем все факторы длины n в лексикографическом порядке. Как было написано в предыдущем разделе, последовательные факторы v,v' могут иметь только вид либо v = А01ц, v' = А10ц для каких-то, возможно, пустых, А,ц, либо v = X0,v' = А1.
Возьмем m :0 6 m < n — 1. Рассмотрим группу G, которая оставляет на месте первые m букв и полностью переставляет остальные буквы. Эта группа будет порождаться перестановками ((1)... (m)(m + 1 m + 2), (1)... (m)(m + 1 m + 2 ... n)). Действительно, группа Sk порождается перестановками ((12), (12 ...k)), потому что (12 ... k)z (12)(12 ... k)-i = (i + 1, i + 2), а транспозициями такого вида можно породить S/,..
Рассмотрим префиксы факторов слова и. Мы знаем, что среди префиксов длины m ровно m + 1 различных. Значит, pG(n) > m + 1. Покажем индукцией по m, что она равна m + 2.
Для m = 0 это действительно так — мы получаем просто действие Sn . Сложность относительно Sn — это абелева сложность. Для слов Штурма она равна 2, это как раз m + 2 при m = 0. Посмотрим, что происходит при переходе от длины префикса m к длине m +1. Рассмотрим два случая.
В первом случае у двух последовательных (по лексикографическому порядку) факторов v,v' префиксы остается одинаковыми, v = uw,v' = uw'. Тогда они разделяются на два класса только в случае, когда v = А0, v' = А1, причем такое разделение происходило и при длине m и на увеличение количества классов при переходе с одной длины на другую не влияет. Иначе в их суффиксах одинаковое количество нулей и единиц, потому что они представимы в виде v = uA01^,v' = иА10ц, а группа G полностью переставляет буквы в суффиксе и поэтому на количество классов, которые могут получиться под её действием, влияет только количество нулей.
Во втором случае v = Л01д, v0 = Л10д, |Л| = т. Тогда при переходе от т к т+1 у слова v префикс длины т будет иметь на одну единицу меньше, чем префикс слова v0, и поэтому слова v, v0 попадают в два разных класса под действием G. Такое происходит ровно для одной пары слов, поэтому количество классов увеличивается на один и становится m + 3 = (m + 1) + 2.
Таким образом, для любого t : 2 6 t 6 п + 1 можно найти группу G, для которой pG(n) = t. □
Следующая теорема, наоборот, говорит о том, что существуют слова, для которых нельзя получить все значения между абелевой сложностью и факторной сложностью для бесконечного числа длин.
Теорема 2. Пусть слово x замкнуто относительно инверсии. Тогда p!(п) может принимать только четные значения для любых ! при нечетных значениях п.
Доказательство. Пусть x — слово, замкнутое относительно инверсии. Зафиксируем некоторое нечетное число п и некоторую группу Gn.
Во-первых, заметим, что у слова x будет четная факторная сложность. Можно заметить, что факторы x разбиваются на два класса — бедные, число единиц в которых меньше П, и богатые, число единиц в которых больше П• Так как п нечетно, факторов с ПП единиц не будет. Обозначим бедные классы как Pn (от англ. poor), а богатые как Rn (от англ. rich). Так как слово x замкнуто относительно инверсии, а п — нечетное, то для каждого и из Pn слово и тоже будет фактором x, при этом оно будет лежать в множестве Rn. Аналогично для любого v из Rn — v лежит в Pn. Мы построили биекцию между Pn и Rn, а других факторов длины п в x нет, так как п нечетное. Значит, pn(x) — четное при нечетном п.
Аналогичное рассуждение можно применить для групповой сложности. Рассмотрим классы эквивалентности факторов слова x относительно Gn. Понятно, что для любых и 2 Pn и v 2 Rn слово и не эквивалентно слову v относительно Gn — в них заведомо разное число нулей и единиц, и никакая перестановка не может их приравнять. Пусть теперь u,v 2 Pn, и пусть для какого-то g 2 Gn выполняется g(u) = v. Тогда и g(u) = v, причем u, v 2 Rn — понятно, что после инверсии эта перестановка так же переводит одно слово в другое. Значит, каждому классу эквивалентности из Pn соответветствует класс эквивалентности из Rn и наоборот, а других классов нет в силу нечетности п. □
Слов и классов слов, удовлетворяющих такому свойству, довольно много. Из известных слов, например, таким свойством обладает слово Туэ-Морса. Как уже было доказано выше, оно замкнуто относительно инверсии.
Следствие 1. Групповая сложность слова Туэ-Морса принимает только четные значения при нечетных п.
[1] Pierre Arnoux and Gerard Rauzy. Representation geometrique de suites de complexite 2n + 1. Bulletin de la Societe Mathematique de France, 119(2):199—215, 1991.
[2] Michelangelo Bucci, Alessandro De Luca, and Luca Q Zamboni. Some characterizations of Sturmian words in terms of the lexicographic order. Fundamenta Informaticae, 116(1- 4):25-33, 2012.
[3] Julien Cassaigne, Gabriele Fici, Marinella Sciortino, and Luca Q. Zamboni. Cyclic complexity of words. J. Comb. Theory, Ser. A, 145:36-56, 2017.
[4] Julien Cassaigne and Francois Nicolas. Factor complexity. In Combinatorics, automata and number theory, Encyclopedia Math. Appl., vol. 135, chapter 4, page 163-247. Cambridge Univ. Press, Cambridge, 2010.
[5] Emilie Charlier, Svetlana Puzynina, and Luca Zamboni. On a group theoretic generalization of the Morse-Hedlund theorem. Proceedings of the American Mathematical Society, 145(8):3381-3394, 2017.
[6] Ethan M. Coven and Gustav A. Hedlund. Sequences with minimal block growth. Mathematical Systems Theory, 7(2):138-153, 1973.
[7] Amy Glen and Jacques Justin. Episturmian words: a survey. RAIRO-Theoretical Informatics and Applications-Informatique Theorique et Applications, 43(3):403-442, 2009.
[8] Konrad Jacobs and Michael Keane. 0-1-sequences of Toeplitz type. Zeitschrift fur Wahrscheinlichkeitstheorie und Verwandte Gebiete, 13(2):123-131, 1969.
[9] Jeffrey Shallit Jean-Paul Allouche. Automatic sequences: theory, applications, generalizations. Cambridge University Press, 2003.
[10] M. Lothaire. Algebraic Combinatorics on words. Encyclopedia of mathematics and its applications 90. Cambridge University Press, 1 edition, 2002.
[11] Marston Morse and Gustav A Hedlund. Symbolic dynamics. American Journal of Mathematics, 60(4):815-866, 1938.
[12] W. A. Stein et al. Sage Mathematics Software (Version 9.4). The Sage Development Team, 2021. http://www.sagemath.org.
[13] Сергей Владимирович Августинович. Число различных подслов заданной длины в последовательности Морса-Хедлунда. Дискретный анализ и исследование операций, 1(2):3-7, 1994.