Combinatorial complexity of the signature of a natural tiling
- Authors: Banaru D.А.1
-
Affiliations:
- Vernadsky Institute of Geochemistry and Analytical Chemistry of RAS
- Issue: Vol 70, No 1 (2025)
- Pages: 163-168
- Section: ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
- URL: https://ogarev-online.ru/0023-4761/article/view/286315
- DOI: https://doi.org/10.7868/S3034551025010206
- EDN: https://elibrary.ru/IRLJHV
- ID: 286315
Cite item
Abstract
An additive model has been developed for calculating the combinatorial (Shannon-like) complexity of a signature of the natural tiling, which is used to describe the topological properties of micro- and mesoporous materials, in particular, zeolites. To calculate the complexity of this type, a Python program code has been compiled. The code was tested for tilings of a zeolite type. Correlations of the calculated complexity of a signature of the tiling and the combinatorial complexity of the tiling-generating structure were found.
Full Text
Введение
Информационная энтропия H по Шэннону [1], она же шэнноновская, или комбинаторная, сложность, обычно выражается в битах и в таком случае имеет вид
, (1)
где pi = mi/m – доля mi элементов i-го вида в дискретном множестве из m элементов, каждый элемент которого отнесен к одному из s видов, . Комбинаторная сложность используется в химии как мера сложности молекулярных ансамблей [2], в том числе дендримеров [3], и ее изменения при химических превращениях [4–7], а в кристаллографии как мера сложности кристаллических структур [8–17] и химических составов [18], а также систем порождающих операций кристаллографических групп [19] и систем опорных контактов в кристаллической структуре [20]. В минералогии информационную энтропию использовал академик Н.П. Юшкин для оценки сложности распределения минералов по сингониям [21]. Применению информационной энтропии в минералогии и кристаллографии также посвящен миниобзор Ю.Л. Войтеховского [22].
Комбинаторная сложность относится к более широкому классу индексов видового разнообразия, называемому числами Хилла, поскольку является числом Хилла первого порядка [23]. В кристаллографии числа Хилла можно использовать для оценки неравномерности распределений записей в структурных банках данных по кристаллографическим таксонам, таким как сингонии, кристаллические классы, пространственные группы [24]. Видовое разнообразие объектов неживой природы имеет некоторые сходства с разнообразием биологических видов [25].
В настоящей работе исследована комбинаторная сложность сигнатуры натурального тайлинга [26]. Под тайлингом понимается нормальное (грань к грани) разбиение пространства на тайлы – обобщенные, не обязательно выпуклые полиэдры, в которых каждая вершина инцидентна двум или более вершинам, а грани могут быть криволинейными [27]. Всякому тайлингу соответствует некоторая сетка, образованная вершинами и ребрами. Натуральным называют тайлинг, отвечающий следующим условиям: симметрия тайлинга совпадает с симметрией соответствующей ему сетки; гранями тайла являются сильные кольца (циклы, не являющиеся суммой нескольких циклов меньшего размера); все сильные кольца сетки, кроме принадлежащих граням, имеют пересечения, т.е. общие внутренние точки; если в соответствии с предыдущими пунктами возможны разные тайлинги, то путем объединения тайлов друг с другом строят один тайлинг. Таким образом, если для данной сетки натуральный тайлинг вообще существует, то только один. Поиск натурального тайлинга в общем случае нетривиален, но достаточно давно реализован в программном комплексе ToposPro [28]. Для тайлов принято использовать гранный символ вида [Aa.Bb...], который означает наличие у тайла a A-угольных, b B-угольных граней, A < B < ... . На рис. 1 изображен натуральный тайл [436] структуры пирохлора. Тайлинг принято обозначать сигнатурой, показывающей cоотношение тайлов, например, запись 2[34] + [38] означает тетраэдрические [34] и октаэдрические [38] тайлы в соотношении 2 : 1.
Рис. 1. Тайл [436] одноименного натурального тайлинга структуры пирохлора Ca2Nb2O6F.
Метод
Для сложения комбинаторной сложности от нескольких источников информации простая аддитивность подходит только в том случае, если источники информации независимы [29]. Например, если две подсистемы одной системы изолированы друг от друга, т.е. разделены в пространстве и не обмениваются массой и энергий. Но если подсистемы взаимозависимы, как это всегда бывает с подструктурами одной кристаллической структуры [17], то должна выполняться сильная аддитивность: помимо слагаемых, отвечающих отдельным подсистемам, в сумму включается дополнительное слагаемое, которое учитывает прирост информации за счет смешивания подсистем. В работах Сабирова (например, [30]) такое дополнительное слагаемое называется эмерджентным параметром. Принципы разложения комбинаторной сложности дискретных мультимножеств на вклады отдельных множеств с эмерджентным параметром были подробно рассмотрены в [13].
Применим этот подход к сигнатуре натурального тайлинга, записанной в стандартном виде
(2)
где k1:k2:…:kn – простейшее целочисленное соотношение n тайлов разного сорта. Совокупность граней тайла i-го сорта (i = 1, …, n) представляет собой мультимножество Φi = {(Ai, ai), (Bi, bi), …}. Комбинаторная сложность такого мультимножества по определению (1) равна
(3)
Совокупность ki граней тайлов i-го сорта представляет собой мультимножество {(Ai, kiai), (Bi, kibi), …}, имеющее такую же комбинаторную сложность Htile,i. Складывая значения Htile,i с учетом соотношения между тайлами по правилу сильной аддитивности [13], получаем
, (4)
, (5)
, (6)
где φi = (ai + bi +…) – число граней в i-м тайле, wi – весовые множители, определяющие вклад Htile,i в общую сложность тайлинга Htiling. Сложность, рассчитываемая по формуле (6), является эмерджентным параметром [30]. Как следует из свойств сильной аддитивности [13], Htiling является комбинаторной сложностью мультимножества
(7)
Поскольку каждая грань тайлинга принадлежит ровно двум тайлам, в мультимножество Φ она включена дважды, однако это никак не влияет на распределение граней по размерам и не искажает стехиометрию тайлинга. Единицей измерения Htile,i и Htiling является бит/грань. При умножении Htiling на общее число граней в сигнатуре тайлинга получается общая комбинаторная сложность сигнатуры (бит/сигнатура):
. (8)
В табл. 1 представлен код на языке Python, позволяющий рассчитать значения Htiling и Htiling,tot для сколь угодно большого списка сигнатур, записанных в столбце файла с таблицей формата MS Excel. Столбец таблицы не должен иметь заголовка, формат сигнатуры (2) точно такой же, как в выдаче программы ToposPro [28] при построении тайлинга, например, “2[3^4] + [3^8]”. По умолчанию программа обращается к исходным данным по адресу C:\tilings\input.xlsx и создает в той же папке файл с именем input_with_entropies.xlsx, в котором рядом со столбом сигнатур записаны два столбца (тоже без заголовков) с рассчитанными значениями Htiling и Htiling,tot соответственно.
Таблица 1. Код для расчета значений Htiling и Htiling,tot
import pandas as pd from collections import Counter import numpy as np # Load the Excel file without headers file_path = 'C:/tilings/input.xlsx' df = pd.read_excel(file_path, header=None) # Function to transform the expression def transform_expression(expression): def expand_term(term): term = term.strip() if term[0].isdigit(): coefficient, inner = term.split('[', 1) inner = '[' + inner expanded_inner = expand_single_term(inner) expanded_inner_list = expanded_inner.strip('[]').split(',') return f"[{','.join(expanded_inner_list * int(coefficient))}]" else: return expand_single_term(term) def expand_single_term(term): term = term.strip('[]') if '.' in term: factors = term.split('.') expanded_factors = [] for factor in factors: if '^' in factor: base, exp = factor.split('^') base = base.strip() exp = int(exp.strip()) expanded_factors.extend([base] * exp) else: expanded_factors.append(factor.strip()) return f"[{','.join(expanded_factors)}]" elif '^' in term: base, exp = term.split('^') base = base.strip() exp = int(exp.strip()) return f"[{','.join([base] * exp)}]" else: return f"[{term.strip()}]" def modify_output(output): parts = output.split('+') all_values = [] for i, part in enumerate(parts): if part.startswith('[') and part.endswith(']'): inner_content = part[1:-1].split(',') | indexed_content = [f"{value.strip()}{i + 1}" for value in inner_content] all_values.extend(indexed_content) return f"[{','.join(all_values)}]" parts = expression.split('+') expanded_parts = [expand_term(part.strip()) for part in parts] final_output = '+'.join(expanded_parts) return modify_output(final_output) # Function to calculate Shannon entropy def calculate_shannon_entropy(numbers): counts = Counter(numbers) total_count = sum(counts.values()) probabilities = [count / total_count for count in counts.values()] entropy = -sum(p * np.log2(p) for p in probabilities if p > 0) return entropy # Processing each expression and calculating entropy def process_expression(expression): output = transform_expression(expression) output_numbers = list(map(int, output.strip('[]').split(','))) entropy = calculate_shannon_entropy(output_numbers) total_numbers = len(output_numbers) weighted_entropy = entropy * total_numbers return entropy, weighted_entropy # Clean and sanitize the expression input if necessary def clean_expression(expression): expression = expression.replace(']"', ']').replace('"', ʹʹ).strip() return expression # Apply cleaning and process the expressions in the first column df[0] = df[0].apply(clean_expression) df[['Entropy', 'Weighted Entropy']] = df[0].apply(lambda x: pd.Series(process_expression(x))) # Save the updated DataFrame to the same file, adding the Entropy and Weighted Entropy columns output_file_path = 'C:/tilings/input_with_entropies.xlsx' df.to_excel(output_file_path, index=False, header=False) print(f"Processed entropies saved to {output_file_path}") |
Метод опробован на массиве сигнатур натуральных тайлингов цеолитного типа, представленного в сопроводительных материалах к пионерской работе [31] и насчитывавшего на тот момент 194 сигнатуры. Также был проведен поиск ранговой (по Спирмену) и линейной (по Пирсону) корреляций Htiling и Htiling,tot с уже известными индексами сложности цеолитных каркасов, в частности с комбинаторной сложностью по С.В. Кривовичеву IG (бит на вершину каркаса) и IG,tot (бит на приведенную ячейку) (по известным данным для 201 каркаса [32]), с конфигурационной сложностью Hconf (бит на степень свободы) и Hconf,tot (бит на приведенную ячейку) (по ранее полученным данным для 242 каркасов [33]), а также с числом классов симметрично-эквивалентных ребер в каркасе eʹʹ. Для поиска корреляций использовали только те каркасы, которые входили в каждый из трех массивов структур [31–33], за исключением разупорядоченных каркасов (рефкоды *BEA, *MRE и *STO в банке данных цеолитных структур [34]). Таким образом, анализировали данные по 191 каркасу.
Результаты и их обсуждение
В табл. 2 представлены коэффициенты корреляции индексов сложности для каркасов цеолитного типа и соответствующих им натуральных тайлингов. Из этих данных видно, что все тестированные пары индексов положительно коррелированы. Для случайной выборки объемом N = 191 p-уровню значимости p < 0.05 отвечает коэффициент корреляции больше 0.142; таким образом, все обнаруженные корреляции статистически значимы. Слабее всего коррелированы Htiling,tot и eʹʹ; Htiling средне коррелирует c другими индексами, в том числе IG (рис. 2а); корреляцию Htiling,tot с IG,tot (рис. 2б) и Hconf,tot можно считать сильной. Коэффициент ранговой корреляции во всех случаях, кроме тех, в которых один из индексов eʹʹ, оказался меньше коэффициента линейной корреляции, что нетрудно объяснить одинаковой логарифмической зависимостью соответствующих индексов от некоторых, пусть и разных, структурных параметров. Как показало сравнительное исследование серии структур Hg-содержащих минералов и их синтетических аналогов, все использующиеся сегодня в кристаллографии индексы сложности в той или иной мере коррелированы друг с другом [35].
Таблица 2. Корреляции индексов сложности цеолитных каркасов и тайлингов
Индекс | Тип корреляции | IG, бит/вершина | Hconf, бит/с.с. | eʹʹ |
Htiling, бит/грань | Линейная | 0.690 | 0.670 | 0.601 |
Ранговая | 0.653 | 0.633 | 0.640 | |
Индекс | Тип корреляции | IG,tot, бит/яч. | Hconf,tot, бит/яч. | eʹʹ |
Htiling,tot, бит/сигнатура | Линейная | 0.886 | 0.827 | 0.426 |
Ранговая | 0.779 | 0.774 | 0.615 |
Примечание. с.с. – степень свободы.
Рис. 2. Диаграмма рассеяния Htiling и IG (а), Htiling,tot и IG,tot (б) для каркасов цеолитного типа.
Самым сложным в исследованной выборке оказался тайлинг каркаса PAU (Htiling,tot = 2928.3 бит/сигнатура), обладающего и наибольшим значением IG,tot = 4763.5 бит/яч. В то же время еще более сложный каркас SFV (IG,tot = 19557.6 бит/яч.) [32] в исследованную выборку не попал. Самым простым оказался тайлинг каркаса ABW (Htiling,tot =9.5 бит/сигнатура), в то время как самый простой каркас – содалитовый (SOD, IG,tot = 16.5 бит/яч. [32]). Тайлинги, как и каркасы, можно классифицировать по классу сложности [36]: очень простые (0–20 бит/сигнатура), простые (20–100), средней сложности (100–500), сложные (500–1000) и очень сложные (более 1000). Больше 80% тайлингов простые или средней сложности (рис. 3).
Рис. 3. Доля натуральных тайлингов разного класса сложности для каркасов цеолитного типа.
Натуральные тайлинги позволяют строить маршруты миграции катионов по пустотам каркаса и прогнозировать ионную проводимость, поэтому они имеют важное значение не только для каркасов цеолитного типа, но и для “антицеолитных” [37] катионных каркасов [38], а также для смешанных тетраэдрических (TT) каркасов, например, в структурах боро- [39] и бериллофосфатов [40], и даже для гетерополиэдрических MT-каркасов, например, в структурах эвдиалита [41], алюодита [42], келдышита [43], минералов группы колумбита [44], лабунцовита [45], в структурах синтетических германатов [46], ванадатов [47], молибдатов [48]. Расчет комбинаторной сложности по С.В. Кривовичеву для любого каркаса легко провести в пакете программ ToposPro [28], расчет дополнительных индексов, таких как конфигурационная сложность по Хорнфеку, возможен с помощью Python-приложения crystIT [15]. Однако, не имея cif-файла со структурными данными, провести такие расчеты невозможно. Для расчета комбинаторной сложности сигнатуры натурального тайлинга, наоборот, требуются не структурные данные, а только сигнатура тайлинга. Поэтому этот индекс сложности легко использовать в экспертных системах, не привязанных непосредственно к структурным данным. Исследователь, не являющийся специалистом в кристаллографии, может рассчитать этот индекс для серии соединений просто по списку сигнатур в литературном источнике.
Автор выражает благодарность за помощь С.М. Аксенову (КНЦ РАН), а также коллективу Международного научного-исследовательского центра по теоретическому материаловедению (г. Самара, Россия) за научный семинар, в результате которого родилась идея настоящей работы.
Работа выполнена по госзаданию Института геохимии и аналитической химии им. В.И. Вернадского РАН.
About the authors
D. А. Banaru
Vernadsky Institute of Geochemistry and Analytical Chemistry of RAS
Author for correspondence.
Email: banaru@geokhi.ru
Russian Federation, Moscow
References
- Shannon C.E. // Bell Syst. Tech. J. 1948. V. 27. P. 379. https://doi.org/10.1002/j.1538-7305.1948.tb01338.x
- Sabirov D.S., Shepelevich I.S. // Entropy. 2021. V. 23. https://doi.org/ 10.3390/e23101240
- Sabirov D., Tukhbatullina A., Shepelevich I. // Liquids. 2021. V. 1. P. 25. https://doi.org/ 10.3390/liquids1010002
- Sabirov D., Tukhbatullina A.A., Shepelevich I.S. // J. Mol. Graph. Model. 2022. V. 110. P. 108052. https://doi.org/10.1016/j.jmgm.2021.108052
- Zimina A.D., Shepelevich I.S., Sabirov D.S. // Russ. J. Phys. Chem. A. 2023. V. 97. P. 2099. https://doi.org/ 10.1134/S0036024423100291
- Zimina A.D., Tukhbatullina A.A., Sabirov D.S. // Dokl. Phys. Chem. 2023. V. 513. P. 181. https://doi.org/ 10.1134/S0012501623600365
- Sabirov D.S., Zimina A.D., Tukhbatullina A.A. // J. Math. Chem. 2024. V. 62. P. 819. https://doi.org/ 10.1007/s10910-023-01566-5
- Krivovichev S. // Acta Cryst. A. 2012. V. 68. P. 393. https://doi.org/ 10.1107/S0108767312012044
- Krivovichev S.V. // Angew. Chemie. 2014. V. 53. P. 654. https://doi.org/ 10.1002/anie.201304374
- Krivovichev S.V. // Acta Cryst. B. 2016. V. 72. P. 274. https://doi.org/ 10.1107/S205252061501906X
- Krivovichev S.V. // Z. Krist. 2018. V. 233. P. 155. https://doi.org/ 10.1515/zkri-2017-2117
- Krivovichev S.V., Krivovichev V.G. // Acta Cryst. A. 2020. V. 76. P. 429. https://doi.org/ 10.1107/S2053273320004209
- Hornfeck W. // Acta Cryst. A. 2020. V. 76. P. 534. https://doi.org/ 10.1107/S2053273320006634
- Hornfeck W. // Z. Krist. 2022. V. 237. P. 127. https://doi.org/ doi: 10.1515/zkri-2021-2062
- Kaußler C., Kieslich G. // J. Appl. Cryst. 2021. V. 54. P. 306. https://doi.org/ 10.1107/s1600576720016386
- Hallweger S.A., Kaußler C., Kieslich G. // Phys. Chem. Chem. Phys. 2022. V. 24. P. 9196. https://doi.org/ 10.1039/D2CP01123A
- Banaru D., Hornfeck W., Aksenov S., Banaru A. // CrystEngComm. 2023. V. 25. P. 2144. https://doi.org/ 10.1039/D2CE01542K
- Siidra O.I., Zenko D.S., Krivovichev S.V. // Am. Mineral. 2014. V. 99. P. 817.
- Banaru A.M., Banaru D.A., Aksenov S.M. // Crystallography Reports. 2022. V. 67. P. 521. https://doi.org/ 10.1134/S106377452203004X
- Banaru A.M., Banaru D.A., Aksenov S.M. // Crystallography Reports. 2022. V. 67. P. 1133. https://doi.org/ 10.1134/S1063774522070410
- Юшкин Н.П., Шафрановский И.И., Янулов К.П. Законы симметрии в минералогии. Л.: Наука, 1987. 335 с.
- Voytekhovsky Y.L. // Vestn. Geosci. 2022. V. 325. P. 44. https://doi.org/ 10.19110/geov.2022.1.4
- Tuomisto H. // Oecologia. 2010. V. 164. P. 853. https://doi.org/ 10.1007/s00442-010-1812-0
- Banaru D.A., Banaru A.M., Aksenov S.M. // Crystallograhpy Reports. 2024. V. 69. № 7. P. 1019. https://doi.org/ 10.1134/S1063774524601503
- Krivovichev S.V., Borovichev E.A. // Biogenic–Abiogenic Interactions in Natural Anthropogenuc Systems 2022 / Ed. Frank-Kamenetskaya O.V. et al. Cham: Springer International Publishing, 2023. P. 651.
- Blatov V.A., Delgado-Friedrichs O., O’Keeffe M., Proserpio D.M. // Acta Cryst. A. 2007. V. 63. P. 418. https://doi.org/ 10.1107/S0108767307038287
- Blatov V.A. // J. Struct. Chem. 2009. V. 50. P. 160. https://doi.org/ 10.1007/s10947-009-0204-y
- Blatov V.A., Shevchenko A.P., Proserpio D.M. // Cryst. Growth Des. 2014. V. 14. P. 3576. https://doi.org/ 10.1021/cg500498k
- Csiszár I. // Entropy. 2008. V. 10. P. 261. https://doi.org/ 10.3390/e10030261
- Sabirov D.S. // Comput. Theor. Chem. 2020. V. 1187. P. 112933. https://doi.org/ 10.1016/j.comptc.2020.112933
- Anurova N.A., Blatov V.A., Ilyushin G.D., Proserpio D.M. // J. Phys. Chem. C. 2010. V. 114. P. 10160. https://doi.org/ 10.1021/jp1030027
- Krivovichev S.V. // Micropor. Mesopor. Mater. 2013. V. 171. P. 223. https:// doi.org/10.1016/j.micromeso.2012.12.030
- Банару Д.А. // Матер. Междунар. молодежного науч. форума “ЛОМОНОСОВ-2021”. Секция “Геология”, подсекция “Кристаллография и Кристаллохимия”. М.: МАКС Пресс, 2021. https://lomonosov-msu.ru/archive/Lomonosov_2021/data/section_6_22056.htm
- Database of Zeolite Structures. https://www.iza-structure.org/databases/
- Banaru D.A., Aksenov S.M., Banaru A.M., Oganov A.R. // Z. Krist. 2024. V. 239. P. 207. https://doi.org/ doi: 10.1515/zkri-2024-0062
- Krivovichev S.V. // Angew. Chemie. 2014. V. 53. P. 654. https://doi.org/ 10.1002/anie.201304374
- Rashchenko S.V., Bekker T.B. // J. Struct. Chem. 2021. V. 62. P. 1935. https://doi.org/ 10.1134/S002247662112012X
- Topnikova A.P., Eremina T.A., Belokoneva E.L. et al. // Micropor. Mesopor. Mater. 2020. V. 300. P. 110147. https://doi.org/ 10.1016/j.micromeso.2020.110147
- Aksenov S.M., Yamnova N.A., Borovikova E.Y. et al. // J. Struct. Chem. 2020. V. 61. P. 1760. https://doi.org/ 10.1134/S0022476620110104
- Кобелева Е.А., Аксенов С.М., Банару А.М. и др. // Матер. XII Всерос. молодежной науч. конф. “Минералы: строение, свойства, методы исследования”. Институт геологии и геохимии УрО РАН, Екатеринбург, 2021. C. 74.
- Aksenov S.M., Kabanova N.A., Chukanov N.V. et al. // Acta Cryst. B. 2022. V. 78. P. 80. https://doi.org/ 10.1107/S2052520621010015
- Aksenov S.M., Yamnova N.A., Kabanova N.A. et al. // Crystals. 2021. V. 11. P. 237. https://doi.org/ 10.3390/cryst11030237
- Kabanova N.A., Panikorovskii T.L., Shilovskikh V.V. et al. // Crystals. 2020. V. 10. P. 1016. https://doi.org/ 10.3390/cryst10111016
- Chukanov N.V., Pasero M., Aksenov S.M. et al. // Mineral. Mag. 2023. V. 87. P. 18. https://doi.org/ 10.1180/mgm.2022.105
- Vaitieva Y.A., Chukanov N.V., Vigasina M.F. et al. // J. Struct. Chem. 2024. V. 65. P. 1357. https://doi.org/ 10.1134/S0022476624070072
- Dal F., Aksenov S.M., Burns P.C. // J. Solid State Chem. 2019. V. 271. P. 126. https://doi.org/ 10.1016/j.jssc.2018.12.044
- Chong S., Aksenov S.M., Dal Bo F. et al. // Z. Anorg. Allg. Chemie. 2019. V. 645. P. 981. https://doi.org/10.1002/zaac.201900092
- Aksenov S.M., Pavlova E.T., Popova N.N. et al. // Solid State Sci. 2024. V. 151. P. 107525. https://doi.org/ 10.1016/j.solidstatesciences.2024.107525
Supplementary files
Note
In the print version, the article was published under the DOI: 10.31857/S0023476125010206





