Математика как язык исследования

 

Щеглов В.Н.


Математика как язык исследования: основы алгоритмической интерпретации


Перед чтением этой статьи весьма желательно хотя бы бегло ознакомиться с книгой автора [1], также с более поздней публикацией [2] и с вводной частью статьи [6] ‒ все это необходимо, поскольку именно там приведено подробное описание алгоритма построения алгебраических моделей конструктивной логики (АМКЛ, моделей творческого сознания) и пояснения к практическому использованию этого алгоритма.

Мы полагаем, что существует некоторый логико-математический язык [3], который частично отображает творческое сознание [1] исследователей и, в частности, модель такого сознания в виде АМКЛ. В кратком обзоре некоторых разделов математики будет показано их использование при построении модели искусственного интеллекта при введении некоторых дополнительных семантических соглашений, которым должно удовлетворять наше понимание формул такого языка. Далее будут указаны лишь отдельные разделы математики, позволяющие значительно расширить в дальнейшем этот исходный логический, “качественный” язык нашего взаимного общения со сложным объектом исследования.

Статья предназначена для студентов высших учебных заведений и также для специалистов в области математической логики.


1. Арифметика.

Все виды чисел являются переменными в алгоритме построения АМКЛ, в наиболее частом случае это натуральные числа (включающие также и ноль). Другие виды чисел, записанные в массиве исходных данных Х с ограниченным числом десятичных значений после запятой, путем простых преобразований всегда могут быть также записаны в виде натуральных чисел (комплексные числа – каждое в виде двух переменных, двух столбцов в массиве Х). Целевая функция Z будет как правило принимать булевы значения (0, 1); если исходная целевая функция У отображается, например, вещественными числами, они упорядочиваются на числовой прямой, вычисляется их медиана, затем соответствующие подмножества обозначаются булевыми значениями Z(0, 1). В зависимости от исходной информации целевая функция Z может быть также задана в виде многозначной логики при Z= (0, 1, 2, …, k). Однако при больших массивах информации использование моделей в булевой форме обычно позволяет получать более компактные и легче интерпретируемые в дальнейшем модели.


2. Элементарная алгебра.

Будем для нашей модели интерпретировать правила тождественных преобразований формул как введение классов эквивалентности. В булевых формах АМКЛ, где большинство переменных имеют булевы значения, множества состояний исследуемого объекта, вошедшие в импликации К, будут такими классами – каждый из них рассматривается как единое целое. Такая факторизация множества Х весьма удобна для качественной интерпретации выводов К при сравнении их с априорными (литературными) данными, а при использовании поисковых систем позволяет формировать обобщенные ключевые слова для таких поисков (хотя бы в близких областях знаний). Заметим, что для интерпретации поисков в таких определенных областях ранг r импликации К всегда может быть увеличен (см. п.3), надо лишь помнить, что интервал dx (см. далее) должен быть в данном случае замкнутым, ограничен его крайними значениями для сохранения истинности К.

Всё вышеприведенное сохраняет свое значение и для интервальной (предикатной) формы АМКЛ, где большинство переменных имеют вещественные значения. В таких моделях вычисляются многомерные области dx определения переменных в АМКЛ (в итоге это выводы К). Интервальная форма удобна при вычислении, в частности, производственных регламентов (ограничений, допусков) и подобных правил практического использования выводов логической модели.


3. n-мерные многогранники.

В некоторых случаях, например, для проявления интуиции [7] исследователя в виде некоторых зрительных образов, результаты вычисления АМКЛ можно представить в виде r-мерных многогранников, где r – ранг, число переменных, соответствующих импликаций К. Здесь самое интересное заключается в том, что можно достраивать ранг К до требуемого за счет контекста для этого К. Это, в частности, необходимо при использовании подходящей априорной теории, которая требует включения в расчеты определенной переменной. Напомним, что контекст для К – это те переменные, которые не вошли в К (в покрытие для всех Г его строк из массива Х).


4. Ряды Эрмита для обобщенных функций.

Часто на практике требуется аппроксимировать подмножества К, соответствующих АМКЛ, для построения, например, переменной структуры управления объектом с помощью некоторой аналитической модели. Ряды Эрмита в виде обобщенной функции [5] удобны в данном случае тем, что можно задавать требуемую степень гладкости такого рода эрмитовых моделей (ЭМ). Для построения и последующей их интерпретации примем, что вне итоговых многомерных интервалов dx для каждого К вещественная целевая функция У принимает свое среднее значение У*. В этом случае аппроксимация каждой К дает на графике некоторую кривую, где по ординате отложено свое значение У, а за “многомерную ось” х принята абсцисса, проходящая через У*. Если же х выходит за пределы своего интервала dx, то эта кривая стремится к У*. В итоге, ЭМ в виде некоторого набора рядов Эрмита (их общее число будет равно числу импликаций К в тупиковой форме АМКЛ) отображает обобщенную функцию, которая весьма удобна в различных приложениях. Так, можно весьма просто делать преобразование Фурье для всей ЭМ – ряды остаются прежними, лишь нечетные его члены умножаются на мнимое i. Такого рода модели удобны для отображения объектов, зависящих от волновых процессов (также и для квантовых объектов).

Геометрический образ ЭМ в данном случае – это вид раскрытой книги, где любому листу соответствует евклидово r-мерное пространство для каждого К; все эти листы-пространства “склеены” в корешке У* такой книги.

Обобщенная функция является расширением понятия функции, т.е. она отображает некоторый функционал (обозначим его также как ЭМ), значения которого варьируют при заданном способе аппроксимации каждой К рядами Эрмита – при варьировании как числа членов этого ряда, так и наличия лишь некоторых из них для достижения требуемого статистического критерия. В необходимых случаях осуществляется также поиск оптимального значения функционала ЭМ (т.е. поиск его по всем К). При исследовании поведения сложного объекта исследования во времени следует отметить, что варьирование функционала ЭМ происходит также как бы само собой, в основном за счет неизвестных (неучтенных) или “скрытых” переменных.


5. Сфера Римана.

Весьма наглядна также геометрическая интерпретация ЭМ как сферы Римана, радиус которой равен У*. Некоторые участки такой ЭМ будут иметь для каждого К (Z=1) вид как бы “горной местности”, а для Z=0 “провалы” для отрицательных локальных значений У – во всех случаях при подходящем нормировании значений всех х. Поверхность такой многомерной сферы (на уровне У*) состоит как бы из отдельных малых плоских участков с евклидовыми координатами. Угол между этими малыми плоскостями соответствует кривизне сферы Римана при переходе от одной импликации К к другой. Заметим, что этот зрительный образ дает нам лишь некоторый намек, как может выглядеть такая модель при большом числе переменных (для трех переменных это что-то вроде “амёбы” в поле зрения микроскопа). Возможно, почти для всех К многие недостающие интервалы dx следовало бы брать из контекста. Однако тогда, для сохранения истинности исходной логической модели пришлось бы делать эти интервалы замкнутыми, им будут соответствовать резкие “провалы” или “подъемы”.


6. Топология.

Обычно при исследовании объекта (числового массива) Х полагают, что все последовательные во времени его состояния взаимно однозначно и непрерывно отображают друг друга. Пусть вычисленная АМКЛ сохраняет это взаимное отображение. Это означает, что при построении итоговой АМКЛ происходит конструирование некоторого набора связных пространств К – их невозможно разбить на два непересекающихся открытых подмножества, как бы распространяющихся вплоть до крайних значений “точек” из “чужих” строк при Z=0 (см. алгоритм вычисления АМКЛ). В итоге при построении тупиковой дизъюнктивной формы модели происходит вычисление некоторого сравнительно малого набора связных пространств. Эти действия похожи на решение транспортной задачи минимизации числа пересадок: строится малое число маршрутов, при использовании которых число пересадок минимально. Каждый из таких маршрутов является некоторым связным пространством в том смысле, что мы не можем его разбить его на какие-то две части, чтобы уменьшить число пересадок. Внутри таких маршрутов пересадочные станции могут и быть, но их можно пропустить. Непрерывность, связность каждого из таких отдельных итоговых маршрутов соответствует отдельным импликациям в тупиковой форме АМКЛ.

Построение тупиковой формы происходит следующим образом. Подсчитываются числа (оценки) Г встречаемости каждой итоговой импликации К с определенным набором переменных х, затем все оценки Г упорядочиваются по убыванию. Выбирается К с максимальной Г, для нее запоминаются номера строк из Х (т.е. строится “покрытие” этой К “своими” строками из Х). Выбирается следующая по рангу Г импликация К, выполняем те же операции. Ее покрытие может полностью включаться в покрытие предыдущей К, тогда происходит удаление очередной К; если лишь частично совпадает, оставляем эту К в тупиковой форме; то же, если новое покрытие полностью не совпадает с общим покрытием предыдущих К и т.д. до исчерпания всего списка упорядоченных К. Все эти операции производятся по отношению ко всему ранее построенному покрытию. Заметим, что по построению (по алгоритму АМКЛ) все эти покрытия К являются открытыми множествами.

Тупиковая форма АМКЛ также компактна: в любом его покрытии найдётся конечное (замкнутое) подпокрытие. Здесь вспомним вычисление “контекста” для некоторых К, который иногда необходим исследователю для более эффективного информационного поиска содержательного смысла таких К. Эти поиски соответствуют неформальному, обобщенному пониманию первой теоремы Гёделя, утверждающей, что если формальная арифметика непротиворечива, то в ней также могут существовать и невыводимые и неопровержимые формулы, т.е. некоторые непротиворечивые выводы (по отношению к массиву Х), которые можно найти в результате информационного поиска.


7. Метод конечных разностей.

Вычисление исходных К и далее АМКЛ очень похоже на численный метод решения дифференциальных уравнений. Каждая целевая строка из Х (Z=1) задает свои начальные условия, обозначим их как х* (для каждой строки “свой” х*). Каждая такая строка сравнивается со своей окрестностью нецелевых строк (Z= 0); постепенно вычисляется всё уменьшающийся открытый интервал dx, который в итоге при истинности формулы К определяет два граничных условия, малого и большого значений многомерного х (для вещественных переменных). Итоговая тупиковая форма АМКЛ как бы является решением таких “дифференциальных уравнений”, которые в некотором скрытом виде присутствуют в Х (мы полагаем, что исследуемый объект непрерывно изменяется во времени).

Напомним, как вычисляется окрестность, состоящая из нецелевых строк, для каждой целевой (Z=1) строки. Пусть ей соответствует (каждой) свое локальное нулевое время отсчета t*=0, далее вычисляем локальные времена всех нецелевых строк (Z=0) и упорядочиваем по возрастанию их абсолютных значений (т.е. по их норме). Далее происходит сравнение всех переменных х данной целевой строки со всеми х всех нецелевых строк, которые выбираются по возрастанию их нормы. Вычисляется минимальное значение dx (по ходу усложнения К-гипотез) и т.д. Введение “своих” локальных времен t* отсчета состояний t исследуемого объекта позволяет ускорить сходимость алгоритма АМКЛ и далее упростить интерпретацию выводов К. В частности, при медленном эволюционировании во времени объекта Х ближайшие к t* нецелевые состояния должны быть близки к целевому с локальным временем t*=0. Здесь уже на первых шагах алгоритма почти сразу “вычеркиваются” многие несущественные, в данном случае, возможно, неизменяющиеся и также “скрытые” переменные. При сопоставлении же строк, например, при использовании обычного времени их регистрации вычислялись бы “непротиворечивые” выводы К, но они в действительности зависели бы также и от воздействия “скрытых” переменных. Например, когда на самом первом шаге вычисления К производилось бы сравнение целевой строки с весьма удаленной по времени нецелевой, то в этом случае, возможно, исходная гипотеза предполагаемой “почти” стационарности объекта Х была бы нарушена. Действительный смысл таких выводов было бы трудно понять при информационном поиске.


8. Байесовская вероятность.

Такого вида вероятность используется для определения степени уверенности в истинности суждения (определенной гипотезы) при получении новой информации. Минимизация dx по алгоритму АМКЛ происходит последовательно при очередном увеличении ранга r конъюнкции (гипотезы) К: “Если К, то Z=1”. (Напомним, что в дальнейшем все подобные вычисления производятся также и для Z= 0). Если эта гипотеза ложна, происходит поиск в более расширенной временной окрестности нецелевых строк и вычисляется очередная единственная переменная х (т.е. ранг r для гипотезы К увеличивается). При дальнейшем ходе алгоритма в итоге происходит исчезновение интервала dx: он как бы “схлопывается”, обнуляется – здесь делаем по алгоритму шаг назад и продолжаем вычисления для этой новой гипотезы. Если в итоге формула К истинна, происходит запись этой конъюнкции-импликации. Если же формула К ложна, помечаются все строки из Z=0, которые противоречат такой гипотезе, далее по ходу алгоритма число этих меток может только убывать. Можно сказать, что степень нашей уверенности в истинности каждой очередной гипотезы (конъюнкции К) обратно пропорциональна числу этих убывающих меток.

Заметим, что с точки зрения математической статистики алгоритм построения АМКЛ не только решает те же задачи, что и факторный анализ (и методы планирования экспериментов), но может использовать как вещественные переменные, так и качественные – слова, которые просто кодируются натуральными числами. Другое достоинство АМКЛ, которое обычно на практике удивляет исследователей – это истинность получаемых выводов К (во всяком случае для используемой выборки Х). Основное же достоинство, это, конечно, удобство логической модели для интерпретации полученных выводов.

Для вычисления вероятностной формы АМКЛ (она требуется, например, в квантовых задачах) подсчитывается число строк Г*, вошедших лишь в непересекающиеся части всех покрытий в Х и делим их на m – общее число строк в Х. Сумма таких Г*/m равна единице. В случае сильно “зашумленных” объектов Х наблюдается множество К при Г=1 (эти “открытые точки” могут быть как внутри крупных покрытий, так и вне). Им соответствуют свои Г*, при качественной интерпретации выводов К их обычно не учитывают. Но такие единичные выводы тоже истинны в данном массиве Х. Можно, например, попытаться аппроксимировать рядами Фурье полностью все импликации К в тупиковой форме, включая и К с Г=1 (их можно представить, как минимальные, неделимые многомерные кубики-“кванты”). Можно задать весьма слабый статистический критерий приемлемости вычисляемых моделей, в этом случае (с помощью высоких частот) они будут весьма приблизительно отображать даже и такие зашумленные модели. С квантовой точки зрения их можно интерпретировать как некоторую расплывчатую “квантовую рябь” на сфере Римана, отображающей обобщенную функцию для всех К с большими оценками Г.


При исследовании сложных объектов, для которых существует их отображение в виде массива зарегистрированных данных Х, многие специалисты в вышеуказанных областей математики, могут также использовать метод построения алгебраических моделей конструктивной (интуиционистской) логики АМКЛ, который удобен для интерпретации таких сложных объектов с целью, например, как “открытия” новых теорий, как бы “зашифрованных” в массиве Х, так и для стимуляции своей интуиции, в частности, для формулирования более точных ключевых слов (“ключа шифра”) для использования необходимого в дальнейшей работе информационного поиска.


Литература


1. Щеглов В.Н. Творческое сознание: интуиционизм, алгоритмы и модели. – Тула: «Гриф и К», 2004. – 201 с., см. книгу автора (и все другие статьи) также в Интернете: http://samlib.ru/s/sheglow_w_n/ [samlib.ru] , http://publ.lib.ru/ARCHIVES/SCH/SCHEGLOV_Vitaliy_Nikolaevich/_Scheglov_V.N..html [publ.lib.ru] (здесь статьи с формулами), http://shcheglov.livejournal.com/ [shcheglov.livejournal.com] , некоторые работы могут быть в http://web.snauka.ru/wp-admin/ [web.snauka.ru] ).

2. Щеглов В.Н. Творческое сознание: интерпретация алгоритма построения алгебраических моделей конструктивной (интуиционистской) логики, 2007. – 12 с.

3. Драгалин А. Г. Математический интуиционизм. – М.: «Наука», 1979. – 256 с.

4. Шанин Н.А. Об иерархии способов понимания суждений в конструктивной математике// Труды математического института имени В. А. Стеклова, CXXIX // Проблемы конструктивного направления в математике, 6. – Л.: «Наука», 1973. – С. 203 – 266.

5. Антосик П., Микусинский Я., Сикорский Р. Теория обобщенных функций. – М.: Мир, 1976. – 312 с.

6. Щеглов В. Н. Темная энергия: алгоритмическая интерпретация, 2014. − 5 с.

7. Щеглов В. Н. Интуиция: основы алгоритмической интерпретации, 2018. – 6 с.

8. https://ru.wikipedia.org/wiki/Математика [ru.wikipedia.org] (см. здесь также все ссылки).


См. Гугл диск автора: https://drive.google.com/drive/folders/0B8UW6pCzyM-7UVpoODdCdU9XOU0 [drive.google.com]


30.11.2018 г.


Сторінка з

Будь ласка, увійдіть (або зареєстуйтесь) щоб залишити коментар