Четверг, 25.04.2024
Мой сайт
Меню сайта
Категории раздела
Мои статьи [7]
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа
Главная » Статьи » Мои статьи

aReadmeXytBmp4

aReadmeXytBmp4

KinoBmp  Продолжение

aReadmeXYTbmp для HabibTG 1.0.3 xyt

Дополнительная инструкция 2. BMP-Эпизоды (KinoBmp)

 

 

4. О точках соприкосновения проекта в целом, авторской модели восприятия и программы Habibtg с реальным внешним миром, психофизикой и физиологией

 

Физиология показала, что процессы возбуждения и торможения являются универсальными механизмами, участвующими при реализации различных сложных логических схем обработки информации. Они легко управляют параллельными процессами. Даже для формирования и образного, и логического мышления природе не понадобилась «последовательная» машина типа современного компьютера.

Из этой универсальности следует, что многие свойства информационных процессов на «микро» и «макро» уровне совпадают.

Например, можно проигнорировать фоторецептор, ганглиозную клетку, а можно проигнорировать и целые образы и объекты.

Действительно, в информатике, в отличие, например, от теоретической механики, ни масса объекта, ни размеры, ни расстояния как таковые не имеют такого большого значения. Скорее имеет значение содержание информации, очерёдность, характер и время её обработки и передачи.

Работы [1], [2], [3], [4] и др. убедили автора, что результатом восприятия объектов любой сложности и размеров, как и познания вообще, является формирование так называемых классов связности, которые включают в себя отдельные разрозненные до того элементы и явления внешнего мира.

Поэтому имеет смысл поискать общие свойства компьютерной программы и зрительного аппарата человека. Скажем, попробовать выяснить, компьютерная программа использует те же информационные элементы, что и наш зрительный аппарат, или нет?

Рассмотрим такой пример. Пусть некая гипотетическая программа распознаёт идеальные печатные буквы путём полного сличения по пикселам изображения с имеющимися эталонами. Ясно, что при этом можно вообще не говорить о явлениях индукции.

Если в таких случаях программа работает правильно и быстро, у нас обычно никаких претензий к программе не возникает.

Если же при незначительных изменениях масштаба изображения, повороте или наклоне программа вообще перестаёт работать, у нас возникает сразу ряд вопросов. Например, наш зрительный аппарат работает с понятием «отрезка» с помощью рецептивных полей соответствующих форм, а программа – нет. Не является ли это следствием того, что при разработке программы вообще не учитывались требования инвариантности к определённым преобразованиям, очевидные с общесистемной точки зрения?

Возможен другой случай. Допустим, программа во всём проявляет внешнее сходство с работой нашего зрительного аппарата, работает правильно, но в некоторых случаях очень медленно. Тогда такое внешнее сходство – дополнительный аргумент в пользу того, чтобы не браковать программу целиком. Возможно, мы имеем дело с объективно существующим в природе информационным процессом, «неподъёмным» для современного «последовательного» процессора. Тогда надо просто изучать и оценивать тот объём информации, который перерабатывает природа и наметить пути решения проблемы в будущем. А на существующем компьютере просто временно и сознательно упростить процесс именно на данном участке программы с минимальной потерей качества распознавания. Такие решения могут оказаться судьбоносными для проекта, так как могут определять направление разработки на десятилетия вперёд или даже вообще спасти проект от краха.

Мы видим, что сравнение поведения программы и зрительного аппарата может быть очень полезным.

 

4.1 Как создавалась авторская модель восприятия и почему её можно считать правильной?

 

Когда известно, что работа, связанная с программированием, может занять десятилетия, разработчика-исследователя не может не волновать вопрос о правильности той теоретической модели, на которой будет базироваться разрабатываемая им система. В данном случае это модель восприятия, изложенная в работе [11] «К проблеме узнавания, часть 2 …» и др. Только при правильной общей модели мы можем рассчитывать на успех и экспериментальное подтверждение конкретных результатов в процессе развития проекта.

 

Поэтому прежде чем перейти к сравнениям на уровне физиологии, следует рассказать, как автор на «макро» - уровне проводил исследования фактического (экспериментального) материала из реального внешнего (осязаемого нашими органами чувств) мира, как решал стоявшие тогда научные проблемы и как строил теоретические модели.

Если бы мы занимались любой другой наукой, такой, как физика или химия, это могло бы показаться ненужным и лишним занятием, так как в науке важен прежде всего результат. Но мы изучаем разные проявления, как бы разные экспериментально измеряемые «срезы» одного и того же информационного процесса, называемого восприятием и мышлением. А творческий процесс сам по себе является предметом нашего внимания.

Теоретически было возможно, что тайны всех трёх «срезов» (музыкальные мелодии, перспективные искажения и распознавание зрительных образов) были бы разгаданы независимо друг от друга и как бы случайно. Фактически же «алгеброй гармонию поверить» не удавалось даже за сотни лет из-за невероятной сложности каждой отдельно стоящей задачи.

К счастью, иногда развитие науки – это более гибкий, целенаправленный и продуктивный процесс, когда череда конкретных наблюдений и открытий приводит к определённым обобщениям, выдвижению новых гипотез, опирающихся на эти обобщения, новым наблюдениям, подтверждению или опровержению этих гипотез и т.д.

Постулаты и методология построения модели, сформированные и подтверждённые на одном «срезе» изучаемого процесса – это хороший задел для обобщения, построения по аналогии модели следующего «среза» и его изучения. При этом с каждым разом растёт доверие не только к постулатам, но и к методологии построения теоретической (и математической, и компьютерной) модели. В этом случае каждая следующая проблема решается уже не с нуля, методом проб и ошибок, что могло растянуться опять на столетия, а решается благодаря удачному обобщению модели и расширению сферы её применения.

Именно таким оказался путь к авторской модели восприятия.

Рассмотрим подробнее эти «срезы», точнее – основные направления работ на этом пути.

 

4.1.1 Направление 1. Музыкальные мелодии

 

Разгадка тайны структурной организации мелодии (формы) заняла у автора около десяти лет.

Впервые желание разгадать закономерности в мелодиях у меня возникло, видимо, после нескольких музыкальных диктантов на уроках сольфеджио. В общеобразовательной школе мы только начинали изучать алгебру, поэтому решение задачи представлялось в виде некой «формулы мелодии», которую надо было «вывести».

Когда начали изучать последовательности, единственное, что удалось установить - это то, что хроматическая гамма представляет собой арифметическую прогрессию, так как каждый следующий звук отличается от предыдущего на одну и ту же величину – пол тона.

В своё время дома у нас был патефон, потом – радиола (радиоприёмник-проигрыватель), на которой мы проигрывали одну и ту же пластинку с разными скоростями. Было ясно, что меняются темп и высоты звуков, но мелодия остаётся той же самой.

Полученные знания по физике помогли понять, например, что частота ноты «до» второй октавы ровно в 2 раза больше частоты «до» первой октавы. А принятый в музыке «интервал» в пол тона означает, что частота второго звука равна частоте первого звука, умноженной на корень двенадцатой степени из двух. Так что частоты звуков хроматической гаммы образовывали геометрическую прогрессию.

Позже, когда «проходили» логарифмы, было ясно, что расстояние в музыке в «полутонах» - это логарифмы от отношения частот по основанию «корень двенадцатой степени из двух». Поэтому при прокручивании пластинки на разных скоростях все звуки сдвигаются на одно и то же количество полутонов, а мелодия остаётся той же самой. Это – известная в музыке операция транспонирования.

В школьные годы не удалось разгадать «формулу мелодии». Но в музыкальной школе я успел узнать и запомнить, что мелодия делится на определённые сегменты – вопросы, ответы, фразы, периоды и т.д. И что самые устойчивые и выраженные связи – между первым и последним звуками.

 

Когда в институте мы изучали системы линейных уравнений, я опять вспомнил про мелодии. Если мелодия начинается и кончается на тонике, это можно записать простым уравнением

X1-Xn=0

где X1 – высота первого звука, Xn – высота последнего звука.

Подумалось, а что, если мелодии описываются не одной какой-то формулой, или последовательностью, а целой системой уравнений?

Подкупала смелость, с которой линейная алгебра оперировала матрицами коэффициентов любых размеров. Казалось, уж при таком глобальном подходе «не ускользнёт» никакая закономерность, если она только существует.

Идея заключалась в следующем. Допустим, у нас есть некая система уравнений, «описывающая» мелодии, и при подстановке нескольких известных (общепризнанных) мелодий в эту систему они ей удовлетворяют, т.е. являются её решениями. Тогда можно было бы попытаться найти новое решение этой системы, и, прослушав полученную таким образом последовательность звуков, понять, является она мелодией или нет.

При формировании такой системы уравнений надо будет сравнивать не только подряд идущие звуки и первый и последний звук, но и вообще все пары звуков Xi и Xj ( i > j).

Например, если система формируется на основе двух известных мелодий, то уравнение

Xi-Xj=dij

включалось в систему, если величина dij оказывалась одинаковой для обеих мелодий.

Естественно, две исходные мелодии являлись решением полученной таким образом системы по построению.

Через несколько лет у меня появилась возможность выполнить эту работу на ЭВМ и получить, наконец, положительные результаты.

Были получены длинные, до 64 звуков, новые мелодии, не содержавшие музыкальной фальши.

Вероятность случайного построения таких мелодий практически равна нулю.

Программирование и эксперименты заняли около 8 месяцев. В эксперименте использовались две группы из 7 и 11 мелодий соответственно. При этом пришлось косвенно учитывать неоднозначный и статистический характер связей.

Были построены конкретные классы связности.

В ходе экспериментов было открыто явление, названное впоследствии «интерференцией голосов».

Таким образом форма музыкальной мелодии была графически показана в двух разрезах – вдоль оси времени «t» и поперёк, при t=Const.

Так многочисленные попытки почти случайно привели к положительному результату.

Хорошо, что после этого мне захотелось теоретически обосновать этот результат.

Например, чтобы понять, с какими свойствами восприятия связан именно такой вид закономерностей, и единственный ли он возможный?

Тут повезло ещё раз. Ещё в школьные годы мама купила мне только что вышедший четырёхтомник А. Эйнштейна. Я запомнил, как создатель специальной теории относительности использовал инварианты в уравнениях в его знаменитой работе «К электродинамике движущихся тел». Так что методику долго выбирать не пришлось.

Созданная теория и результаты были изложены в работе [2]. Было показано, что использованные мной уравнения можно «вывести» из таких свойств восприятия, как константность, ассоциативность, избыточность, избирательность, забывание. Был также сформулирован так называемый принцип доминанты.

Константность «подсказывала», к каким преобразованиям должны быть инвариантны искомые разделяющие функции и что эти преобразования должны быть связаны со свойствами внешнего (для наших органов чувств) мира.

Ассоциативность – что надо ограничиться несколькими переменными в искомых разделяющих функциях и ориентироваться на целую систему из таких уравнений.

Избыточность, избирательность, забывание «напоминали», что надо уметь работать с множеством запоминаемых связей. Принцип доминанты выступал одним из полезных инструментов при этой работе.

Эти же свойства также проливали свет на механизм формообразования и обучения.

Когда-то я до боли в черепной коробке длительное время думал о том, почему одни соотношения (связи) между звуками считаются допустимыми, или предпочтительными, а другие - нет. Вопрос оставался актуальным, если даже отсеять физиологически неприятные варианты. Рассмотрение формы в динамике, наличие разных национальных музыкальных особенностей, обучающаяся программа (особенно зрительным образам) помогают понять условность и изменчивость этих связей.

 

Полезным также было осознание того, что вместо термина «система уравнений» лучше использовать термины «формы музыкальных мелодий» или «формы музыкально-мелодического мышления». Термин «форма» допускал, например, неоднозначный характер связей.

Не вдаваясь здесь в детали скажем, что при прослушивании мелодии мы имеем дело с распознаванием образов (формы), растянутым во времени. Поэтому здесь возникают уникальные возможности для изучения процесса распознавания. При желании каждую мелодию можно даже изобразить графически в виде «ступенчатой» функции.

Согласно авторской модели в процессе распознавания происходит состязание, «борьба» классов связности. Наивысшее напряжение (кульминация)- момент решающего выбора классов связности, способных связать воедино разрозненные до того звуки. Разрешение и завершение – окончательный выбор и «укладка» остающихся неохваченными связями звуков в схемы «победивших» (доминантных) классов связности.

Принцип доминанты был обнаружен в процессе компьютерных экспериментов и включён в компьютерную модель как естественный инструмент отсеивания большого количества ничего не значащих (близких к нулю по вероятности) связей. Он выступил также естественным отрицанием разного рода наивных подходов, связанных с использованием «хитроумных» аналитических формул для генерации последовательностей чисел, статистических связей только между соседними звуками по типу «марковских цепей», усреднений нескольких вероятностных исходов и прочих компромиссов.

Действительно, из песни слова не выкинешь, а из мелодии - ноты.

Одними из самых устойчивых оказались, например, связи не между соседними звуками, а между первым и последним звуком мелодии.

Несколько разных экспериментов по «усреднённому» учёту всех «фоновых» связей подтвердили бесперспективность такого подхода.

На самом деле в нашей модели «компромиссы» и «девать-то» некуда – для них просто нет никакого класса связности.

А меняя всего один звук в мелодии мы прежде всего разрушаем классы связности, в которые входит этот звук. Чтобы сохранить какой-то класс связности, мы должны адекватно поменять и другие звуки этого класса. От того, что произойдёт с другими классами связности и можно ли выполнить ещё какие-нибудь изменения для нейтрализации нашего «разрушительного» действия, и зависит результат. Например, так могут получиться вариации основной мелодии.

Для читателей, незнакомых с соответствующими работами автора, поясним, что статистические связи, которые потом трактуются как доминантные, компьютерная модель выращивает самостоятельно на основе группы известных (общепризнанных) мелодий, как бы прослушивая их вместо человека. Потом та же программа использует эти связи для синтеза новых мелодий, чтобы, прослушивая их, человек мог судить о правильности построенной модели, т.е. о том, правильно ли была разгадана тайна структурной организации мелодий.

См. продолжение в aReadmeXytBmp412

http://tavis4.narod.ru

 

 

Категория: Мои статьи | Добавил: tavis4 (07.05.2017) | Автор: Хабибуллин Тавис Габдулхаевич
Просмотров: 549 | Рейтинг: 0.0/0
Всего комментариев: 0
Поиск
Друзья сайта
  • Создать сайт
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Все проекты компании
  • Copyright MyCorp © 2024
    Конструктор сайтов - uCoz