Пятница, 29.03.2024
Мой сайт
Меню сайта
Категории раздела
Мои статьи [7]
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа
Главная » Статьи » Мои статьи

aReadmeXytBmp412

aReadmeXytBmp412

KinoBmp Продолжение 

aReadmeXYTbmp для HabibTG 1.0.3 xyt

Дополнительная инструкция 2. BMP-Эпизоды (KinoBmp)

____________________________________

HabibTG 1.0.3 xyt - обучающаяся программа распознавания зрительных образов, включая формы движения

 

4.1.2 Направление 2. Перспективные искажения

 

Случилось так, что сразу несколько лабораторий предложили мне выступить на семинаре, чтобы поискать точки соприкосновения и сотрудничества.

Вскоре мой будущий научный руководитель Вадим Николаевич Семёнов, лаборатория которого занималась автоматизацией архитектурного проектирования, погрузил меня в проблематику перспективных искажений.

 

"Перспективные искажения" - это искажения, наблюдаемые на перспективных изображениях, являющихся центральной проекцией трёхмерных объектов на плоскость. Изображения могут представлять из себя чертёж, фотографию и т.д. Искажения касаются объектов, проецируемых под большим углом зрения. Однако во многих работах художников, выполненных с той же точки зрения, такие искажения отсутствуют.

Правильно изложить задачу читателю – отдельная проблема. Значительная часть фактического материала, опубликованного настоящими исследователями раньше на «бумажном» носителе, видимо не попала в интернет.

Из имеющихся в сети работ можно порекомендовать [16].

При поиске в сети рекомендуется к ключевым словам «перспективные искажения» добавлять слова «архитектор», «художник», «рисунок».

Большинство же нынешних материалов в интернете касается только фотографий, а суждения обычно либо поверхностны, либо ошибочны. Мы приведём для начала только несколько примеров.

 

Всем знакомы искажения, когда на фотографии рука, вытянутая к объективу, кажется большой, а голова – маленькой.

Но все мы знаем также знаменитый плакат «Ты записался добровольцем на фронт?», на котором этих искажений нет.

 

Также обстоит дело с архитектурными композициями. Ближние дома кажутся неестественно большими, отдалённые – маленькими.

Но есть в работах художников и свои сюрпризы. Если мы построим около линии горизонта точки схода отдельно для правой и левой стороны улицы, то получим две разные точки. Т.е. мысленно вдалеке правая сторона улицы «заходит» за левую сторону, и наоборот.

Есть и другие, не менее впечатляющие парадоксы.

 

Оказалось, что учёные уже сотни лет решают эту задачу.

Парадоксы, которые они собрали за это время, не поддавались объяснению. Применить сходу мою «волшебную» методологию не удавалось.

 

Говорят, аборигенам в Австралии в своё время показывали фотографии их родных мест, а они не могли понять, что на них изображено. Видимо они смотрели на эти фотографии как на плоский узор.

Получалось, что мы изучаем некий культурно обусловленный информационный процесс, который может отсутствовать даже у некоторых взрослых людей, нормально воспринимающих и распознающих трёхмерную окружающую среду.

 

Поэтому те инварианты, которые я мог выписать, используя свою методологию для распознавания плоских и объёмных зрительных образов по-отдельности, прямо не относились к данному процессу и не давали готового решения задачи.

 

В этом процессе мысленная реконструкция трёхмерных объектов производится путём «перемещения» вглубь элементов изображения, воспринимаемых в значительной степени как самостоятельные материальные объекты. А это более сложный процесс, который не сводится к перемещению точек по лучам проецирования в обратном направлении. Например, когда мы мысленно представляем, как будет от нас удаляться трамвай, мы его «переносим» почти параллельно, а не увеличиваем его в пространстве до гигантских размеров только потому, что нам так проще, поскольку не пришлось бы мысленно менять направление лучей от каждой точки трамвая и угловые расстояния между этими точками.

Эта наша способность развилась в процессе обучения. Всякий раз, когда мы наблюдаем реальный удаляющийся трамвай, мы знаем, что размеры трамвая остаются инвариантами, а константность нашего восприятия заключается в том, что мы в нашем сознании поддерживаем постоянными размеры вагона, несмотря на уменьшение угловых расстояний.

 

Я продолжал думать не только о сути самой проблемы, но и том, как всё-таки применить свою «выстраданную» и с таким трудом выстроенную методологию. С константностью всё вроде прояснялось. Ассоциативность же в моей методологии «подсказывала», что надо забыть про глобальные функции, отображающие все точки под одну гребёнку и заняться отображением маленьких отрезков, т.е. ассоциаций, связей между соседними точками. Цепочка таких связей и должна составить знакомую нам систему уравнений, или соотношений для учёта инвариантов в нашей модели. Пройдя по этой цепочке и решив эти уравнения мы и получили бы точки на картинной плоскости, передающие пространственные соотношения с меньшими искажениями. Именно так наш зрительный аппарат и наш мозг распознают и воссоздают трёхмерные образы в пространстве. Учитывая маленькие размеры отрезков, было ясно, что решение системы уравнений выльется в интегрирование по заданной траектории.

 

Опишем конкретную идею, которая основывается на локальном свойстве центральной проекции.

Мы воспользуемся тем, что центральная проекция хорошо отображает достаточно удалённые объекты. Конечно, можно было бы отойти достаточно далеко от всех объектов и построить таким образом изображение всей композиции. Но всё дело в том, что нас интересует вид с заранее заданной (обычно более близкой) точки зрения.

 

Поставим вопрос так. Нельзя ли, отображая маленький участок объекта, отходить от него каждый раз так, чтобы при проектировании сохранить ощущение того, что мы смотрим на этот участок именно с заданной точки зрения (и, естественно, в заданном направлении)?

Для этого достаточно каждый раз отступать на одно и то же расстояние, скажем, «L», вместе с картинной плоскостью по лучу, соединяющему текущую точку композиции и исходную заданную точку зрения. После этого можно соединить лучом близкую соседнюю точку с текущей точкой зрения и таким образом отобразить эту соседнюю точку на картинную плоскость. Так можно получить проекцию маленького отрезка - «приращения», дифференциала - например, некой пространственной контурной линии на картинную плоскость. Так выписывается дифференциальное соотношение.

На следующем этапе бывшая «соседняя» точка композиции становится «текущей». Картинная плоскость сдвигается так, чтобы луч, соединяющий новую текущую точку и её проекцию, проходил через заданную точку зрения, и всё повторяется. Так путём интегрирования можно отображать любые пространственные линии.

Заметьте, мы впервые здесь говорим не об отображении отдельной точки, однозначно связанном с идущим от неё лучом, а именно об отображении маленького отрезка с целью максимально достоверной передачи его пространственных инвариантов.

 

В тот день, когда пришла эта идея, я долго не мог заснуть.

В полной темноте как-то особенно легко себе представил, как я интегрирую отрезки и строю проекции на картинной плоскости. Близкие и дальние дома у меня получаются нормальных размеров, одна сторона улицы у меня «спокойно» заходит за другую сторону. Я даже представил, что я меняю контуры интегрирования и получаю другой вариант плоского изображения, также без искажений и также отличающийся от центральной проекции. Парадокс, который убивал наповал многих сторонников самых хитроумных, но всё же однозначных преобразований, был разгадан (объяснён).

Я пытался понять, действительно ли я смогу сохранить видимость всех элементов композиции именно с заданной точки.

Прокручивая в голове вновь и вновь разные ситуации, я уже жил в придуманном мной мире, правда, не зная, туда ли я попал, и таким ли он окажется на самом деле.

 

Наконец я устал и начал засыпать с чувством человека, сделавшего открытие, хотя задача ещё не была решена. Оставались без ответа важные вопросы.

Последней моей мыслью было: «Если бы я мог доказать хотя бы за год, или даже за десять лет, что прямая переходит в прямую, это была бы большая удача».

Утром я, не одеваясь, подошёл к столу и за один «заход» доказал, что прямая переходит в прямую. Я даже не помню, успел ли я присесть на стул, хотя никогда не любил писать стоя.

Потом были доказаны и остальные свойства.

Так благодаря уже имеющейся методологии проблему удалось решить примерно за 1 год вместо «положенных» 100.

 

Эйфелева и Останкинская башня

Читателям, считающим, что реконструкция трёхмерной картины по фотографии сводится только к обратному процессу перемещения образа с соблюдением хода лучей проецирования и угловых расстояний, предлагаем провести следующий эксперимент.

Допустим, у вас есть фотография Останкинской или Эйфелевой башни, сделанной фотографом, стоящим на земле. Если вы повесите фотографию на стену на уровне ваших глаз, у вас будет ощущение, что вы смотрите на башню снизу вверх. Если теперь вы поставите фотографию на пол, вам не будет казаться, что вы смотрите на башню сверху вниз, с высоты самолёта, летящего выше башни, или что сама башня находится ниже плинтуса. Вы всё равно мысленно помещаете себя у подножия башни, а башню – выше себя.

Таким образом, при реконструкции трёхмерной композиции по рисунку мы подсознательно пользуемся преобразованиями «перемещения», более близкими к параллельному переносу, чем «центральная проекция наоборот», а направление переноса может не иметь ничего общего с точкой, с которой мы рассматриваем рисунок.

 

Доминанты

В авторской модели доминанты определяются через выбранные контуры интегрирования, передающие инвариантные соотношения. Это обычно не совпадает с разными схемами предварительного отображения на сферу или цилиндр с последующим развёртыванием, усреднения искажений и компромиссами типа соблюдения угловых расстояний при проецировании. Более того, одна и та же точка трёхмерного пространства в авторской модели может проецироваться на разные точки экрана в зависимости от выбранных контуров интегрирования. Как и у художников, все варианты при этом могут отличаться от центральной проекции.

Художники-натуралисты идут ещё дальше. Они добиваются совпадения впечатления от нарисованной картины не с математической трёхмерной моделью реальных объектов, а с «кажущейся» моделью, которая возникает у человека, наблюдающего реальные объекты с заданной точки. Например, если художник рисует площадь с отношением ширины к длине, равным 1:2,5 , а ему кажется, что это соотношение равно 1:2 , то он рисует так, чтобы у людей, смотрящих на его картину, также создавалось впечатление, что площадь имеет соотношение сторон 1:2. Понятие «кажущаяся модель» в своё время было введено и обосновано специалистами.

На вопрос, почему они рисуют, отступая от центральной проекции, художники обычно отвечают: «Я так вижу».

Итак, правильно передавая доминантные соотношения, мы обеспечиваем более правильное восприятие и трёхмерную реконструкцию объекта по изображению, несмотря на некоторые искажения второстепенных соотношений. «Закрывать глаза» (не обращать внимания) на искажённые второстепенные соотношения нам помогает принцип доминанты, который физиологи открыли на своём уровне ещё раньше. Приведём цитаты из [14].

 

Принцип доминанты в физиологии

Начало цитирования [14].

14. Бабский Евгений Васильевич, Зубков Анатолий Анатолиевич,

Косицкий Григорий Иванович, Ходоров Борис Израилевич

Физиология человека

Издательство «Медицина», Москва . 1966

 

Отрывки из [14], начало:

См. разделы

13. Общая физиология центральной нервной системы

..

Координация рефлекторных процессов

Принцип общего коечного пути

 

Принцип доминанты

...

Стр. 436 в [14]:

«… Принцип доминанты был сформулирован А. А. Ухтомским как основной принцип работы нервных центров. Согласно ему, для деятельности нервной системы как единого целого в естественных условиях существования организма характерно наличие доминантных, т.е. господствующих, очагов возбуждения, изменяющих и как бы подчиняющих себе работу всех других нервных центров.

Доминантный очаг возбуждения характеризуется согласно данным А. А. Ухтомского следующими основными свойствами: 1) Повышенной возбудимостью; 2) стойкостью возбуждения; 3) способностью к суммированию возбуждений; 4) инерцией, т.е. способностью к длительному удержанию возбуждения после окончания стимула.

Возникающее доминантное возбуждение в каком-либо центре всегда сопровождается более или менее выраженным сопряжённым торможением других нервных центров.

Открытие явлений доминанты показало условность существования в классической физиологии представлений о рефлекторных дугах как об изолированных друг от друга путях проведения нервных импульсов и о стабильности координационных отношений между нервными центрами.

В настоящее время можно считать доказанным, что благодаря бесчисленным контактам между нейронами и существованию системы промежуточных контактных нейронов вся нервная система в любой момент её деятельности работает как единое целое. Координационные отношения между центрами могут изменяться под влиянием поступающих в нервные центры афферентных импульсов.

Конец цитирования [14].

 

Ниже мы ещё вернёмся к контурным линиям распознаваемых объектов. Физиологи и психофизики показали, что граничные точки и линии с одной стороны и внутренние однородные области с другой стороны распознаются разными механизмами нашего зрительного аппарата. Реконструкция трёхмерных образов, видимо, опирается на работу этих механизмов. Поэтому процесс интегрирования по контуру видимо отражает объективно существующий информационный процесс в нашем зрительном аппарате.

На макро уровне контурные линии и графы опять образуют знакомые нам классы связности, необходимые для узнавания и реконструкции.

История с музыкальными мелодиями повторилась.

Обширный эмпирический материал, созданный художниками и собранный исследователями, помог построить правильную модель и «прикоснуться» к процессу восприятия с элементами образного пространственного мышления. Занимаясь отдельно распознаванием только плоских или только объёмных образов мы вряд ли бы имели такую возможность.

Кстати, не следует думать, что трёхмерную картину на улице мы воссоздаём в нашем сознании только за счёт бинокулярного зрения.

Когда мы вдеваем нитку в иголку, это действительно так. В пределах вытянутой руки мы можем дополнительно пользоваться ещё и тактильной информацией. Но на больших расстояниях мы двумя глазами видим лучше, чем одним, не за счёт объёмности восприятия, а просто за счёт того, что от каждой точки реального мира свет попадает на большее количество фоторецепторов. Сверхточное измерение трёхмерных координат разных точек объектов в этом случае не нужно нашему зрительному аппарату. Так же, как и при чтении «плоского» текста в книге, один глаз просто помогает другому видеть чётче, а не «глубже».

Достижения первого и второго направления позволили расширить понятие подобия фигур «по Евклиду». В модель распознавания были введены важнейшие инварианты «Альфа» и «Бета», включающие в себя не три, а четыре точки. Эти инварианты могут работать не только с трёхмерными объектами, но и с их проекциями, а также просто с плоскими фигурами. При этом программа HabibTG при обучении и распознавании легко обобщала фигуры, цифры и буквы, которые никак не были подобны «по Евклиду».

Как то я читал, что один учёный считал процесс восприятия и воссоздания окружающего мира в нашем сознании самым сложным явлением, с которым когда-либо сталкивалась наука, или самым сложным процессом, который создала природа. Жаль, что не помню ни источника, ни автора, ни точной цитаты.

В завершение рассмотрения первого и второго направления приведём здесь предисловие к работе [3], в котором в общих чертах изложены итоговые результаты.

 

Начало цитирования [3].

[3]. «Машинная музыка (мелодии) от БЭСМ-4»

 

HabibtgMuzBESM4 - программа, которая демонстрирует (проигрывает) 4 мелодии, сочинённые электронно-вычислительной машиной (компьютером) БЭСМ-4 в 1972 году.

 

Версия 1.0.0

Автор программы: Хабибуллин Тавис Габдулхаевич

 

Автор программы для БЭСМ-4 и мелодий: Хабибуллин Тавис Габдулхаевич

Нотная запись мелодий находится в файлах HabibTGNota1.bmp и HabibTGNota2.bmp .

 

Место первого публичного исполнения мелодий:

 

XIX научная конференция МФТИ

 

Московский физико-технический

институт

XIX научная конференция

Москва 1973

 

Секция искусственного интеллекта

Хабибуллин Тавис Габдулхаевич

Доклад

"Исследование форм музыкально-мелодического мышления с помощью ЭВМ (компьютера)"

 

Кроме того, мелодии исполнялись, например, на семинаре в Институте проблем управления.

 

Разработанная математическая модель и алгоритмы могут использоваться и для исследования и "освоения" компьютером форм полифонического мышления, сочинения многоголосных мелодий или "достраивания", например, второго и третьего голоса к заданной мелодии.

"Аранжировка" аккордами, "гармонизация" мелодии могут рассматриваться как частный случай.

 

В файлах ZaripovRecenzia1.bmp и ZaripovRecenzia2.bmp содержится рецензия Зарипова Рудольфа Хафизовича на работу Хабибуллина Тависа Габдулхаевича "К проблеме узнавания".

Зарипов Рудольф Хафизович - автор знаменитой, известной во всём мире, монографии "Кибернетика и музыка" (Издательство "Наука", Москва 1971).

 

Открытия, сделанные в ходе исследования форм мелодического мышления, помогли решить проблему, связанную с "перспективными искажениями" в центральной проекции, на которую указывали и которую пытались решить учёные разных стран в течение примерно 100 лет, начиная ещё с конца 19 века (уточним: "перспективные искажения" - это искажения, наблюдаемые на перспективных изображениях, являющихся центральной проекцией трёхмерных объектов на плоскость). При этом было объяснено множество парадоксальных фактов, накопленных исследователями за это время. Научный руководитель работы - Семёнов В.Н. На сайте имеется рецензия Ю.И. Короева на эту работу.

 

В свою очередь такое двойное экспериментальное подтверждение правильности разработанной математической модели восприятия позволило 30-40 лет вести работы по моделированию зрительного восприятия (распознавания образов) и пространственного мышления, не отклоняясь от выбранного курса и не упрощая задачу.

 

Более подробную информацию о проекте можно найти на сайте

http://tavis4.narod.ru

см, например, "О методе марковских цепей в музыке" (markcep0.html),"Перспективные искажения" в центральной проекции, проект "Зрительные образы" (распознавание образов, искусственный интеллект) и т.д.

 

Конец цитирования [3].

 

4.1.3 Направление 3. Распознавание зрительных образов.

Авторская модель восприятия (работа [11]) и программа HabibTG

 

Модель восприятия [11] была разработана с использованием постулатов и методологии, истинность которых уже не вызывала никаких сомнений.

Классы связности на макро уровне в ней состоят из совокупности элементов a[i].

Программа HabibTG разрабатывается на её основе уже около 40 лет и так и не зашла в тупик. Поскольку программа является конкретизацией и продолжением модели, необходимо привлекать для её развития и проверки и другие области знаний, которые не использовались при разработке модели.

 

Пуанкаре: атомы-крючки Эпикура. Адамар

 

Большую пользу можно извлечь из таких работ, как [17], [18] и т.д.

А. Пуанкаре сравнивал работу подсознания с поведением атомов - крючков Эпикура и извинялся: «Я ещё раз прошу у вас извинения: моё сравнение довольно грубо, но я не знаю иного способа сделать понятной мою мысль…».

 

В программе Habibtg «крючки» – это события a[i]. При обучении программа генерирует их и забраковывает сотнями и тысячами, выращивая таким путём нужные образы.

 

Напрасно А. Пуанкаре извинялся. На рисунке 10 на странице 21 в [11] элемент a[i] действительно похож на крючок, а одна из основных функций таких элементов – это цепляться друг за друга (вступать в ассоциацию).

 

Когда учился в ЗМШ МГУ (заочной математической школе), я заметил, что после решения очередной трудной задачи (озарения) и оформления доказательства наступает ставший уже ожидаемым и «предвкушаемым» момент переживания, осмысления решения уже без бумаги и ручки.

Сейчас я объясняю это мысленным «проигрыванием» и «обживанием» нового класса связности, созданного в процессе решения задачи.

 

Особенности проекта

 

Преимуществом нашего подхода является то, что с самого начала авторская модель чисто формально описывает (обозначает) все возможные варианты информационных процессов.

Трудности появляются в виде огромных многомерных пространств и большого количества этих самых возможных вариантов.

 

Но когда мы конкретизируем модель, выдвигая дополнительные гипотезы, мы осознаём, какие варианты мы пока не рассматриваем (отсекаем).

При этом мы стараемся выяснить, такой ли выбор в этой ситуации сделала природа.

Такой подход даёт нам надежду, что мы не будем бесконечно ходить по замкнутому кругу, а сможем поступательно двигаться к цели.

 

4.1.4 Направление 4. Программа HabibtgKlaster

 

HabibtgKlaster – другая программа, написанная на основе модели. Она демонстрирует, как можно использовать в программировании то обстоятельство, что наше восприятие и мышление оперируют классами связности.

Это направление было названо автором «Кластерным программированием» по аналогии, например, с «Модульным программированием». Не следует путать с известным «Программированием на кластерах из компьютеров». Слово «Кластер» переводится с английского как «скопление», «совокупность», «группа» и т.д. Здесь больше подходит вариант «гроздь».

Процесс детализации программного кода путём встраивания новых кластеров напоминает процесс получения вариации из основной мелодии.

Заметим, что модульное программирование является частным случаем кластерного программирования.

Если встраивание модуля в программу напоминает встраивание лампочки в электрическую цепь, то встраивание кластера в программу внешне и по последствиям больше похоже на встраивание подсхемы из триодов в радиосхему.

Все преимущества подхода достаточно подробно изложены в первоисточнике.

См. продолжение в aReadmeXytBmp415

 

 

 


 

 

 

Категория: Мои статьи | Добавил: tavis4 (07.05.2017) | Автор: Хабибуллин Тавис Габдулхаевич
Просмотров: 532 | Рейтинг: 0.0/0
Всего комментариев: 0
Поиск
Друзья сайта
  • Создать сайт
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Все проекты компании
  • Copyright MyCorp © 2024
    Конструктор сайтов - uCoz