Среда, 24.04.2024
Мой сайт
Меню сайта
Категории раздела
Мои статьи [7]
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа
Главная » Статьи » Мои статьи

aReadmeXytBmp415

aReadmeXytBmp415

KinoBmp Продолжение 

aReadmeXYTbmp для HabibTG 1.0.3 xyt

Дополнительная инструкция 2. BMP-Эпизоды (KinoBmp)

 

4.1.5 Клоны, «классы связности» и доминантные очаги возбуждения

 

«Классы связности» проявились на всех направлениях работ, макро и микро-уровнях, так как они являются следствием ассоциативности – универсального свойства нашего восприятия, образного и логического мышления. При этом языки описания образов, объектов, понятий и связей могут быть разными.

 

Использованные нами понятия «Система уравнений», «Форма», «Образ», «Отрезки из точек», «Линии», «Контуры», «Графы», «События a[i]», «Клоны», «Кластеры», а также любая теория, наука, учебник геометрии, аксиома, теорема – это всё классы связности.

Мы полагаем, что «доминантный очаг возбуждения» выводит на передний план определённые классы связности и создаёт тем самым соответствующий контекст.

Концепцию клонов можно считать простым и наглядным воплощением принципа доминаты. Действительно, программа HabibTG каждый раз стартует в виде одного конкретного клона. Все остальные клоны для неё не существуют, т.е. как бы находятся вне данного доминантного очага.

Теоретически возможно чисто механическое объединение нескольких готовых клонов в общие файлы. Такое объединение будет состоять из общей начальной части (нулевого клона) и связанными с ней фрагментами – бывшими отдельными клонами. С большой вероятностью такой объединённый клон будет выдавать ошибочные ответы, даже если бывшие клоны только дополняли друг друга и не противоречили друг другу. О клонах-антиподах и говорить не стоит. Но есть простой способ заставить их работать правильно. Допустим, при слиянии мы каждое событие a[i] пометили номером, указывающим на принадлежность к бывшему клону. Таким образом мы ввели дополнительный признак принадлежности к классам связности и бывшим клонам. Теперь, если при работе программы HabibTG мы каждый раз будем игнорировать все события a[i], кроме тех, которые принадлежали какому-то одному бывшему клону, то результат будет точно таким же, как у отдельного бывшего клона. Правильно будут работать даже противоречащие друг другу клоны-антиподы, если они будут оставаться в своих темах.

Так, превращая в доминантный очаг «возбуждения» разные бывшие клоны, мы можем заставить работать систему в совершенно разных контекстах.

 

Мы, конечно, не являемся чистыми «зубрилками» или простыми аналогами кино- и фотоаппаратов.

Но при всей мощи нашего зрительного и мыслительного аппарата наш прошлый опыт откладывается в нашем сознании всё-таки в довольно фрагментированном виде. В противном случае мы были бы «тяжелодумами», которые каждую новую идею или образ «пропускают» через весь свой багаж знаний и образов.

Другими словами, мы также в некоторой степени «состоим» из клонов, которые могут как дополнять друг друга, так и противоречить друг другу.

Возбуждая доминантные очаги в разных классах связности мы можем ставить, например, задачу «наведения мостов» через границу этих классов и формирования нового класса связности. Это может быть уже чисто мыслительный процесс, без восприятия внешнего мира. Вспомните стандартную постановку задач типа «дано: А, доказать Б». Возможны и другие варианты.

В программе Habibtg принадлежность событий a[i] к какой-либо группе (рангу) можно указывать в переменной bRang[i], которая может принимать 256 разных значений. Например, вершины a[i], построенные в процессе обучения в предыдущие запуски программы, помечаются как bRang[i]=1. Вершины, построенные только что при текущем запуске, помечаются сначала как bRang[i]=0. Если при дальнейших проверках a[i] выдержат отбор, то их помечают как bRang[i]=1. В конце работы программы обучения все вершины a[i] с bRang[i]=0 и примыкающие к ним связи удаляются. Таким образом, все вершины a[i], выжившие на предыдущих этапах, сохраняются автоматически.

Однако иногда бывает нужно удалить из клона несколько образов. Например, если обучение проводилось по не очень удачной схеме или на неудачных примерах. Чтобы не повторять обучение с нуля, была разработана следующая схема.

Сначала с помощью программы NulRang помечаются все вершины как bRang[i]=0. Потом запускается распознавание на полном списке, но без указанных выше образов. При этом все вершины, принявшие участие в распознавании, помечаются как bRang[i]=1.

Затем с помощью программы Zabexe удаляются все вершины с bRang[i]=0 и примыкающие к ним связи. В этом случае сеть «прореживается» и навсегда освобождается от неиспользуемых «недоминантных» вершин. При необходимости после этого может быть проведено дополнительное обучение.

Программы NulRang и Zabexe в версиях для пользователей обычно отсутствуют.

 

4.2 Сведения из физиологии.

О роли дрейфа и тремора в восприятии

 

Ниже процитируем некоторые фрагменты из первоисточников. Пользователь может брать из них ключевые слова при поиске соответствующих материалов в сети.

 

Отрывки из [14], начало:

См. разделы

14. Рецепция раздражений.

Зрительная рецепция

Структура и функция отдельных слоёв сетчатки

...

Стр. 486 в [14]:

«… Только лишь в центре сетчатки, в районе центральной ямки, каждая колбочка соединена с одной, так называемой карликовой биполярной клеткой, с которой соединена также всего одна ганглиозная клетка …»

«… Поэтому одна ганглиозная клетка может быть связана с десятками тысяч фоторецепторов.

Кроме центростремительных волокон в глазу найдены и центробежные нервные волокна, несущие импульсы от центральной нервной системы к сетчатке. Считают, что с помощью этих волокон центральная нервная система может изменить проводимость синапсов между нейронами сетчатки и тем самым регулировать количество нейронов, охваченных возбуждением. Второй тип центробежных нервных волокон сетчатки представляет собой сосудодвигательные волокна, с помощью которых центральная нервная система регулирует просвет сосудов сетчатки.

Сложный собственный нервный аппарат сетчатки участвует в анализе и переработке зрительной информации. Сетчатка – не только место расположения фоторецепторов; она одновременно является как бы частью центральной нервной системы, вынесенной на периферию …»

Электрические явления в сетчатке и зрительном нерве

Стр. 490 в [14]:

«… Если 2 узких луча света – оба допороговой интенсивности - действуют в пределах одного рецептивного поля, то происходит суммация рецепторных потенциалов и в ганглиозной клетке возникает импульсация, регистрируемая в нервном волокне зрительного нерва.

Если же 2 узких луча света – сверхпороговой интенсивности – действуют на разные рецептивные поля, относящиеся к разным ганглиозным клеткам сетчатки, то наблюдаются явления торможения; возбуждение одного рецептивного поля повышает порог раздражения другого рецептивного поля. Таким образом, нейронам сетчатки свойственны те же самые явления (суммация, торможение), которые характерны для нервных центров. Это дало основание считать нейроны сетчатки вынесенной на периферию частью центральной нервной системы...»

Конец отрывков из [14].

 

Ключевые слова для поиска в интернете:

«фоторецепторы, палочки, колбочки, ганглиозная клетка, рецептивное поле, биполярная клетка, горизонтальные (звёздчатые) и амакриновые клетки».

 

Отрывки из [10], начало:

10. Восприятие. Механизмы и модели.

Издательство «МИР», Москва 1974

 

Часть 4 Процессы восприятия

Р. Притчард. Стабилизированные изображения на сетчатке

Стр. 194:

«… В обычных условиях глаз непрерывно движется. Небольшие непроизвольные движения продолжаются даже вовремя фиксации взглядом неподвижного объекта. В результате изображение объекта на сетчатке непрерывно перемещается. Один род движений глазного яблока приводит к тому, что изображение медленно «сползает» с середины центральной ямки – того участка сетчатки, где колбочки расположены наиболее густо и острота зрения достигает максимума. Это медленное смещение – так называемый «дрейф» - заканчивается быстрым скачком, который возвращает изображение на середину центральной ямки. На дрейф накладывается тремор – дрожательные движения с частотой до 150 циклов в секунду и амплитудой, равной примерно половине диаметра отдельной колбочки (рис. 1 и 2).

Эти три вида непроизвольных движений глаза, очень небольших по сравнению с произвольными движениями, которые мы совершаем, когда осматриваем окружающие предметы или читаем книгу, уже давно известны физиологам…»

Конец отрывков из [10].

 

Процитированные фрагменты подтверждают, что тремор обеспечивает срабатывание фоторецепторов, на которые падает свет с «граничных» точек изображения. Действительно, при таком треморе свет, падающий на «свой» фоторецептор от «внутренней» точки, не меняет ни интенсивности, ни цвета, поэтому такой фоторецептор не должен реагировать на тремор. А вот свет, падающий на «свой» фоторецептор от «граничной» точки, постоянно меняет свою интенсивность и цвет, поэтому такой фоторецептор должен реагировать на тремор. Например, если точка находится на границе между светлой и тёмной областью изображения, а направление дрейфа хотя бы частично совпало с направлением граничной линии между этими областями, то на соответствующий фоторецептор сетчатки будет попадать то яркий, то тусклый свет. Следовательно, механизм тремора может одновременно на всей сетчатке активизировать (выявлять) фоторецепторы, соответствующие «граничным» точкам, и, возможно, целые контурные линии из фоторецепторов, соответствующие, например, краям предметов. Колоссальная производительность достигается без участия «центрального процессора», если не учитывать механизмы предварительной настройки.

 

Понятно также, почему направление дрейфа меняется. Этим, возможно, обеспечивается «вылавливание» граничных линий разной ориентации (направлений).

 

4.2.1 Частота и роль (функция, назначение) тремора

Известно, что физиологи открыли фоторецепторы, которые реагируют на изменения цвета и/или интенсивности падающего на них света.

Иногда роль (функцию, назначение) тремора связывают только с тем обстоятельством, что фоторецепторы для поддержания своей активности (импульсации) требуют изменения состава падающего на них света.

Но здесь нас интересует не только само явление «исчезновения» изображения через несколько секунд после «стабилизации» изображения на сетчатке, которому посвящена работа цитируемого автора.

Возникает вопрос, почему для «борьбы» с исчезновением изображения природе не хватило частоты в несколько колебаний в минуту, и, тем более, частоты «дрейфа» - несколько колебаний в секунду?

Ведь речь идёт о 150 колебаниях в секунду.

 

Приведём такой пример.

Допустим, перед нами изображение достаточно большого белого круга на чёрном фоне и мы смотрим в центр круга несколько секунд. Получается, что при этом фоторецепторы, на которые падает свет от внутренней области круга, не испытывают никаких изменений падающего света. Однако наше зрительное впечатление о цвете и яркости внутренней области круга не ослабевает из-за такой «квази-стабилизации». Это ещё раз подводит нас к мысли о том, что сформировавшаяся в ходе эволюции частота тремора связана, скорее всего, не столько с задачей поддержания работы фоторецепторов вообще, сколько с задачей быстрого определения (и активации) фоторецепторов, соответствующих граничным точкам.

К чему может приводить неумение распознавать неподвижные объекты, связанное, в том числе, с неумением «вычислять» их контуры, показывает пример со змеёй и лягушкой.

 

4.2.2 Амплитуда и роль тремора

Тот факт, что амплитуда тремора равна примерно половине диаметра отдельной колбочки означает, что граничные точки (и контурные линии) определяются с максимально возможной точностью (до одного фоторецептора). А известно, что в центральной ямке, например, в рецептивное поле ганглиозной клетки может входить единственный фоторецептор.

Такое невероятное «совпадение» говорит о том, что пространственно-временные характеристики тремора природа «подогнала» именно под проблему «вычисления» (определения) граничных точек и контурных линий. Эти характеристики в данном случае вряд ли определяются другими факторами (например, ограничениями, налагаемыми самими механизмами реализации).

Кроме того, это говорит о том, насколько важными являются сами «квантованные» «идеальные» и «отфильтрованные» граничные точки для распознавания формы объектов. Если говорить только о центростремительной фазе, то дрожащая сетчатка напоминает сито, пропускающее только граничные точки и контурные линии.

Сравните, в каком случае нам легче отыскать в интернете какую-нибудь фотографию - когда она имеет название и снабжена вербальным текстом, или не имеет ни названия, ни каких-либо комментариев, а перед нами только 256 оттенков серого?

 

Поэтому совершенно правильно в нашем проекте было уделено первостепенное внимание подробным исследованиям процессов распознавания на маленьких контурных рисунках. Видимо, это именно те процессы, которые связаны с центральной ямкой.

 

4.2.3 Колебания тремора перпендикулярны направлениям дрейфа

 

Возникает вопрос: почему колебания тремора перпендикулярны направлениям дрейфа? Ведь они могли бы быть, например, и параллельными направлению дрейфа?

Получается следующая картина. Каждая «граничная» линия на изображении, лежащая в данный момент перпендикулярно направлению дрейфа, возбуждает соответствующую ей «линию» из фоторецепторов на сетчатке только один раз. В следующий момент возбуждается параллельная «линия» из других рядом лежащих фоторецепторов и т.д., пока не закончится дрейф.

С тремором картина другая. Каждая «граничная» линия на изображении, лежащая в данный момент параллельно направлению дрейфа, возбуждает соответствующую ей «линию» из фоторецепторов на сетчатке многократно, опять же, пока не закончится дрейф.

Разумеется, в обоих случаях каждый фоторецептор реагирует в соответствии со своей «on», «off» или «on-off» характеристикой.

«Изолированные граничные точки», «попадающие» всего на один фоторецептор, воздействуют на него как через дрейф, так и через тремор.

 

4.2.4 Гора идёт к Магомету (мозг идёт к сетчатке)

 

Во всех предыдущих версиях программы Habibtg был выключен без объяснения причин так называемый "Зрительный канал" "3 PixelMini".

Чтобы напомнить, о чём идёт речь, приведём соответствующие отрывки из общей инструкции aReadme:

Использование опции "Зрительный канал"

Данная опция определяет путь поступления и, частично, способ обработки информации. Название опции на форме отсутствует.

Имеются следующие каналы:

"1 NomeraRisunkov"

"2 PixelTxt"

"3 PixelMini"

"4 PixelMaxi"

"5 MaxiKontur"

"3 PixelMini" в данной версии выключен.

Конец отрывков.

Теперь пришло время объяснить, почему этот зрительный канал для пользователя был выключен.

"Зрительный канал" "3 PixelMini" был создан практически с теми же маленькими размерами, что и "2 PixelTxt". В отличие от последнего он предполагает, что картинка в графическом окошке является не контурным, а обычным рисунком, контуры которого ещё предстоит вычислить.

Изменения были сделаны следующие. При определении статуса точки (граничная или внутренняя, или «чёрная» – «нечёрная», см. [11]) использовалось не абсолютное значение цвета пиксела, а результат его сравнения с соседними точками. В [11] это называется вычислением «градиента g» (gradient).

Вычисленный статус точки не сохраняется «впрок» в отдельной таблице, которая уже использовалась в предыдущих зрительных каналах (в этом случае дальше программа работала бы по отлаженной схеме). При повторных запросах статус точки каждый раз вычисляется заново.

Такой вариант позволяет сэкономить на памяти и отказаться от дополнительной матрицы для граничных точек.

Второе преимущество – в гибкости алгоритма. Теоретически параметры алгоритма можно менять в любой точке в зависимости от складывающейся ситуации. В [11], например, приводится пример с солнечным зайчиком на уже разрисованных цветных обоях. На них, к тому же, ещё что-нибудь может быть написано «от руки».

На такую гибкость зрительного аппарата может указывать, например, явление торможения (возбуждение одного рецептивного поля повышает порог раздражения другого рецептивного поля), изменчивость размеров рецептивных полей и т.д.

Однако при работе с каналом "3 PixelMini" случилось то, чего автор не ожидал. Время работы программы увеличилось катастрофически. При чём на изображениях одной и той же сложности время распознавания увеличивалось тем сильнее, чем большему количеству разных объектов был обучен клон (полагаю, до определённого предела).

Оказалось, что в среднем вычислять статус каждого пиксела приходится в несколько раз больше, чем раньше.

Поэтому, чтобы не раздражать пользователя, этот зрительный канал пришлось выключить.

Взамен был разработан канал "4 PixelMaxi". В нём граничные точки вычисляются заранее всего один раз в достаточно большом сегменте по общему фиксированному алгоритму и заносятся в отдельную матрицу для контурных рисунков. Дальше программа многократно использует эту готовую матрицу. Время работы программы резко сократилось.

 

Интересно сравнить это с тем, как природа отреагировала на эту проблему.

Мы уже видели, что проблему быстрого «вычисления» и «хранения» граничных точек наш зрительный аппарат решил кардинально, в том числе с помощью дрейфа, тремора, и специальных фоторецепторов.

Разнообразие рецептивных полей, видимо, в определённой степени делает возможным распараллеливание процесса, особенно на начальных этапах.

Но это не всё. Вспомним цитату

«… Сетчатка – не только место расположения фоторецепторов; она одновременно является как бы частью центральной нервной системы, вынесенной на периферию …».

Таким приближением мозга к сетчатке природа решает сразу две задачи.

Во-первых, примерно в 100 - 130 раз сокращает количество нервных волокон, идущих от сетчатки к «дальнему» мозгу.

Во-вторых, значительно сокращает время обработки основного объёма зрительной информации, имеющейся на сетчатке.

Это особенно очевидно для случаев, когда за центростремительными импульсами (от сетчатки к «обрабатывающим центрам») следуют центробежные импульсы (от «обрабатывающих центров» к сетчатке), и так, возможно, несколько раз.

Чем ближе «обрабатывающий центр» к фоторецепторам, тем короче «рефлекторная дуга», заканчивающаяся в той же сетчатке, тем быстрее работает «цикл» обработки информации (итерация). В данном случае можно сказать, что гора идёт к Магомету (мозг идёт к сетчатке). Это можно сравнить с быстрыми операциями типа регистр-регистр в современных процессорах, которые не обращаются к ячейкам основной (более медленной) памяти. Наибольший эффект при этом достигается в циклических операциях с большим количеством шагов (цикла).

С проблемой нехватки ресурсов автор столкнулся и при решении следующей задачи - «вычислении» так называемых «однородных» областей, пятен, являющихся антиподами контурных линий (см. ниже).

Похоже, и в этом случае природа навалилась на решение проблемы с помощью элементов самой сетчатки, используя, например, огромное количество «горизонтальных» связей.

См. продолжение в aReadmeXytBmp43

 

Категория: Мои статьи | Добавил: tavis4 (07.05.2017) | Автор: Хабибуллин Тавис Габдулхаевич
Просмотров: 515 | Рейтинг: 0.0/0
Всего комментариев: 0
Поиск
Друзья сайта
  • Создать сайт
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Все проекты компании
  • Copyright MyCorp © 2024
    Конструктор сайтов - uCoz