aReadmeXytBmp3
KinoBmp Продолжение
aReadmeXYTbmp для HabibTG 1.0.3 xyt
Дополнительная инструкция 2. BMP-Эпизоды (KinoBmp)
3. Описание некоторых клонов.
Клоны-антиподы как результат «контрольных посевов».
Проблема компьютерных ресурсов, периферическое зрение
Напоминаем, что, как и раньше, некоторые клоны выращиваются как «контрольные посевы», как «антиподы» других клонов, чтобы выяснить влияние на процесс какого-либо фактора.
Клон: xytk05Ruka 1.0.3 xyt 1.0.3 xyt kino Bmp
t=время
Это xyt-клон "Рука"
Формат клона: 1.0.3
Конфигурация клона: xyt
Версия программы, записавшей клон последний раз: 1.0.3
Конфигурация программы, записавшей клон последний раз: xyt
Bmp-эпизоды:
Сжимается кулак
Разжимается кулак
Берёт палку
Кладёт палку
Берёт молоток
Кладёт молоток
Klon : xytk06StormLisa 1.0.3 xyt 1.0.3 xyt kinoBmp
Это xyt-bmp-клон "Шторм-Лиса"
t=время
Формат клона: 1.0.3
Конфигурация клона: xyt
Версия программы, записавшей клон последний раз: 1.0.3
Конфигурация программы, записавшей клон последний раз: xyt
Ответы клона при предъявлении bmp-эпизодов:
Шторм
Лиса стоит
Морда движ. вперёд
Шторм
Просовывает лапу
Морда движ. вперёд
Морда движ. вперёд
Шторм
Шторм
Нос лисы при обучении необязательно находится в центре кадра (64,64).
Кадры эпизода "Лиса стоит" отличаются друг от друга из-за дрожания камеры.
Но лиса действительно неподвижна относительно решётки вольеры.
В строках
PICNUM OBRAZKOD READMOD PICFILENAME
249 0 7 "xyt\MordaVpered1.bmp"
251 0 7 "xyt\Storm3.bmp"
OBRAZKOD=0. Это значит, что код образа неизвестен, и соответствующий рисунок при обучении игнорируется.
Тем не менее при распознавании (после обучения) клон выдал правильные ответы.
Подробнее смотри в "aReadmeXYTbmp".
Там же смотри про клона-антипода "Шторм-Решётка".
Клон: xytk07LisaGolova 1.0.3 xyt 1.0.3 xyt kinoBmp
Это xyt-клон "Лиса-Голова"
t=время
Формат клона: 1.0.3
Конфигурация клона: xyt
Версия программы, записавшей клон последний раз: 1.0.3
Конфигурация программы, записавшей клон последний раз: xyt
В эпизоде «Лиса мотает головой» нос Лисы находится примерно в центре кадра (64,64).
В режиме SledView = True можно заметить два важных момента.
1. Нарушена так называемая преемственность кадров. Каждый следующий кадр сильно отличается от предыдущего. Программа всё же кое-чему научилась в этой ситуации. Вспомним, что вращающийся винт самолёта мы обычно воспринимаем как круг.
2. Вычисление контуров лисы, видимо, было бы более успешным, если бы варианты "цветоделения", одинаковые для всех рисунков, вне зависимости от их содержания, дополнялись бы ещё несколькими дополнительными вариантами, оцениваемыми по конечным результатам распознавания, а не по косвенным критериям.
Эти дополнительные варианты могут быть связаны с тем, какие цвета (диапазоны) мы будем считать основными, а какие - фоновыми (вспомним тигров и леопардов). В нашем случае «фоном» явилась бы решетка, хотя она расположена перед лисой, а не позади неё. Пути модификации алгоритма вычисления контуров (граничных точек) при этом просматриваются довольно ясно.
Желательно было бы каждый вариант привязывать к осматриваемому сегменту, предположительно содержащему определённый образ. Это, разумеется, потребует значительных компьютерных ресурсов. Заметим, что теоретически вариантов такого избирательного подхода может быть очень много, в зависимости от разнообразия цветовой гаммы, а также сложности и «богатства» содержания самого рисунка (видео).
Рассмотрим такой пример.
Допустим, мы наблюдаем салют (фейерверк) из одной ракеты.
Естественно предположить, что наш взор будет следовать за ракетой, отслеживать её траекторию. И программа должна настраиваться на то, чтобы строить контуры яркого цветного образа и отслеживать траекторию её перемещения на фоне тёмного неба.
А теперь представим себе, что это не салют, а осветительная ракета, и наша задача – найти на земле на линии фронта замаскировавшегося или ползущего вражеского лазутчика. Ясно, что наш взор будет обращён на «тёмную» землю, и основные цвета и яркость лазутчика и фона для вычисления контуров надо искать совсем в других диапазонах.
Сейчас при каждом текущем режиме «периферического зрения» для вычисления контуров программа выбирает единственный вариант для всего bmp-рисунка, не всегда дающий самый «богатый» и подробный контурный рисунок, чтобы не увеличивать до бесконечности время обучения и распознавания.
Если же весь цикл настройки, вычисления контуров и распознавания проводить постоянно только в небольшом сегменте в окрестностях точки, на которую в данный момент направлен наш взор, то время на один цикл может существенно сократиться. Правда, количество самих циклов увеличится.
Природа, видимо, пошла именно по этому пути, решив при этом проблему быстрого вычисления контуров. Это и позволяет быстро определять правильные диапазоны основных и фоновых цветов для интересующего нас образа и соответственно на них настроиться для окончательного распознавания. Периферическое зрение при этом берёт на себя задачу упрощённого предварительного распознавания.
То, что наш зрительный аппарат не занимается постоянным «тотальным» интегральным распознаванием, учитывающим все теоретически возможные сочетания параметров, начальных точек осмотра и алгоритмов, доказывает наличие центральной ямки в сетчатке. В каждый момент времени на эту ямку, имеющую максимальную разрешающую способность, проецируется лишь небольшая область изображения.
Для иллюстрации важности сказанного выше приведём aReadme другого клона (антипода), полностью «игнорирующего» лису на тех же видео, и якобы интересующегося «конструкцией» решётки.
Клон: xytk08StormReshetka 1.0.3 xyt 1.0.3 xyt kinoBmp
Это xyt-клон "Шторм-Решётка"
t=время
Формат клона: 1.0.3
Конфигурация клона: xyt
Версия программы, записавшей клон последний раз: 1.0.3
Конфигурация программы, записавшей клон последний раз: xyt
Клон вырастил Хабибуллин Тавис Габдулхаевич
Клон использует те же bmp-эпизоды (файлы), что и клоны
xytK06StormLisa и
xytK07LisaGolova.
Те же рисунки (bmp-эпизоды), с которыми работали эти клоны, для обучения данного клона xytk08StormReshetka интерпретируются и группируются совсем по-другому:
PICNUM OBRAZKOD READMOD PICFILENAME
250 141 7 "xyt\MordaVpered2.bmp" повтор для Шторм-Решётка
260 141 7 "xyt\LisaRstoit.bmp" повторы для Ш-Решётка
261 141 7 "xyt\LisaRmotGol.bmp" Ш-Решётка
262 0 7 "xyt\MordaVpered1.bmp" Ш-Решётка
263 141 7 "xyt\Lapa.bmp" Ш-Решётка
264 141 7 "xyt\MordaVper1Z.bmp" Ш-Решётка,
где
OBRAZKOD OBRAZNAME
141 Решётка
Данный клон, в отличие от клона "Шторм-Лиса, "интересуется" не лисами, а решётками (включая этап обучения). В обоих случаях для простоты строятся одни и те же контурные рисунки, не привязанные ни к лисам, ни к решёткам. Хотя теоретически такая привязка возможна, т.к. уже сейчас используется понятие (и сегмент) так называемой «предполагаемой локализации ещё до конца нераспознанных объектов». Подробнее смотри в aReadmeXYTbmp, aReadmeParametr (RisAvtoParMod=true) .
При обучении удалось обойтись режимами периферического зрения
PerifRISxy32 = True
PerifRISxy64 = True
PerifRISxy128 = False,
без "центрального" зрения.
Примечания.
Кадры эпизода "LisaRstoit.bmp" отличаются друг от друга из-за дрожания камеры.
В строках
PICNUM OBRAZKOD READMOD PICFILENAME
251 0 7 "xyt\Storm3.bmp"
262 0 7 "xyt\MordaVpered1.bmp" Ш-Решётка
OBRAZKOD=0. Это значит, что код образа неизвестен, и соответствующий рисунок при обучении игнорируется.
Тем не менее при распознавании (после обучения) клон выдал правильные ответы.
Сходство образов в разных эпизодах
Интересно, что на начальных этапах обучения на компактных и чётких, качественных видео клоны улавливали сходство, например, прибоя и водопада, шторма и фонтана, прибоя и бегущей лошади.
См. продолжение в aReadmeXytBmp4
|