Alex2013 писал(а):Вот кстати пример когда примитивная логика успешно заменяет умную математику .
Не тут математика выигрывает. Лучше не объединять, а использовать принципы компонентного анализа, в частности преобразование KLT для выделение наиболее значимых компонент.
Пусть есть класс овалов в который входят круг, овал, овал повернутый на 45 градусов. Все эти овалы залиты сплошным чёрным цветом.
Так вот если мы будем проверять изображения на совпадение. К примеру с квадратом. То попиксельное сравнение покажет совпадение в 80%. Но квадрат не относится к кругу! Это ошибки второго рода.
Суть в том что внутренние пиксели дают инертность. И их надо выбросить.
Рассмотрим случай теперь с четырёх угольников. К этому классу относятся квадраты, трапеции, параллелограммы, ромбы.
Будем сравнивать по углам. Но из за ошибок к примеру мы не найдем один угол или он будет сдвинут. Мы получим что удачных совпадений будет 1%. Тут ошибки первого рода.
Можно выбрать средний вариант оставив только контур. Но встаёт вопрос в толщине контура. Больше толщина больше инертность сравнения. Меньше толщина велика вероятность нарваться на ошибку. Как её выбрать наиболее оптимально?
Есть универсальное решение для любого класса. Для этого предлагается ортогональное разложение. Как ортогональные вектора при произведение друг на друга дают 0. Так и тут выбрать такие пиксели из разных классов при сравнение по которым картинки будут относится к разным классам независимо. Т.е такие пиксели которые зачернены только в данном классе и не зачернены в других классах. Для отсыскания таких пикселей применяют преобразование KLT в котором ищутся собственные вектора и собственные значения.
Объединять тоже надо хитро. Понятно что если внутри класса объединить овал и круг то ничего хорошего не выйдет. Поэтому для этого и применяют мозаику. Разбивают шаблоны на составляющие. Для класса овалов такими составляющими будут дуги.
Для четырёх угольников это углы и прямые рёбра.
Для класса лицо такими составляющими будут глаза, нос , рот уши. Которые упрощаются до примитивов Хаара.
Тут применяется двойное распознавание. Сначала ищутся особенности. А после уже объединяются в одно целое через НС.