Читая статью, мне трудно понять описанный алгоритм:
Получив черно-белое цифровое изображение образца почерка, вырежьте один символ для анализа. Поскольку это может быть любой размер, алгоритм должен это учитывать (если так будет проще, мы можем принять размер 2^n x 2^m).
Теперь в описании указано, что с учетом этого изображения мы преобразуем его в 512-битную функцию (512-битный хэш) следующим образом:
(192 бита) вычисляет градиент изображения путем его свертки с помощью оператора Собеля 3x3. Направление градиента на каждом ребре квантуется по 12 направлениям.
(192 бита) Генератор структурных признаков берет карту градиента и ищет в окрестности определенные комбинации значений градиента. (используется для вычисления 8 различных функций, представляющих линии и углы на изображении)
(128 бит) Генератор вогнутости использует оператор 8-точечной звезды для поиска грубых вогнутостей в 4 направлениях, отверстий и штрихов большого масштаба.
Карты характеристик изображения нормализованы сеткой 4x4.
На данный момент я борюсь с тем, как взять произвольное изображение, разделить на 16 разделов и использовать оператор Собеля 3x3, чтобы получить 12 бит для каждого раздела. (Но если у вас есть представление о других частях, не стесняйтесь комментировать :)
2 ответа
Я борюсь с той же статьей Шрихари и др. (2002) для моей докторской степени. Тезис. Я бы сказал, что этот текст не очень конкретен, но авторы ссылаются на технический отчет (CEDAR-TR-01-1) за более подробной информацией. Похоже, что этот отчет недоступен в Интернете, поэтому я предлагаю связаться с авторами по электронной почте и запросить этот отчет. Если что-то непонятно, вы также можете попросить разъяснений.
Я вижу, что вопрос очень старый, но, возможно, он может кому-то помочь - вы применяете операторы Собеля для обнаружения горизонтальных и вертикальных краев на изображении. Из результата вы можете рассчитать векторы направления изображения для каждой точки изображения. В вашем случае вам нужно сопоставить эти векторы с 12 направлениями. Затем, в вашем случае, вы делите изображение на фрагменты 4x4 (16 секций) и вычисляете интенсивность каждого направления в каждой секции. Это дает вам 12 * 16 = 192 функции. Если нужно, могу дать более подробное объяснение.
Похожие вопросы
Новые вопросы
algorithm
Алгоритм - это последовательность четко определенных шагов, которые определяют абстрактное решение проблемы. Используйте этот тег, если ваша проблема связана с дизайном алгоритма.