Читая статью, мне трудно понять описанный алгоритм:

Получив черно-белое цифровое изображение образца почерка, вырежьте один символ для анализа. Поскольку это может быть любой размер, алгоритм должен это учитывать (если так будет проще, мы можем принять размер 2^n x 2^m).

Теперь в описании указано, что с учетом этого изображения мы преобразуем его в 512-битную функцию (512-битный хэш) следующим образом:

  1. (192 бита) вычисляет градиент изображения путем его свертки с помощью оператора Собеля 3x3. Направление градиента на каждом ребре квантуется по 12 направлениям.

  2. (192 бита) Генератор структурных признаков берет карту градиента и ищет в окрестности определенные комбинации значений градиента. (используется для вычисления 8 различных функций, представляющих линии и углы на изображении)

  3. (128 бит) Генератор вогнутости использует оператор 8-точечной звезды для поиска грубых вогнутостей в 4 направлениях, отверстий и штрихов большого масштаба.

Карты характеристик изображения нормализованы сеткой 4x4.

На данный момент я борюсь с тем, как взять произвольное изображение, разделить на 16 разделов и использовать оператор Собеля 3x3, чтобы получить 12 бит для каждого раздела. (Но если у вас есть представление о других частях, не стесняйтесь комментировать :)

1
pithyless 6 Авг 2009 в 10:21
Я думаю, вам нужно конкретизировать свой вопрос. Является ли проблема разделением изображения или выполнением свертки ядра sobel?
 – 
Hannes Ovrén
6 Авг 2009 в 10:43
Вы просите нас помочь вам понять работу по распознаванию рукописного ввода или вы просите нас сделать за вас домашнее задание? Видите ли, обычно документы включают решение, поэтому нет необходимости искать его.
 – 
jilles de wit
10 Авг 2009 в 15:50
Шрихари и др. (2002). Как упоминалось другими, детали реализации были скудными. Прошло много времени с тех пор, как я опубликовал этот вопрос. Я могу выкопать его и нанести еще один удар.
 – 
pithyless
29 Июн 2010 в 15:09

2 ответа

Я борюсь с той же статьей Шрихари и др. (2002) для моей докторской степени. Тезис. Я бы сказал, что этот текст не очень конкретен, но авторы ссылаются на технический отчет (CEDAR-TR-01-1) за более подробной информацией. Похоже, что этот отчет недоступен в Интернете, поэтому я предлагаю связаться с авторами по электронной почте и запросить этот отчет. Если что-то непонятно, вы также можете попросить разъяснений.

3
user201626 3 Ноя 2009 в 14:56

Я вижу, что вопрос очень старый, но, возможно, он может кому-то помочь - вы применяете операторы Собеля для обнаружения горизонтальных и вертикальных краев на изображении. Из результата вы можете рассчитать векторы направления изображения для каждой точки изображения. В вашем случае вам нужно сопоставить эти векторы с 12 направлениями. Затем, в вашем случае, вы делите изображение на фрагменты 4x4 (16 секций) и вычисляете интенсивность каждого направления в каждой секции. Это дает вам 12 * 16 = 192 функции. Если нужно, могу дать более подробное объяснение.

2
Mika 18 Июл 2014 в 16:45