Я хотел бы использовать ограниченную машину Больцмана для распознавания образов. Я обратил внимание на то, что на самом деле они используются для поиска распределений в образцах, а не для распознавания образов. Я просмотрел следующий документ: http://www.cs.toronto.edu /~hinton/absps/uai_crbms.pdf, который, похоже, использует расширение RBM, называемое ConditionalRBM. Я бы хотел это реализовать. Я уже использовал Contrastive Divergence для реализации RBM, и я хотел бы придерживаться этого для CRBM для простоты. В статье основное внимание уделяется замене контрастной дивергенции более точными алгоритмами.
Из того, что я вижу в документе, теперь мне нужно создать три весовые матрицы (так как теперь мне также нужно включить векторы классификации) (см. Рисунок 1 в документе), и я не уверен, как обновить каждую из них (т.е. как для создания векторов, которые будут влиять на изменение матрицы.)
Не мог бы кто-нибудь прояснить это для меня или предложить алгоритм классификации с использованием простого RBM, который я уже реализовал?
Спасибо.
1 ответ
Я нашел следующий документ, который разъясняет проблему: http: //uai.sis .pitt.edu / paper / 11 / p463-louradour.pdf. Плакат здесь также очень полезен, особенно для реализации: http: //www.dmi.usherb.ca/~larocheh/publications/drbm-mitacs-poster.pdf. Вместо использования трех весовых матриц достаточно использовать две: одну для векторов классификации и одну для фактических шаблонов.
Формулы для вероятностей активации меняются, но идея остается прежней.
Похожие вопросы
Новые вопросы
machine-learning
Вопросы реализации алгоритмов машинного обучения. Общие вопросы о машинном обучении (концепции, теория, методология, терминология и т. д.) следует задавать в соответствующих сообществах.