Я использовал LDA для корпуса документов и нашел несколько тем. Результатом моего кода являются две матрицы, содержащие вероятности. одна вероятность темы документа, а другая вероятность темы слова. Но я на самом деле не знаю, как использовать эти результаты, чтобы предсказать тему нового документа. Я использую выборку Гиббса. Кто-нибудь знает, как? Благодарность
1 ответ
Реализация Java http://www.arbylon.net/ В проектах/lda-j/lda-j-src-20050325.zip есть короткий пример программы в src\org\knowceans\lda\SearchEnglet.java. Я надеюсь, что вы немного знакомы с java, и код поможет вам.
Оригинал документа http://jmlr.csail.mit.edu/papers/ Volume3/blei03a/blei03a.pdf описывает выводы в разделах 5.1 и 5.2.
Похожие вопросы
Новые вопросы
python
Python — это мультипарадигмальный многоцелевой язык программирования с динамической типизацией. Он предназначен для быстрого изучения, понимания и использования, а также обеспечивает чистый и унифицированный синтаксис. Обратите внимание, что Python 2 официально не поддерживается с 01.01.2020. Если у вас есть вопросы о версии Python, добавьте тег [python-2.7] или [python-3.x]. При использовании варианта Python (например, Jython, PyPy) или библиотеки (например, Pandas, NumPy) укажите это в тегах.