Я знаю, что классификация НЛП - это когда мы классифицируем весь текст как (Здоровье, Спорт, Социальные, Бизнес и т. Д.)

(ЛОНДОН) - Рафаэль Надаль выступил с резкой критикой уникальных правил посева Всеанглийского клуба в субботу, за два дня до начала Уимблдона.

«Я уважаю правила Уимблдона, - сказал Надаль журналистам, -… если я верю, справедливо это или нет, это другая история. Я действительно считаю, что [это] нет».

Уимблдон использует специальную формулу для разработки посевов для турнира, которые иногда выходят за рамки стандартного рейтинга ATP. Формула придает дополнительный вес записи ATP игрока на травяных кортах, повышая или штрафуя игроков, которые играют реже или имеют меньший успех на траве.

В этом году рейтинг Уимблдона поднял Надала на третье место в турнире, и Роджер Федерер прыгнул выше него. Это потребовало бы, чтобы Надаль победил обоих игроков, посеянных над ним, чтобы выиграть титул. Это также настраивает возможность матча с Ником Киргиосом во втором раунде.

Киргиос победил Надаль на этом турнире раньше.

«Система такая, какая есть», - сказал Федерер на своей пресс-конференции. «В конце дня, если вы хотите выиграть турнир, вам нужно пройти через всех игроков, которые находятся перед вами».

Copyright © 2019, ABC Radio. Все права защищены.

Это будет считаться текстом "Спорт"

Но это не то, что я хочу

Я хочу определить слова или несколько слов в тексте

Как в тексте выше, если я хочу определить игроков

(ЛОНДОН) - Рафаэль Надаль выступил с резкой критикой всей Англии Уникальные правила высева клуба в субботу, за два дня до начала Уимблдон .

«Я уважаю правила Уимблдона, - сказал Надаль журналистам, -… если я Верь, честно это или нет, это другая история. Я действительно лично верю [это] нет ".

Уимблдон использует специальную формулу для разработки посевов для турнира, которые иногда выходят за рамки стандартного рейтинга ATP. Формула придает дополнительный вес записи ATP игрока на травяных кортах, повышая или штрафуя игроков, которые играют реже или имеют меньший успех на траве.

В этом году рейтинг Уимблдона снизился до Надаль до Третье семя турнира, где Роджер Федерер прыгает над ним. Это потребуется Надаль , чтобы победить обоих игроков, посеянных над ним, чтобы выиграть заглавие. Он также настраивает возможность матча с Ник Киргиосом . во втором раунде.

Kyrgios побеждал Надаль на этом турнире ранее.

«Система такая, какая есть», - сказал Федерер в своей прессе. конференция. «В конце дня, если вы хотите выиграть турнир, Вы должны пройти через всех игроков, которые находятся перед вами. "

Copyright © 2019, ABC Radio. Все права защищены.

Как называется этот метод и есть ли для него библиотеки Python?

-1
asmgx 5 Июл 2019 в 08:40

3 ответа

Лучший ответ

Вы хотите идентифицировать имена людей в этом тексте? Это называется NER - Named Entity Recognition.

Вы можете использовать знаменитую библиотеку nltk, если хотите ее проанализировать: https: // www.nltk.org/book/ch07.html,

Распознавание именованных сущностей NLTK в списке Python

https://www.nltk.org/

1
PV8 5 Июл 2019 в 05:51

Это относится к категории распознавания именованных объектов (NER). Вы можете использовать NLTK и Spacy для этого. Такие инструменты, как RASA NLU, также позволяют обучить модель распознавать эти объекты.

Вот несколько ссылок, которые могут быть полезны:
https://towardsdatascience.com/named-entity-recognition- с - NLTK - и - ошалевший - 8c4a7d88e7da
https://rasa.com/docs/rasa/nlu/entity- extractio

1
vonSchweetz 5 Июл 2019 в 05:54

Это проблема извлечения именованных сущностей. Для распознавания именованных объектов можно использовать библиотеки NLTK, Spacy, Stanford core NLP.

1
nag 5 Июл 2019 в 08:00