Я пытаюсь разбить текст на всю пунктуацию для английского и русского языков. это работает за исключением пробелов. по какой-то причине \ s не работает. allRussianWords в конечном итоге содержит пробелы, но я этого не хочу. allRussianWords = re.split("[—…();«»!?.:,%\s\n]",words)

Это строка, которую я пытаюсь разбить words = "привет, моё имя Мэтт. Как ты?" пунктуация на русском

0
Mattytripps 12 Фев 2021 в 22:00

1 ответ

Лучший ответ

Похоже, вам нужен + после закрывающей квадратной скобки, чтобы соответствовать последовательным символам. Один из других ответов тоже указывает на это.

\ N также является избыточным, поскольку \ s содержит символ возврата строки.

1
Stumbled 12 Фев 2021 в 20:59