Мне нужно было бы выбрать все учетные записи, в которых 3 (или более) последовательных символа идентичны и / или включить также цифры в имя, например

Account
aaa12
43qas
42134dfsdd
did 

Выход

Account
aaa12
43qas
42134dfsdd 

Я рассматриваю возможность использования для этого регулярного выражения: [a-zA-Z] {3,}, но я не уверен в подходе. Кроме того, сюда не входят условия и / или условия для цифр. Я был бы заинтересован в обоих для выбора учетных записей хотя бы с одним из них:

  • повторяющиеся одинаковые символы,
  • числа в названии.
1
user12907213 8 Окт 2020 в 04:18

2 ответа

Лучший ответ

Попробуйте

n = 3 #for 3 chars repeating
pat = f'([a-zA-Z])\\1{{{n-1}}}|(\\d)+' #need `{{` to pass a literal `{`
df_final = df[df.Account.str.findall(pat).astype(bool)] 

Out[101]:
      Account
0       aaa12
1       43qas
2  42134dfsdd
0
Andy L. 8 Окт 2020 в 05:19

Ты можешь попробовать :

x = re.search([a-zA-Z]{3}|\d, string) 
0
Anupam Chand 8 Окт 2020 в 01:34