Учитывая ссылочный фрейм данных A с одним столбцом «ID» (50 000 строк) и фреймы данных B, C, D со столбцом «ID» с 45 000 строками, 55 000, 70 000 строками соответственно, с каждым экземпляром & ...

-1
B R 15 Дек 2020 в 08:34

1 ответ

Лучший ответ

Вы можете попробовать .isin(). Пример с pd.Series:

A = pd.Series([196, 202, 443, 781, 557])

B = pd.Series([781, 488, 712, 202, 482, 311])

if len(A) >= len(B):
    matches = A.isin(B)
else:
    matches = B.isin(A)

mismatches = ~matches

print('matches: {}, mismatches: {}'.format(sum(matches), sum(mismatches))

Сравнение длин выполняется таким образом, чтобы найти нужное количество несовпадений. это не имело бы значения для поиска нужного количества совпадений, конечно. Интерпретация True как 1 и False как 0 позволяет суммировать числа.

0
warped 15 Дек 2020 в 09:49