У меня есть список вложенных словарей со списками внутри, и я хочу вычислить количество всех возможных комбинаций по всем dicts. Пример ввода json = [{"lang": "...

3
mobelahcen 13 Янв 2021 в 16:49

1 ответ

Лучший ответ

Вы можете рекурсивно сгладить структуру, а затем сгруппировать по сформированным ключам. Оттуда можно применять базовые комбинации:

from collections import defaultdict, Counter
import itertools as it
json = [{'lang': 'fr', 'dates': ['d1', 'd2'], 'address': [{'city': 'Paris', 'zip': '75001'}, {'city': 'Lyon', 'zip': '69600'}]}, {'lang': 'fr', 'dates': ['d2', 'd3'], 'address': [{'city': 'Paris', 'zip': '75001'}]}]
def get_keys(d, c = [], j = None):
  if not isinstance(d, (dict, list)):
     yield ('.'.join(c), d, j)
  elif isinstance(d, list):
     yield from [i for j, b in enumerate(d) for i in get_keys(b, c = c, j = j if isinstance(b, dict) else None)]
  else:
     for a, b in d.items():
        yield from get_keys(b, c = c+[a], j = j)
      
def get_combos(data):   
  d = defaultdict(list)
  for a, *b in get_keys(data):
     d[a].append(b)
  return {f'{b}_{a}':Counter([f'{y}_{x}' for [x, l1], [y, l2] in it.product(d[a], d[b]) if type(l1) != type(l2) or l1 == l2]) for a, b in it.combinations(d, 2)}

new_d = {}
for i in json:
   for a, b in get_combos(i).items():
     for c, d in b.items():
        new_d[a] = {**(l:=new_d.get(a, {})), c:d if c not in l else l[c]+d} 

Выход:

{'dates_lang': {'d1_fr': 1, 'd2_fr': 2, 'd3_fr': 1}, 'address.city_lang': {'Paris_fr': 2, 'Lyon_fr': 1}, 'address.zip_lang': {'75001_fr': 2, '69600_fr': 1}, 'address.city_dates': {'Paris_d1': 1, 'Lyon_d1': 1, 'Paris_d2': 2, 'Lyon_d2': 1, 'Paris_d3': 1}, 'address.zip_dates': {'75001_d1': 1, '69600_d1': 1, '75001_d2': 2, '69600_d2': 1, '75001_d3': 1}, 'address.zip_address.city': {'75001_Paris': 2, '69600_Lyon': 1}}

Изменить: чтобы распечатать плоскую структуру, сначала сохраните вызов get_keys:

def get_combos(data):   
  d = defaultdict(list)
  t_result = list(get_keys(data))
  print(t_result) #displaying flattened input dict
  for a, *b in t_result:
     d[a].append(b)
  return {f'{b}_{a}':Counter([f'{y}_{x}' for [x, l1], [y, l2] in it.product(d[a], d[b]) if type(l1) != type(l2) or l1 == l2]) for a, b in it.combinations(d, 2)}
2
Ajax1234 14 Янв 2021 в 05:00