Как я могу очистить (а затем экспортировать в JSON) ячейки, которые содержат разделенные запятыми, возможно, повторяющиеся значения?

Пример ячеек:

+-------------+
| foo,bar,foo |
+-------------+
| bar,qux     |
+-------------+
| bar,bar     |
+-------------+

Мне нужно, чтобы данные разбивались на новые столбцы и дедуплицировались следующим образом:

+-----+-----+
| foo | bar |
+-----+-----+
| bar | qux |
+-----+-----+
| bar |     |
+-----+-----+

или возможность экспортировать дедуплицированные данные в виде массива JSON

+---------+
| foo,bar |
+---------+
| bar,qux |
+---------+
| bar     |
+---------+

К

"cellname": ["foo", "bar"]
"cellname": ["bar", "qux"]
"cellname": ["bar"]

Спасибо за вашу помощь!

0
karkraeg 20 Дек 2018 в 18:48

1 ответ

Лучший ответ

Сначала вы должны импортировать свой набор данных в линейном режиме, чтобы значения содержались в одном столбце.

Нравится.

enter image description here

Затем вы можете использовать этот хакерский скрипт Python / Jython (уже упомянутый здесь), чтобы преобразовать столбец:

from collections import OrderedDict
dedup = list(OrderedDict.fromkeys(value.replace(' ','').split(',')))
return '["' + '","'.join(dedup) + '"]')

Результат:

enter image description here

Наконец, нажав «Экспорт -> Шаблоны», вы можете использовать подобное значение в поле «Шаблон строки»:

  "cellnames" : {{cells["Column 1"].value}}
1
Ettore Rizza 24 Дек 2018 в 13:28