У нас есть таблица в Big Query, как показано ниже.

Таблица ввода:

 Name | Interests
 -----+----------
 Bob  | ["a"]
 Sue  | ["a","b"]
 Joe  | ["b","c"]

Мы хотим преобразовать приведенную выше таблицу в формат ниже, чтобы сделать ее удобной для бизнес-аналитики и визуализации.

Целевая / Обязательная таблица:

 +------------------+
 | Name | a | b | c |
 +------------------+
 | Bob  | 1 | 0 | 0 |
 | Sue  | 1 | 1 | 0 |
 | Joe  | 0 | 1 | 0 |
 +------------------+

Примечание. Столбец "Интересы" представляет собой массив данных. Возможна ли такая трансформация в Big Query? Если да, есть ли справочный запрос?

Заранее спасибо!

1
g0pa1 14 Окт 2020 в 07:16

1 ответ

Лучший ответ

Ниже приведен стандартный SQL BigQuery, в котором используются функции сценариев BQ.

#standardSQL
create temp table ttt as (
  select name, interest 
  from `project.dataset.table`, 
  unnest(interests) interest
);

EXECUTE IMMEDIATE (
  SELECT """
  SELECT name, """ || 
    STRING_AGG("""MAX(IF(interest = '""" || interest || """', 1, 0)) AS """ || interest, ', ') 
  || """
  FROM ttt 
  GROUP BY name
  """
  FROM (
    SELECT DISTINCT interest 
    FROM ttt
    ORDER BY interest
  )
);      

Если применить к образцу данных из вашего вопроса - вывод

enter image description here

1
Mikhail Berlyant 14 Окт 2020 в 04:38