Как получить комбинацию значений из одного столбца?

0
задан Muhammad Fikry Hazmi 17 January 2019 в 05:22
поделиться

1 ответ

Ниже для BigQuery Standard SQL и отвечает только на точный вопрос в заголовке вашего сообщения:

Как получить комбинацию значений из одного столбца?

#standardSQL
CREATE TEMP FUNCTION test(a ARRAY<INT64>) 
RETURNS ARRAY<STRING>
LANGUAGE js AS '''
  var combine = function(a) {
    var fn = function(n, src, got, all) {
      if (n == 0) {
        if (got.length > 0) {
          all[all.length] = got;
        } return;
      }
      for (var j = 0; j < src.length; j++) {
        fn(n - 1, src.slice(j + 1), got.concat([src[j]]), all);
      } return;
    }
    var all = [];
    for (var i = 1; i < a.length; i++) {
      fn(i, a, [], all);
    }
    all.push(a);
    return all;
  } 
  return combine(a)
''';
WITH types AS (
  SELECT DISTINCT type, CAST(DENSE_RANK() OVER(ORDER BY type) AS STRING) type_num
  FROM `project.dataset.order`
  WHERE status = 'OK'
)
SELECT items, STRING_AGG(type ORDER BY type_num) types
FROM UNNEST(test(GENERATE_ARRAY(1,(SELECT COUNT(1) FROM types)))) AS items, 
UNNEST(SPLIT(items)) AS pos
JOIN types ON pos = type_num
GROUP BY items  

Вы можете протестировать, поиграть с выше, используя примеры данных из ваших вопросов, как показано ниже

#standardSQL
CREATE TEMP FUNCTION test(a ARRAY<INT64>) 
RETURNS ARRAY<STRING>
LANGUAGE js AS '''
  var combine = function(a) {
    var fn = function(n, src, got, all) {
      if (n == 0) {
        if (got.length > 0) {
          all[all.length] = got;
        } return;
      }
      for (var j = 0; j < src.length; j++) {
        fn(n - 1, src.slice(j + 1), got.concat([src[j]]), all);
      } return;
    }
    var all = [];
    for (var i = 1; i < a.length; i++) {
      fn(i, a, [], all);
    }
    all.push(a);
    return all;
  } 
  return combine(a)
''';
WITH `project.dataset.order` AS (
  SELECT '2019-01-02' dt, 'Shirt' type, 'Cashless' payment, 101 customer_no, 'Cancel' status UNION ALL
  SELECT '2019-01-02', 'Jeans', 'Cashless', 133, 'OK' UNION ALL
  SELECT '2019-01-02', 'Jeans', 'Cash', 102, 'OK' UNION ALL
  SELECT '2019-01-02', 'Cap', 'Cash', 144, 'OK' UNION ALL
  SELECT '2019-01-02', 'Shirt', 'Cash', 132, 'OK' UNION ALL
  SELECT '2019-01-01', 'Jeans', 'Cash', 111, 'Cancel' UNION ALL
  SELECT '2019-01-01', 'Cap', 'Cash', 141, 'OK' UNION ALL
  SELECT '2019-01-01', 'Shirt', 'Cash', 101, 'OK' UNION ALL
  SELECT '2019-01-01', 'Jeans', 'Cash', 105, 'OK' 
), types AS (
  SELECT DISTINCT type, CAST(DENSE_RANK() OVER(ORDER BY type) AS STRING) type_num
  FROM `project.dataset.order`
  WHERE status = 'OK'
)
SELECT items, STRING_AGG(type ORDER BY type_num) types
FROM UNNEST(test(GENERATE_ARRAY(1,(SELECT COUNT(1) FROM types)))) AS items, 
UNNEST(SPLIT(items)) AS pos
JOIN types ON pos = type_num
GROUP BY items

с результатом

Row items   types    
1   1       Cap  
2   2       Jeans    
3   3       Shirt    
4   1,2     Cap,Jeans    
5   1,3     Cap,Shirt    
6   2,3     Jeans,Shirt  
7   1,2,3   Cap,Jeans,Shirt  
0
ответ дан Mikhail Berlyant 17 January 2019 в 05:22
поделиться
Другие вопросы по тегам:

Похожие вопросы: