У меня есть следующие наборы данных ...

Данные о местоположении для мониторинга состояния (таблица CML)

+--------+--------------------+--------------------+--------------+------------+--------------------+-------+-----+
| CML_ID |     POF_COLUMN     |      CML_TYPE      | SAMPLE_VALUE | COMPLIANCE | CORROSION_SEVERITY | LR_LD | POF |
+--------+--------------------+--------------------+--------------+------------+--------------------+-------+-----+
|      1 | SAMPLE_VALUE       | MIC_SAMPLING_POINT |            5 | NO         | MINOR              |     1 |     |
|      2 | SAMPLE_VALUE       | MIC_SAMPLING_POINT |          0.5 | NO         | MINOR              |     2 |     |
|      3 | SAMPLE_VALUE       | MIC_SAMPLING_POINT |           20 | NO         | MINOR              |     3 |     |
|      4 | COMPLIANCE         | VALVE_ROTATED      |            0 | YES        | MINOR              |     4 |     |
|      5 | LR_LD              | PIPING_THICKNESS   |            0 | YES        | MINOR              |   0.1 |     |
|      6 | CORROSION_SEVERITY | VESSEL_SHELL       |            0 | NO         | SEVERE             |     0 |     |
|      7 | CORROSION_SEVERITY | NOZZLE             |            0 | NO         | LOW                |     0 |     |
+--------+--------------------+--------------------+--------------+------------+--------------------+-------+-----+

Данные о вероятности сбоя (таблица POF)

+--------------------+--------------------+-------------+-----+
|     POF_COLUMN     |      CML_TYPE      | VALUE_RANGE | POF |
+--------------------+--------------------+-------------+-----+
| SAMPLE_VALUE       | MIC_SAMPLING_POINT | 1           |   5 |
| SAMPLE_VALUE       | MIC_SAMPLING_POINT | 5           |   4 |
| SAMPLE_VALUE       | MIC_SAMPLING_POINT | 10          |   3 |
| SAMPLE_VALUE       | MIC_SAMPLING_POINT | 15          |   2 |
| SAMPLE_VALUE       | MIC_SAMPLING_POINT | 100         |   1 |
| COMPLIANCE         | VALVE_ROTATED      | YES         |   5 |
| COMPLIANCE         | VALVE_ROTATED      | NO          |   1 |
| LR_LD              | PIPING_THICKNESS   | 2           |   5 |
| LR_LD              | PIPING_THICKNESS   | 1.5         |   4 |
| LR_LD              | PIPING_THICKNESS   | 1           |   3 |
| LR_LD              | PIPING_THICKNESS   | 0.8         |   2 |
| LR_LD              | PIPING_THICKNESS   | 0.5         |   1 |
| CORROSION_SEVERITY | VESSEL_SHELL       | NEGLIGIBLE  |   5 |
| CORROSION_SEVERITY | VESSEL_SHELL       | LOW         |   4 |
| CORROSION_SEVERITY | VESSEL_SHELL       | MEDIUM      |   3 |
| CORROSION_SEVERITY | VESSEL_SHELL       | HIGH        |   2 |
| CORROSION_SEVERITY | VESSEL_SHELL       | SEVERE      |   1 |
| CORROSION_SEVERITY | NOZZLE             | NEGLIGIBLE  |   5 |
| CORROSION_SEVERITY | NOZZLE             | LOW         |   5 |
| CORROSION_SEVERITY | NOZZLE             | MEDIUM      |   5 |
| CORROSION_SEVERITY | NOZZLE             | HIGH        |   3 |
| CORROSION_SEVERITY | NOZZLE             | SEVERE      |   2 |
+--------------------+--------------------+-------------+-----+

И мне нужно вернуть туалете или точно соответствующую запись в таблице POF, используя поля [POF_Column], [CML_Type] и поля [SAMPLE_VALUE], [COMPLIANCE], [CORROSION_SEVERITY] или [LR_LD] для каждой записи CML в CML. Стол. Затем обновите запись POF в таблице CML.

Например, если мы посмотрим на CML_ID = 2.

Отфильтруйте таблицу POF по [POF_COLUMN] = 'SAMPLE_VALUE', [CML_TYPE] = 'MIC_SAMPLING_POINT' и [VALUE_RANGE] - значение в столбце [SAMPLE_VALUE] (в данном случае 0,5) является минимальным.

В этом случае он будет соответствовать этой первой записи в таблице POF и вернуть значение POF = 5.

Если мы посмотрим на другой случай. CML_ID = 7.

Отфильтруйте таблицу POF по [POF_COLUMN] = 'CORROSION_SEVERITY', [CML_TYPE] = 'NOZZLE' и [VALUE_RANGE] = значению в столбце [CORROSION_SEVERITY], в данном случае «LOW».

В этом случае он будет соответствовать четвертой снизу строке в таблице POF и вернет значение POF = 5.

Таким образом, мне нужно ОБНОВИТЬ таблицу CML, чтобы показать следующие результаты ...

+--------+---+-----+
| CML_ID | … | POF |
+--------+---+-----+
|      1 | … |   4 |
|      2 | … |   5 |
|      3 | … |   2 |
|      4 | … |   5 |
|      5 | … |   1 |
|      6 | … |   1 |
|      7 | … |   5 |
+--------+---+-----+

Кто-нибудь знает, как я могу этого добиться? Ниже я разместил образец кода своих попыток. Что работает для поиска точных совпадающих значений, но не ближайших совпадающих значений.

DROP DATABASE IF EXISTS VESSELS;
CREATE DATABASE VESSELS;
USE VESSELS;

CREATE TABLE CML (
  `CML_ID`              INTEGER NOT NULL,
  `POF_COLUMN`          VARCHAR(50),
  `CML_TYPE`            VARCHAR(50),
  `SAMPLE_VALUE`        FLOAT,
  `COMPLIANCE`          ENUM('YES','NO'),
  `CORROSION_SEVERITY`  VARCHAR(50),
  `LR_LD`               FLOAT,
  `POF`                 TINYINT,
  PRIMARY KEY (CML_ID)
);

CREATE TABLE POF (
  `POF_COLUMN`   VARCHAR(50),
  `CML_TYPE`     VARCHAR(50),
  `VALUE_RANGE`  VARCHAR(100),
  `POF`          TINYINT,
  PRIMARY KEY (POF_COLUMN, CML_TYPE, VALUE_RANGE)
);

INSERT INTO CML 
VALUES (1, 'SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 5, 'NO', 'MINOR', 1, NULL),
       (2, 'SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 0.5, 'NO', 'MINOR', 2, NULL),
       (3, 'SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 20, 'NO', 'MINOR', 3, NULL), 
       (4, 'COMPLIANCE', 'VALVE_ROTATED', 0, 'YES', 'MINOR', 4, NULL), 
       (5, 'LR_LD', 'PIPING_THICKNESS', 0, 'YES', 'MINOR', 0.1, NULL),
       (6, 'CORROSION_SEVERITY', 'VESSEL_SHELL', 0, 'NO', 'SEVERE', 0, NULL),
       (7, 'CORROSION_SEVERITY', 'NOZZLE', 0, 'NO', 'LOW', 0, NULL);

INSERT INTO POF 
VALUES ('SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 1, 5),
       ('SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 5, 4),
       ('SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 10, 3),
       ('SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 15, 2),
       ('SAMPLE_VALUE', 'MIC_SAMPLING_POINT', 100, 1),
       ('COMPLIANCE', 'VALVE_ROTATED', 'YES', 5), 
       ('COMPLIANCE', 'VALVE_ROTATED', 'NO', 1), 
       ('LR_LD', 'PIPING_THICKNESS', 2, 5),
       ('LR_LD', 'PIPING_THICKNESS', 1.5, 4),
       ('LR_LD', 'PIPING_THICKNESS', 1, 3),
       ('LR_LD', 'PIPING_THICKNESS', 0.8, 2),
       ('LR_LD', 'PIPING_THICKNESS', 0.5, 1),
       ('CORROSION_SEVERITY', 'VESSEL_SHELL', 'NEGLIGIBLE', 5),
       ('CORROSION_SEVERITY', 'VESSEL_SHELL', 'LOW', 4),
       ('CORROSION_SEVERITY', 'VESSEL_SHELL', 'MEDIUM', 3),
       ('CORROSION_SEVERITY', 'VESSEL_SHELL', 'HIGH', 2),
       ('CORROSION_SEVERITY', 'VESSEL_SHELL', 'SEVERE', 1),
       ('CORROSION_SEVERITY', 'NOZZLE', 'NEGLIGIBLE', 5),
       ('CORROSION_SEVERITY', 'NOZZLE', 'LOW', 5),
       ('CORROSION_SEVERITY', 'NOZZLE', 'MEDIUM', 5),
       ('CORROSION_SEVERITY', 'NOZZLE', 'HIGH', 3),
       ('CORROSION_SEVERITY', 'NOZZLE', 'SEVERE', 2);

-- UPDATE EXACT MATCHING VALUE
UPDATE CML c
LEFT JOIN POF p
ON c.POF_COLUMN = p.POF_COLUMN
   AND c.CML_TYPE = p.CML_TYPE
   AND ( (c.POF_COLUMN = 'COMPLIANCE' AND c.COMPLIANCE = p.VALUE_RANGE) OR
         (c.POF_COLUMN = 'SAMPLE_VALUE' AND c.SAMPLE_VALUE = p.VALUE_RANGE) OR
         (c.POF_COLUMN = 'LR_LD' AND c.LR_LD = p.VALUE_RANGE) OR
         (c.POF_COLUMN = 'CORROSION_SEVERITY' AND c.CORROSION_SEVERITY = p.VALUE_RANGE)
       )
SET c.POF = p.POF;

SELECT * FROM CML;
3
Josh 14 Мар 2018 в 03:51

2 ответа

Лучший ответ

Проголосуйте за очень подробный пост с примерами данных и ожидаемым результатом. Проблема заключается в sample_value и lr_ld, поскольку это может быть не точное значение из таблицы POF. Однако вы заметите, что значения либо равны, либо меньше диапазона значений.

Следовательно, если мы получаем максимальное значение POF, в котором sample_value или lr_ld меньше или равно диапазону значений, тогда нам нужно только получить максимальное значение POF.

Этот запрос будет работать только потому, что значение POF увеличивается при увеличении sample_value или lr_ld.

UPDATE CML c
  JOIN 
(
    select c.CML_ID, max(p.POF) POF 
    from CML c
    LEFT JOIN POF p
    ON c.POF_COLUMN = p.POF_COLUMN
       AND c.CML_TYPE = p.CML_TYPE
       AND ( (c.POF_COLUMN = 'COMPLIANCE' AND c.COMPLIANCE = p.VALUE_RANGE) OR
             (c.POF_COLUMN = 'SAMPLE_VALUE' AND  c.SAMPLE_VALUE<=p.VALUE_RANGE) OR
             (c.POF_COLUMN = 'LR_LD' AND c.LR_LD  <= p.VALUE_RANGE) OR
             (c.POF_COLUMN = 'CORROSION_SEVERITY' AND c.CORROSION_SEVERITY = p.VALUE_RANGE)
           )
     group by c.CML_ID 
   ) t
 on c.CML_ID = t.CML_ID
set c.POF = t.POF;
1
âńōŋŷXmoůŜ 14 Мар 2018 в 02:14

Красиво сформулированный вопрос с достаточной детализацией.

Здесь у вас есть проблема.

A) Значение в POF - это либо строка, либо число с плавающей запятой. Когда это строка, вам нужно провести точное сравнение. Если это число с плавающей запятой, вы хотите найти ближайшее значение.

Это кричит бизнес-код на сервере приложений, но предположим, что вы хотите сделать это в MySQL.

Ответом является оператор case, который определяет с помощью CML_TYPE, как рассчитать POF. Для сравнения «строкового» типа это будет равно. Для сравнения типа «с плавающей запятой» вы можете написать сравнение, чтобы получить запись, наиболее близкую к заданному значению. В любом случае, каждое из правил немного отличается.

Что вам нужно сделать, так это создать оператор CASE для каждого CML_TYPE, а затем создать настраиваемый сопоставитель, чтобы найти нужный POF.

Следующий код действительно работает, но нет никаких гарантий относительно производительности.

UPDATE CML c
  JOIN 
(select CML_ID, 
  CASE CML_TYPE 
     WHEN 'VALVE_ROTATED' THEN
       (select POF from POF where POF.CML_TYPE = CML.CML_TYPE and VALUE_RANGE = CML.COMPLIANCE)
     WHEN 'VESSEL_SHELL' THEN
       (select POF from POF where POF.CML_TYPE = CML.CML_TYPE and VALUE_RANGE = CML.CORROSION_SEVERITY)
     WHEN 'NOZZLE' THEN
       (select POF from POF where POF.CML_TYPE = CML.CML_TYPE and VALUE_RANGE = CML.CORROSION_SEVERITY)
     WHEN 'MIC_SAMPLING_POINT' THEN
       (select POF from POF where POF.CML_TYPE = CML.CML_TYPE ORDER BY ABS(CML.SAMPLE_VALUE - cast(VALUE_RANGE AS DECIMAL(10,2))) LIMIT 1)
     WHEN 'PIPING_THICKNESS' THEN
       (select POF from POF where POF.CML_TYPE = CML.CML_TYPE ORDER BY ABS(CML.SAMPLE_VALUE - cast(VALUE_RANGE AS DECIMAL(10,2))) LIMIT 1)
     ELSE 'BLAH'       
  END as CALC_POF
from CML) as updater on c.CML_ID = updater.CML_ID
set c.POF = updater.CALC_POF;

Ссылка на скрипт SQL

1
Brian Hoover 14 Мар 2018 в 01:38