У меня есть ситуация, когда я буду собирать множество метрик временных рядов (использованная электроэнергия, использованные часы, часы простоя) от работающего оборудования в производственном плане. Мне нужно создать много разных сводных номеров для отдельных и сгруппированных активов. Например, мне нужно создать минимальное, максимальное, среднее значение электроэнергии, используемой в течение 1,5,10,30 дней для данной машины. Создавайте одинаковые типы показателей для разных групп машин .... Многие из вычисляемых значений основаны на необработанных значениях, извлеченных из ресурсов.

Каков наилучший подход для вычисления этих значений в среде Cassandra?

  1. Нужно ли мне создавать «пакетные задания» для выполнения вычислений?
  2. Кажется, что в Cassandra есть несколько встроенных типов данных (счетчик), но, похоже, есть некоторые проблемы (просто читая некоторые комментарии о переполнении стека)
  3. Кто-нибудь интегрировал Кассандру со штормом Твиттера или еще чем-то, чтобы постоянно обновлять счетчики?

Благодарность

3
user2219560 15 Окт 2013 в 16:40

1 ответ

Лучший ответ

Есть проект с открытым исходным кодом под названием Blueflood, который делает именно это. Скорее всего, вы можете использовать его прямо из коробки, чтобы заполнить свой прецедент, или создать ответвление репо и при необходимости изменить.

(Отказ от ответственности: я участвую в проекте)

1
fourk 16 Окт 2013 в 12:31