У меня есть ситуация, когда я буду собирать множество метрик временных рядов (использованная электроэнергия, использованные часы, часы простоя) от работающего оборудования в производственном плане. Мне нужно создать много разных сводных номеров для отдельных и сгруппированных активов. Например, мне нужно создать минимальное, максимальное, среднее значение электроэнергии, используемой в течение 1,5,10,30 дней для данной машины. Создавайте одинаковые типы показателей для разных групп машин .... Многие из вычисляемых значений основаны на необработанных значениях, извлеченных из ресурсов.
Каков наилучший подход для вычисления этих значений в среде Cassandra?
- Нужно ли мне создавать «пакетные задания» для выполнения вычислений?
- Кажется, что в Cassandra есть несколько встроенных типов данных (счетчик), но, похоже, есть некоторые проблемы (просто читая некоторые комментарии о переполнении стека)
- Кто-нибудь интегрировал Кассандру со штормом Твиттера или еще чем-то, чтобы постоянно обновлять счетчики?
Благодарность
1 ответ
Есть проект с открытым исходным кодом под названием Blueflood, который делает именно это. Скорее всего, вы можете использовать его прямо из коробки, чтобы заполнить свой прецедент, или создать ответвление репо и при необходимости изменить.
- Документация и домашняя страница: http://blueflood.io/
- Исходный код: https://github.com/rackerlabs/blueflood
- Irc: #blueflood на Freenode
(Отказ от ответственности: я участвую в проекте)
Похожие вопросы
Новые вопросы
cassandra
Apache Cassandra — это хорошо масштабируемое, в конечном итоге согласованное, распределенное, структурированное хранилище строк/столбцов. Вопросы об администрировании сервера Cassandra можно задать на странице https://dba.stackexchange.com/questions/tagged/cassandra.