ФОРУМ МОСКВЫ И СПБ

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » ФОРУМ МОСКВЫ И СПБ » На весь мир » Куда деть петабайты данных?


Куда деть петабайты данных?

Сообщений 1 страница 2 из 2

1

Мы растем не по дням, а по часам: данные сыпятся со всех датчиков, логи раздуваются до терабайтов в сутки. Традиционные СУБД уже не тянут. Подскажите, какой стек выбрать для горизонтального масштабирования? Интересует именно связка для хранения + реальная обработка в режиме близком к реальному времени.

0

2

Для такой нагрузки оптимально смотреть в сторону комбинации объектного хранилища (вроде S3) для «холодных» данных и распределенных вычислительных движков для «горячих». Если нужна именно обработка в реальном времени плюс аналитика, обратите внимание на экосистему Kafka + Flink или Spark Streaming в связке с колоночными базами данных.

Подробный разбор архитектурных подходов, сравнение производительности различных стеков (от MinIO до ClickHouse) и готовые чек-листы для внедрения вы найдете в статье на сайте https://webcl.ru/big-data-resheniya-hra … ka-analiz/ . Там разбирают конкретные кейсы масштабирования и подводные камни, о которых обычно умалчивают в документации. Рекомендую к прочтению, чтобы не ошибиться с выбором инфраструктуры на старте.

0


Вы здесь » ФОРУМ МОСКВЫ И СПБ » На весь мир » Куда деть петабайты данных?