Общая информация по Greenplum

  • Greenplum обладает признаками и функциональностью реляционной СУБД.
  • У Greenplum массивно-параллельная архитектура.
    • Высокие накладные расходы на запуск запроса. Так как Greenplum работает на кластере, любой запрос порождает сетевые соединения между хостами и процессы на каждом из хостов. Запрос завершается, только когда все хосты успешно отработали свою часть запроса.
    • Операции обновления и удаления данных в Greenplum возможны, но приводят к дополнительному расходу места и необходимости периодической очистки.
    • Ограничения на конкурентность нагрузки — количество одновременно выполняемых запросов. Все операции выполняются симметрично на всех хостах кластера. Это ограничение не жёсткое и продиктовано возможностями аппаратного обеспечения и операционной системы. Greenplum распараллеливает нагрузку и в полной мере утилизирует ресурсы на всех хостах кластера, благодаря чему запросы выполняются быстро. На практике производительность начинает существенно падать при конкурентности в несколько десятков запросов.
  • Greenplum способна хранить и быстро обрабатывать большие объёмы данных.
  • Greenplum поддерживает различные форматы физического хранения данных в таблицах:
    • построчно или поколоночно, со сжатием или без сжатия.
  • В основе Greenplum лежит СУБД PostgreSQL.

Warn

Учитывая эти особенности MPP, Greenplum не нужно выбирать для систем с преимущественной OLTP-нагрузкой — систем, где нагрузка характеризуется большим количеством «быстрых» запросов, возвращающих небольшое количество строк, а также точечным обновлением данных.