postgresql: логарифмическая сложность при формировании хэш-индексов
построил в Postgresql для столбца, содержащего отдельные слова хэш-индекс:
CREATE INDEX idx_dbg_hash_topic ON dbg_t USING HASH (topic);
проверил на размном кол-ве строк и оказалась, что имеется логарифмическая зависимость
Учитывая, что у меня рабочая таблица имеет 40М+ записей, то формироваться индекс будет 10 суток.
Почему так происходит, откуда логарифмическая зависимость? И можно ли формировать индекс быстрее?
Сами хэши считаются быстро, откуда такое падение производительности не понятно.
Источник: Stack Overflow на русском