Слой данных
Файлы данных
«Файлы данных хранят сами данные. Apache Iceberg не зависит от формата этих файлов и в настоящее время поддерживает Apache Parquet, Apache ORC и Apache Avro.» (Ширан и др., 2024, p. 53) (pdf)
Файлы удаления
«Файлы удаления хранят информацию об удаленных записях с данными. Поскольку хранилище озера данных рекомендуется рассматривать как неизменяемое, оно не поддерживает обновление записей прямо в файле.» (Ширан и др., 2024, p. 55) (pdf)
Файлы позиционного удаления
«Файлы позиционного удаления содержат информацию о том, какие записи были логически удалены. Сверяясь с этими файлами, механизм чтения данных удаляет их из своего представления таблицы, определяя точные позиции записей в таблице. Позиция определяется как путь к конкретному файлу, содержащему запись, и номер строки в этом файле.» (Ширан и др., 2024, p. 56) (pdf)
Файлы удаления по равенству
«Файлы удаления по равенству тоже содержат информацию о том, какие записи были логически удалены. Сверяясь с этими файлами, механизм чтения данных удаляет их из своего представления таблицы, сравнивая значения одного или нескольких полей.» (Ширан и др., 2024, p. 56) (pdf)