Список манифестов
Список манифестов – это снимок таблицы Iceberg в определенный момент времени. Для состояния таблицы на заданный момент времени список манифестов содержит перечень всех файлов манифестов, включая местоположение, разделы, к которым они принадлежат, а также верхние и нижние границы столбцов разделов отслеживаемых файлов данных.
Технически это буквально список манифестов.
Это Avro документ. Ниже его JSON представление, что я сделал через https://dataconverter.io/view/avro
{"data":[{
"manifest_path" : "hdfs://10.216.0.1:9000/warehouse/btc-6b49ca37dc684d79aebd6caef9e7f421/metadata/c4035dab-6ca2-4bb4-a3b3-3a82011b4162-m1.avro",
"manifest_length" : 7070,
"partition_spec_id" : 2,
"content" : 0,
"sequence_number" : 3,
"min_sequence_number" : 3,
"added_snapshot_id" : 859055018496945595,
"added_files_count" : 2,
"existing_files_count" : 0,
"deleted_files_count" : 0,
"added_rows_count" : 396289,
"existing_rows_count" : 0,
"deleted_rows_count" : 0,
"partitions" : [ {
"contains_null" : false,
"contains_nan" : false,
"lower_bound" : "NgAAAA==",
"upper_bound" : "NwAAAA=="
} ]
},
{
"manifest_path" : "hdfs://10.216.0.1:9000/warehouse/btc-6b49ca37dc684d79aebd6caef9e7f421/metadata/c4035dab-6ca2-4bb4-a3b3-3a82011b4162-m0.avro",
"manifest_length" : 7828,
"partition_spec_id" : 1,
"content" : 0,
"sequence_number" : 3,
"min_sequence_number" : 3,
"added_snapshot_id" : 859055018496945595,
"added_files_count" : 0,
"existing_files_count" : 0,
"deleted_files_count" : 11,
"added_rows_count" : 0,
"existing_rows_count" : 0,
"deleted_rows_count" : 396289,
"partitions" : [ {
"contains_null" : false,
"contains_nan" : false,
"lower_bound" : "jwIAAA==",
"upper_bound" : "mQIAAA=="
} ]
}]}