Я работаю над аспектом хранения Hadoop и изучаю, как файлы ORC хранятся в блоке HDFS.

1
SNS 16 Апр 2020 в 09:11

1 ответ

Лучший ответ

В HDFS файл состоит из блоков. Один блок не может содержать несколько файлов.

Для двух файлов ORC, каждый размером 1 МБ, потребуется блок на файл.

Если вас беспокоит фактическое дисковое пространство, которое оно может занять, оно будет составлять всего 2 МБ. Хотя блоки составляют 128 МБ, дисковое хранилище определяется размером фактического файла / блока.

1
franklinsijo 16 Апр 2020 в 07:21