ORC 和 Parquet 文件格式

ORC 和 Parquet 是两种常用的列式存储格式,都支持 schema 定义、索引、压缩等特性,本文分别分析两种文件的格式和实现原理