【Paimon】文件结构
官方文档 介绍了 Paimon 的文件结构,通过文件结构能够更好理解如何实现数据更新等操作
官方文档 介绍了 Paimon 的文件结构,通过文件结构能够更好理解如何实现数据更新等操作
Ray 框架提供 Ray Data 模块用于分布式数据处理、模型批量离线推理、模型训练数据摄入等场景。
总结多种分布式协议的实现原理
Flink Watermark 的产生原理和传递过程
记录一些在使用 Kubernetes 时遇到的问题和概念。
Paimon 以数据表是否有主键,将表分为 Append Only Table 和 Primary Key Table,对数据的操作前者只支持 Insert,后者还支持 Update 和 Delete,本文主要分析 Paimon 主键表的结构和实现原理
Paimon (1.0)对 Bucket Unaware 的 Append Only Table 支持写入时排序以提升查询效率,同时对分 Bucket 的 Append Only Table和 Dynamic Bucket 的 Primary Key Table ,提供了异步的 Sort Compact 支持。
新的 Flink Sink API 取代了旧的 SinkFunction API,以提供更灵活的功能
Ray 是一个开源的分布式计算框架,当前主要被应用于机器学习领域。
利用 kubeadm 搭建高可用 Kubernetes 集群的流程记录