【数据仓库】数仓建模理论
数仓建模和分层是根据业务的需要去组织、管理、维护数据,在以往工作中对这块了解较少,现在重新梳理一次
数仓建模和分层是根据业务的需要去组织、管理、维护数据,在以往工作中对这块了解较少,现在重新梳理一次
尝试在个人显卡上部署一个 Qwen-4B 模型
官方文档 介绍了 Paimon 的文件结构,通过文件结构能够更好理解如何实现数据更新等操作
Ray 框架提供 Ray Data 模块用于分布式数据处理、模型批量离线推理、模型训练数据摄入等场景。
经常遇到需要在服务器抓包分析问题的情况,这里记录一下常用的抓包工具。
ORC 和 Parquet 是两种常用的列式存储格式,都支持 schema 定义、索引、压缩等特性,本文分别分析两种文件的格式和实现原理
对比 Go 和 Java 在多线程、内存模型、垃圾回收上各自是如何实现有何异同
总结多种分布式协议的实现原理
Flink Watermark 的产生原理和传递过程
记录一些在使用 Kubernetes 时遇到的问题和概念。