当前位置:首页 > 技术知识 > 正文内容

这可能是行存储和列存储最直白的介绍了

maynowei7个月前 (10-14)技术知识105


行存储 vs 列存储:把数据摆成两排,结果天差地别

想象你走进一家图书馆。

行存储的做法是:把同一本书的每一页按顺序钉在一起,整本书整整齐齐塞进书架。

列存储的做法是:把所有书的第一页抽出来放一起,第二页放一起,第三页放一起……像扑克牌洗牌一样重新码放。

两种摆法听起来只是“顺序”不同,却决定了数据库的“性格”。


行存储:像传统图书馆,找书快,翻页也快

PostgreSQL、MySQL 等日常事务型数据库(OLTP)都选这种摆法。

原因很简单——一条记录的所有字段在磁盘上挨在一起。

当你只想查一台相机的完整信息:

SELECT * FROM camera WHERE model = 'A7R';

数据库只需一次定位,把整条记录的所有字段一次性拖出来,省时省力。

这种场景的特点是:

o 每次只查少量记录(甚至就一条)。

o 但要把这条记录的所有字段都带回去。


列存储:像把书拆了,按页归档,做统计飞快

Google BigQuery、ClickHouse 这类分析型数据库(OLAP)则反其道而行:

把同一列的全部值压成一条长龙,所有列各自成军。

这样做有两个立竿见影的好处:

1. 压缩率更高。

如果“品牌”这一列里 90% 都是 “Sony”,压缩算法能把重复值压到极限。

2. 只扫需要的列。

当你想算个平均价:

SELECT AVG(price) FROM camera;

行存储必须逐行把每条记录的所有字段读出来,再挑出 price;

列存储直接只读 price 那一列,磁盘 I/O 瞬间降到原先的零头。


什么时候混着用,什么时候分家?

o 数据量小时,公司往往“一书多用”:让主库(行存储)既跑交易又跑报表,最多把报表甩给只读副本。

o 数据量大后,报表查询会把主库拖垮。于是大家开始“分工”:

o 交易数据继续待在 PostgreSQL / MySQL;

o 分析报表交给专门的列存储,甚至再加一层数据仓库或 BI 工具。


一句话总结

别把螺丝刀当锤子,也别拿锤子拧螺丝。

选数据库也一样——用对工具,活干得漂亮,人也轻松。

相关文章

机器人需求驱动导航新SOTA,成功率提升15%!浙大&vivo联手打造

CogDDN团队 投稿量子位|公众号QbitAI让机器人像人一样边看边理解,来自浙江大学和vivo人工智能实验室的研究团队带来了新进展。正如视频所展示的,机器人在复杂的室内环境中不仅能自主探索,还具备...

分析 Rust 程序的火焰图(rust火吗)

分析 Rust 程序的火焰图(Flame Graph)是定位性能瓶颈的核心手段,其核心是通过可视化的函数调用栈和时间分布,找到 CPU 耗时、内存分配、锁竞争等热点。以下是详细的分析方法和步骤,结合...

C++ 原子操作与锁的深度解析:为什么原子操作并非万金油?

大噶好,我是henry,今天来和大家浅浅聊一下为啥C++原子操作并非万能钥匙,原因有三,且听我娓娓道来:一、原子操作的线程安全性C++11 的 std::atomic 确实为单个变量的线程安全操作提供...

Linux C++实现多线程同步的四种方式(超级详细)

背景问题:在特定的应用场景下,多线程不进行同步会造成什么问题?通过多线程模拟多窗口售票为例:#include <iostream>#include<pthread.h>#inc...

Oracle又双叕开始严查JDK,连夜提桶跑路

哈佛商业报道了最近几起北美的JDK许可问题公司用了来源不明的JDK,怕蹲里面,连夜提桶跑路The company uses JDK from unknown sources, and is afrai...

本地配置plsql远程连接oracle数据库

由于Oracle的庞大,有时候我们需要在只安装Oracle客户端如plsql、toad等的情况下去连接远程数据库,可是没有安装Oracle就没有一切的配置文件去支持。最后终于发现一个很有效的方法,O...