当前位置:首页 > 技术知识 > 正文内容

这可能是行存储和列存储最直白的介绍了

maynowei5个月前 (10-14)技术知识70


行存储 vs 列存储:把数据摆成两排,结果天差地别

想象你走进一家图书馆。

行存储的做法是:把同一本书的每一页按顺序钉在一起,整本书整整齐齐塞进书架。

列存储的做法是:把所有书的第一页抽出来放一起,第二页放一起,第三页放一起……像扑克牌洗牌一样重新码放。

两种摆法听起来只是“顺序”不同,却决定了数据库的“性格”。


行存储:像传统图书馆,找书快,翻页也快

PostgreSQL、MySQL 等日常事务型数据库(OLTP)都选这种摆法。

原因很简单——一条记录的所有字段在磁盘上挨在一起。

当你只想查一台相机的完整信息:

SELECT * FROM camera WHERE model = 'A7R';

数据库只需一次定位,把整条记录的所有字段一次性拖出来,省时省力。

这种场景的特点是:

o 每次只查少量记录(甚至就一条)。

o 但要把这条记录的所有字段都带回去。


列存储:像把书拆了,按页归档,做统计飞快

Google BigQuery、ClickHouse 这类分析型数据库(OLAP)则反其道而行:

把同一列的全部值压成一条长龙,所有列各自成军。

这样做有两个立竿见影的好处:

1. 压缩率更高。

如果“品牌”这一列里 90% 都是 “Sony”,压缩算法能把重复值压到极限。

2. 只扫需要的列。

当你想算个平均价:

SELECT AVG(price) FROM camera;

行存储必须逐行把每条记录的所有字段读出来,再挑出 price;

列存储直接只读 price 那一列,磁盘 I/O 瞬间降到原先的零头。


什么时候混着用,什么时候分家?

o 数据量小时,公司往往“一书多用”:让主库(行存储)既跑交易又跑报表,最多把报表甩给只读副本。

o 数据量大后,报表查询会把主库拖垮。于是大家开始“分工”:

o 交易数据继续待在 PostgreSQL / MySQL;

o 分析报表交给专门的列存储,甚至再加一层数据仓库或 BI 工具。


一句话总结

别把螺丝刀当锤子,也别拿锤子拧螺丝。

选数据库也一样——用对工具,活干得漂亮,人也轻松。

相关文章

第四章:产品设计(2.3)PRD写作 - 原型设计

2.3、原型设计(界面线框图)当我们逐渐清晰了产品的需求后,并梳理了产品的各个频道及页面,那么这一步就要开始验证这些想法的具体界面表现和方案的可行性了。原型设计是帮助我们更细致的思考,并做各项需求的评...

Objective C interface(objective什么意思)

在Objective C里面,interface基本可以理解为其他语言里面的class。当然也有些不同。首先我们可以新建一个Objective-C的file。这里我们添加一个MyClass.m和一个M...

android培训学习的大纲(安卓app培训)

第一阶段android基础:1.基础javaJava概述,进制,数据类型,常量变量,运算符,表达式关系运算符,逻辑运算符,if语句,switch语句while循环,do...while循环,for循环...

Android主流UI开源库整理(android完整开源项目)

前言最近老大让我整理一份 Android主流UI开源库 的资料,以补充公司的Android知识库。由于对格式不做特别限制,于是打算用博客的形式记录下来,方便查看、防丢并且可以持续维护、不断更新。标题隐...

一文弄懂 GO 的 互斥锁 Mutex !(互斥锁的使用方法)

在 Go 语言并发编程中,互斥锁(Mutex)是一个非常重要的同步原语。本文将深入介绍 Mutex 的使用方法、实现原理以及最佳实践。1. 什么是 Mutex?Mutex(互斥锁)是一种用于多线程编程...

C语言进阶教程:线程同步:互斥锁、条件变量与信号量

在多线程编程中,线程同步是确保数据一致性和程序正确性的关键。当多个线程需要访问共享资源时,如果缺乏适当的同步机制,就可能导致竞态条件(Race Condition)、死锁(Deadlock)等问题。本...