关于 longhorn 快照的自问自答

2020-10-06

以下内容未经过源码查验. 如有错误, 欢迎指出.

一块1G的磁盘, 要先划定用来存储快照的区域, 这样, 实际最大寻址的就不是1G, 比如说, 只有800MB, 是这样吗?
答: 不是这样的, 而是就没有直接寻址的. 读取都需要查询映射表. 换句话说, 整块磁盘都用来存放快照.

快照是存放在文件系统上, 还是没有块设备上, 划一块区域存快照?
答: 不是存放在文件系统上.

live data是写到实际磁盘位置上(不需要映射), 对吗?
答: 好像不是.

backup 还是跟快照存放在同一块磁盘上吗?
答: 不是的. 快照向上层展示了线性的磁盘, 而其实现是映射表. backup是对快照的整合, 若放在同一个磁盘上, 则会干扰映射关系.

快照自身是需要存储地址的, 否则无法通过快照来构建 backup. backup展示的是线性的空间, 还是需要映射? 或者说, backup是否需要存储块的地址(起始地址)?
答: 文档提到 backup每块是2M, 由此可猜想, backup的组织形式地址是递增的, 但地址可以不连贯, 也就是允许 2M的块之间有断开. 所以, 需要存储块的起始地址. disaster recovery (DR) volume 才是不需要起始地址的, 因为是volume.

disaster recovery (DR) volume 不需要起始地址?
答: 如果是这样的话, 主备两端的逻辑岂不是不能复用了? 可以复用. 初始映射表, 都映射到 DR卷上, 后续写再修改映射表. 也就是映射表的目的地可以是两个不同的卷.

建立一个backup后, 第2个backup是否需要包含第1个backup?
答: 要的. 不过由于 backup是由obj组成的, 每块2MB, 所以, 可以存在共用的obj.

各个backup 之间是否存在交叉/重叠的磁盘地址区间/范围?
答: 参考上一个问题.

问题: live 数据和快照的不同?
答: live 是可读写，快照是只读

写时拷贝 (Copy-On-Write)，COW
写时重定向 (Redirect-On-Write)，ROW
问题: longhorn属于哪个?
答: longhorn是ROW的.
COW的快照卷存放的是原始数据，而 ROW的快照卷存放的是新数据.
ROW的写性能基本没有损耗, 但是其数据会变得非常离散, 所以其连续读写性能不如COW.
在分布式场景下，读取通常不是性能瓶颈, 数据越分散, 性能越高, ROW 的一个场景是用在分布式中.

关于cow方式的快照
答: 更改数据时，会拷贝旧数据到快照卷，源数据会被覆盖, ，快照指针表的地址会更新, 后续的写映射到数据卷. 快照卷是只读的.
优点：原始卷物理块连续.
缺点：降低源数据卷的写性能

本文地址: https://awakening-fong.github.io/posts/distributed_system/longhorn_snapshot_qa

转载请注明出处: https://awakening-fong.github.io

distributed system 3

若无法评论, 请打开JavaScript, 并通过proxy.