当前位置:网站首页>TiKV Follower Read
TiKV Follower Read
2022-07-17 14:46:00 【添香小铺】
当系统中存在读取热点 Region 导致 leader 资源紧张成为整个系统读取瓶颈时,启用 Follower Read 功能可明显降低 leader 的负担,并且通过在多个 follower 之间均衡负载,显著地提升整体系统的吞吐能力。本文主要介绍 Follower Read 的使用方法与实现机制。
概述
Follower Read 功能是指在强一致性读的前提下使用 Region 的 follower 副本来承载数据读取的任务,从而提升 TiDB 集群的吞吐能力并降低 leader 负载。Follower Read 包含一系列将 TiKV 读取负载从 Region 的 leader 副本上 offload 到 follower 副本的负载均衡机制。TiKV 的 Follower Read 可以保证数据读取的一致性,可以为用户提供强一致的数据读取能力。
注意
为了获得强一致读取的能力,在当前的实现中,follower 节点需要向 leader 节点询问当前的执行进度(即 ReadIndex),这会产生一次额外的网络请求开销,因此目前 Follower Read 的主要优势是处理隔离集群的读写请求以及提升整体读取吞吐。
使用方式
要开启 TiDB 的 Follower Read 功能,将变量 tidb_replica_read 的值设置为 follower 或 leader-and-follower 即可:
set [session | global] tidb_replica_read = '<目标值>';
作用域:SESSION | GLOBAL
默认值:leader
该变量用于设置期待的数据读取方式。
- 当设定为默认值
leader或者空字符串时,TiDB 会维持原有行为方式,将所有的读取操作都发送给 leader 副本处理。 - 当设置为
follower时,TiDB 会选择 Region 的 follower 副本完成所有的数据读取操作。 - 当
tidb_replica_read的值设为leader-and-follower时,TiDB 可以选择任意副本来执行读取操作。 - 当设置为
leader-and-follower时,读请求会在 leader 和 follower 之间负载均衡。
实现机制
在 Follower Read 功能出现之前,TiDB 采用 strong leader 策略将所有的读写操作全部提交到 Region 的 leader 节点上完成。虽然 TiKV 能够很均匀地将 Region 分散到多个物理节点上,但是对于每一个 Region 来说,只有 leader 副本能够对外提供服务,另外的 follower 除了时刻同步数据准备着 failover 时投票切换成为 leader 外,没有办法对 TiDB 的请求提供任何帮助。
为了允许在 TiKV 的 follower 节点进行数据读取,同时又不破坏线性一致性和 Snapshot Isolation 的事务隔离,Region 的 follower 节点需要使用 Raft ReadIndex 协议确保当前读请求可以读到当前 leader 上已经 commit 的最新数据。在 TiDB 层面,Follower Read 只需根据负载均衡策略将某个 Region 的读取请求发送到 follower 节点。
Follower 强一致读
TiKV follower 节点处理读取请求时,首先使用 Raft ReadIndex 协议与 Region 当前的 leader 进行一次交互,来获取当前 Raft group 最新的 commit index。本地 apply 到所获取的 leader 最新 commit index 后,便可以开始正常的读取请求处理流程。
Follower 副本选择策略
由于 TiKV 的 Follower Read 不会破坏 TiDB 的 Snapshot Isolation 事务隔离级别,因此 TiDB 选择 follower 的策略可以采用 round robin 的方式。目前,对于 Coprocessor 请求,Follower Read 负载均衡策略粒度是连接级别的,对于一个 TiDB 的客户端连接在某个具体的 Region 上会固定使用同一个 follower,只有在选中的 follower 发生故障或者因调度策略发生调整的情况下才会进行切换。而对于非 Coprocessor 请求(点查等),Follower Read 负载均衡策略粒度是事务级别的,对于一个 TiDB 的事务在某个具体的 Region 上会固定使用同一个 follower,同样在 follower 发生故障或者因调度策略发生调整的情况下才会进行切换。
边栏推荐
- 搭建OpenStack-M版的Cinder所碰到过的状况
- 565. Array nesting: regular simulation questions
- AT5147-[AGC036D]Negative Cycle【dp,模型转换】
- 梦想CMS 前台搜索SQL注入
- Detailed explanation of MySQL show processlist
- From "passive" to "active", how can zeta technology help to upgrade "rfid2.0"?
- Unity Dropdown(可编辑,可输入)下拉选择框,带文本联想
- At5147-[agc036d]negative cycle [DP, model conversion]
- JVM钩子hooks函数
- Loj#2324-「清华集训 2017」小 Y 和二叉树
猜你喜欢

Keras深度学习实战(14)——从零开始实现R-CNN目标检测

Sword finger offer II 041 Average value of sliding window

华为无线设备配置频谱导航

Unity Dropdown(可编辑,可输入)下拉选择框,带文本联想

Leetcode 1328. Destroy palindrome string (yes, solved)

JVM钩子hooks函数

synchronized锁升级

Daily question brushing record (26)

TCP congestion control details | 7 Surpass TCP

Four methods of traversing key value in map
随机推荐
02-3、指针和引用的区别
Leetcode 1304. 和为零的 N 个不同整数
Qt--优秀开源项目
03-1. Inline function, auto keyword, typeID, nullptr
8. Fixed income investment
Learning outline of the column "MySQL DBA's magic road"
Codeforces - 587e (linear basis + segment tree + difference)
PPDE第二季度迎新 | 欢迎22位AI开发者加入飞桨开发者技术专家计划!
夢想CMS 前臺搜索SQL注入
Cv02 Roge matrix, rotation vector, angle
Hot discussion: my husband is 34 years old this year and wants to read a doctoral degree. What should I do in the future to do scientific research?
To build agile teams, these methods are indispensable
常用getshell工具的下载
Introduction to sap appgyver
XSS.haozi.me刷题
A current List of AWESOME Qt and qml
A simple output method of promise object to the result in nodejs (it is recommended to use the asynchronous ultimate scheme async+await)
Cmake common commands (V)
传输层 -------- TCP(一)
The basic establishment of the sequence table and the related operations of adding, deleting, modifying and querying (the sequence table described in C language)