微信支付商户系统架构背后的故事

  Sharded table中的每条记录通过 Hash(row) % #shardmap entry 来决定记录存储到哪个shardid,通过查询shardmap的存储的DN。

  每个DN上存储分配到本节点shardid信息,进而进行可见性的判断。

  通过上面的方案,在扩容新加节点时,就只需要把一些shardmap中的shardid映射到新加的节点,并把对应的数据搬迁过去就可以了。扩容也仅仅需要切换shardmap中映射关系的,时间从几天缩短到几秒。

物联网

图5

  四.数据倾斜解决方案

  数据倾斜是指,在分布式数据库系统中会因为物理节点、hash或shard分布原因,导致某些DN物理空间不足,而另外的物理空间剩余较大。例如,如果以商户作为分布key,京东每天的数据量和一个普通电商的数据量肯定是天地差别。可能某个大商户一个月的数据就会把一个DN的物理空间塞满,这时系统只有停机扩容一条路。因此我们必须要有一个有效的手段来解决数据倾斜,保证在表数据分布不均匀时系统仍然能够高效稳定的运行。

  首先我们把系统的DN分为group(如下图6),每个group里面:

  包含一个或者多个DN

  每个group有一个shardmap

  在建sharded表时,可以指定存储的group,也就是要么存储在group1,要么group2

  CN可以访问所有的group,而且CN上也存储所有表的访问方式信息

物联网

图6

  对于系统中数据量较大用户进行特别的识别,并为他们创建白名单,使用不同的数据分布逻辑(如下图7):普通用户使用默认的数据分布逻辑,也就是:

  Shardid = Hash(merchantid) % #shardmap

  大商户使用定制的数据分布逻辑,也就是:

  Shardid = Hash(merchantid) % #shardmap + fcreate_timedayoffset from 1970-01-01

物联网

图7

  通过在大商户group分布逻辑中加入日期偏移,来实现同一个用户的数据在group内部多个节点间均匀分布。从而有效的解决数据分布不均匀问题。

  下面是一个例子(如下图8):

物联网

图8

  五.9000W记录高效排序解决方案

  业务在列表查询场景下会收到如下的查询SQL:

  在微信支付的场景中,某个商户每天的数据有300W,一个月数据超过9000W条,也就是说PostgreSQL需要面向一个9000W数据级数据进行快速排序,而且业务逻辑要求需要秒级输出,快速获取排序结果。

物联网

  为此,我们提供表定义方案,即建立集群分区表。根据上述需求,可以采用按月分表,即每个月一张表,并对排序字段ffinish_time建立索引,这样每个分区进行扫描是可以使用索引。

物联网

  我们再通过一系列执行计划的优化,CN下推order by和limit offset子句到DN;DN上在执行对应的sql使用使用Merge Append算子对各个子表执行的结果进行汇总输出,这个算子本身会保证输出是有序的,也就是说对子表进行索引扫描,同时Merge Append又对各个子表的结果进行归并,进而保证节点本身的结果是排序的。CN对多个DN的结果同样使用Merge Append进行归并,保证整个输出结果是有序的,从而完成整个排序过程。

物联网

  下面是我们对排序进行的性能测试结果:

物联网
物联网