集群复制
- 数据安全:复制是MySQL多个节点之间实现数据同步的重要机制,主要用于搭建高可用实例主从节点以及提供多个只读从节点提高读扩展能力。节点之间的数据是否最终一致对于高可用方案是否生效,只读实例读取的数据是否正确有着严重影响。从机执行show slave status可以获取从机的复制状态,Slave_IO_Running和Slave_SQL_Running分别表示IO和SQL线程是否正常运行,如果不正常,则应及时处理。参数relay_log_recovery和relay_log_info_repository影响从节点宕机重启后,与主机的复制位置是否正确,如果位置错误,则可能导致数据错误。
- 复制性能:复制延迟经常用来评估复制性能是否满足业务需求。Show slave status的Seconds behind master字段标识了从机落后主机的延迟时间。如果延迟较长,则会影响高可用实例主从切换的时间以及只读从节点是否能够及时读到最新数据。通过使用并行复制技术可以提高从节点的复制性能。MySQL 5.6提供了基于Database级别的并行复制,通过slave_parallel_workers 设置并行线程数;MySQL 5.7提供了基于LOGICAL_CLOCK的并行复制, 主机上同一个Group提交的binlog中包含事务在从机并行执行,相比database,具备更高的并发性,除了设置slave_parallel_workers,还需要将slave-parallel-type设置为LOGICAL_CLOCK。slave_preserve_commit_order=1可以确保从机并行执行的事务按序提交。同时从机的log_bin和log_slave_updates参数必须同时开启。
网易蜂巢智能数据库健康诊断系统
使用网易蜂巢的开发者,可以使用平台提供的智能健康诊断系统对数据库服务中的关系数据库实例进行自动的健康检查。检查内容覆盖6个大类,22个子项,检查结束后根据检查结果,会自动生成健康指数,开发者根据健康指数,可以快速判断系统存在的风险严重程度,同时平台提供了该分数在所有实例的健康检查中的排名。
有风险的项目平台会使用橙色标识,开发者点击风险项目,会看到系统对该风险的详细描述以及相应的修复建议。针对部分检查内容,系统提供了一键自动修复功能。