北京信息网
loading
免费发布信息
·北京 [切换]
    信息分类
    • 区域:朝阳 北苑
      • 联系人:张先生
      • 电话:185****6950 点击查看完整号码
        • 114黄页信息网提醒您:本站仅作为便民信息搬运工,请自行分辨信息真假,联系前请仔细阅读《谨防诈骗须知
    • 信息详情
    一、问题的提出
    互联网有很多“数据量较大,并发量较大,业务复杂度较高”的业务场景,其典型系统分层架构如下:
    (1)上游是业务层biz,实现个性化的业务逻辑
    (2)中游是服务层service,封装数据访问
    (3)下游是数据层db,存储固化的业务数据
    服务化分层架构的好处是,服务层屏蔽下游数据层的复杂性,例如缓存、分库分表、存储引擎等存储细节不需要向调用方暴露,而只向上游提供方便的RPC访问接口,当有一些数据层变化的时候,所有的调用方也不需要升级,只需要服务层升级即可。
    互联网架构,很多时候面临着这样一些需求:
    需求1->底层表结构变更:数据量非常大的情况下,数据表增加了一些属性,删除了一些属性,修改了一些属性。
    需求2->分库个数变换:由于数据量的持续增加,底层分库个数非成倍增加。
    需求3->底层存储介质变换:底层存储引擎由一个数据库换为另一个数据库。
    种种需求,都需要进行数据迁移,如何平滑迁移数据,迁移过程不停机,保证系统持续服务,是文本将要讨论的问题。
    二、停机方案
    在讨论平滑迁移数据方案之前,先看下不平滑的停机数据迁移方案,主要分三个步骤。
    步骤一:挂一个类似“为了给广大用户提供更好的服务,服务器会在凌晨0:00-0:400进行停机维护”的公告,并在对应时段进行停机,这个时段系统没有流量进入。
    步骤二:停机后,研发一个离线的数据迁移工具,进行数据迁移。针对第一节的三类需求,会分别开发不同的数据迁移工具。
    (1)底层表结构变更需求:开发旧表导新表的工具
    (2)分库个数变换需求:开发2库导3库的工具
    (3)底层存储介质变换需求:开发Mongo导Mysql工具
    步骤三:恢复服务,并将流量切到新库,不同的需求,可能会涉及不同服务升级。
    (1)底层表结构变更需求:服务要升级到访问新表
    (2)分库个数变换需求:服务不需要升级,只需要改寻库路由配置
    (3)底层存储介质变换需求:服务升级到访问新的存储介质
    总的来说,停机方案是相对直观和简单的,但对服务的可用性有影响,许多游戏公司的服务器升级,游戏分区与合区,可能会采用类似的方案。
    除了影响服务的可用性,这个方案还有一个缺点,就是必须在指定时间完成升级,这个对研发、测试、运维同学来说,压力会非常大,一旦出现问题例如数据不一致,必须在规定时间内解决,否则只能回滚。根据经验,人压力越大越容易出错,这个缺点一定程度上是致命的。
    无论如何,停机方案并不是今天要讨论的重点,接下来看一下常见的平滑数据迁移方案。
    三、平滑迁移-追日志法
    平滑迁移方案一,追日志法,这个方案主要分为五个步骤。
    数据迁移前,上游业务应用通过旧的服务访问旧的数据。
    步骤一:服务进行升级,记录“对旧库上的数据修改”的日志(这里的修改,为数据的insert, delete, update),这个日志不需要记录详细数据,主要记录:
    (1)被修改的库
    (2)被修改的表
    (3)被修改的唯一主键
    具体新增了什么行,修改后的数据格式是什么,不需要详细记录。这样的好处是,不管业务细节如何变化,日志的格式是固定的,这样能保证方案的通用性。
    这个服务升级风险较小:
    (1)写接口是少数接口,改动点较少
    (2)升级只是增加了一些日志,对业务功能没有任何影响
    步骤二:研发一个数据迁移工具,进行数据迁移。这个数据迁移工具和离线迁移工具一样,把旧库中的数据转移到新库中来。
    这个小工具的风险较小:
    (1)整个过程依然是旧库对线上提供服务
    (2)小工具的复杂度较低
    (3)任何时间发现问题,都可以把新库中的数据干掉重来
    (4)可以限速慢慢迁移,技术同学没有时间压力
    数据迁移完成之后,就能够切到新库提供服务了么?
    答案是否定的,在数据迁移的过程中,旧库依然对线上提供着服务,库中的数据随时可能变化,这个变化并没有反映到新库中来,于是旧库和新库的数据并不一致,所以不能直接切库,需要将数据追平。
    哪些数据发生了变化呢?
    步骤一中日志里记录的不就是么?
    步骤三:研发一个读取日志并迁移数据的小工具,要把步骤二迁移数据过程中产生的差异数据追平。这个小工具需要做的是:
    (1)读取日志,得到哪个库、哪个表、哪个主键发生了变化
    (2)把旧库中对应主键的记录读取出来
    (3)把新库中对应主键的记录替换掉
    无论如何,原则是数据以旧库为准。
    这个小工具的风险也很小:
    (1)整个过程依然是旧库对线上提供服务
    (2)小工具的复杂度较低
    (3)任何时间发现问题,大不了从步骤二开始重来
    (4)可以限速慢慢重放日志,技术同学没有时间压力
    日志重放之后,就能够切到新库提供服务了么?
    答案依然是否定的,在日志重放的过程中,旧库中又可能有数据发生了变化,导致数据不一致,所以还是不能切库,需要进一步读取日志,追平记录。可以看到,重放日志追平数据的程序是一个while(1)的程序,新库与旧库中的数据追平也会是一个“无限逼近”的过程。
    什么时候数据会完全一致呢?
    步骤四:在持续重放日志,追平数据的过程中,研发一个数据校验的小工具,将旧库和新库中的数据进行比对,直到数据完全一致。
    这个小工具的风险依旧很小:
    (1)整个过程依然是旧库对线上提供服务
    (2)小工具的复杂度较低
    (3)任何时间发现问题,大不了从步骤二开始重来
    (4)可以限速慢慢比对数据,技术同学没有时间压力
    步骤五:在数据比对完全一致之后,将流量迁移到新库,新库提供服务,完成迁移。
    如果步骤四数据一直是99.9%的一致,不能完全一致,也是正常的,可以做一个秒级的旧库readonly,等日志重放程序完全追上数据后,再进行切库切流量。
    至此,升级完毕,整个过程能够持续对线上提供服务,不影响服务的可用性。
    四、平滑迁移-双写法
    平滑迁移方案二,双写法,这个方案主要分为四个步骤。
    数据迁移前,上游业务应用通过旧的服务访问旧的数据。
    步骤一:服务进行升级,对“对旧库上的数据修改”(这里的修改,为数据的insert, delete, update),在新库上进行相同的修改操作,这就是所谓的“双写”,主要修改操作包括:
    (1)旧库与新库的同时insert
    (2)旧库与新库的同时delete
    (3)旧库与新库的同时update
    由于新库中此时是没有数据的,所以双写旧库与新库中的affect rows可能不一样,不过这完全不影响业务功能,只要不切库,依然是旧库提供业务服务。
    这个服务升级风险较小:
    (1)写接口是少数接口,改动点较少
    (2)新库的写操作执行成功与否,对业务功能没有任何影响
    步骤二:研发一个数据迁移工具,进行数据迁移。这个数据迁移工具在本文中已经出现第三次了,把旧库中的数据转移到新库中来。
    这个小工具的风险较小 联系我时,请说是在114黄页信息网看到的,谢谢!

    【重要提醒】 转发本信息给好友或分享到朋友圈,被转发超过20次,信息将自动置顶一周

    114黄页信息网公众号

    首发网址:https://bj.114biao.com/wangzhan/442800.html
    查看全部北京网站建设信息
    发布一条北京网站建设信息

    • 您可能感兴趣
    • 北京新发布

    本站不良内容举报

    信箱:1420372764@qq.com

    举报电话:13276611120

    江苏互联网有害信息举报信箱

    ju12377@jschina.com.cn

    举报电话:12377

    涉未成年人网络违法和不良信息举报

    信箱:1420372764@qq.com

    举报电话:02566116616

    13276611120