iKuai爱快流控路由

标题: 3.5.10 双机热备,数据丢失问题 [打印本页]

作者: xz_xiaoshan    时间: 2021-10-20 12:35
标题: 3.5.10 双机热备,数据丢失问题
3.5.10 双机热备配置完好,正常使用期间,此时虚拟网关 192.168.1.1 指向 10.10.10.1。出现线路问题导致 10.10.10.1 断电关机了,ikuai 自动的将 192.168.1.1 指向了 10.10.10.2。
然后公司的配置管理员(非运维,职能岗)给公司的新同事(多个)分配了虚拟拨号账号(OPENVPN)。
后来线路修好后,10.10.10.1 正常开机,开机成功后。配置管理员登录 192.168.1.1 进行了手工同步操作。
过了一会,ikuai 自动将 192.168.1.1 切换指向了 10.10.10.1。
然后配置管理员依然日常性的在 192.168.1.1 登录管理用户,发现新增的一堆账号丢失了。
猜测是通过 192.168.1.1  进行手工同步这块系统是存在bug的,这对用户的感知非常的不好,应认定为bug,因为体感上是数据丢失了。

严重程度超过那些体验性的优化,希望尽快修复。

注:对于配置管理员来说,他是没有所谓的主备机概念的。
对系统来说,应保持能正常使用(双击热备启动切换就保证了这一点)和 数据的完整性和一致性(ikuai 在这块就出现了bug)。

作者: xz_xiaoshan    时间: 2021-10-20 12:39
某些功能:操作复杂、或者不好用、不方便使用,这种可以定义为优化性的,体验性的。但是像这种“丢失数据”应属于严重问题了,系统可以不易用(但能用),但是不能丢数据啊。
作者: 爱快技术支持09    时间: 2021-10-20 14:11
楼主你好。按您的说法在配置拨号账号的时候应该是在备机上面做的配置,并没有在主机上做。双机热备的同步方向是主到备同步数据。并不会备到主哦
作者: xz_xiaoshan    时间: 2021-10-23 21:29
爱快技术支持09 发表于 2021-10-20 14:11
楼主你好。按您的说法在配置拨号账号的时候应该是在备机上面做的配置,并没有在主机上做。双机热备的同步方 ...

你这个回答是固定思维在 “主同步从” 的定势思维。
这么说吧:双击热备正常运行,因为某些原因,主机断电或者坏掉了无法立刻恢复。此时备机会顺其自然的承担起工作,对于管理路由器业务人员来说(比如开通各种认证账号不属于网络管理员范畴的情况下)。他是不可能知道“主”已经挂了“备”在阶梯工作。对他来说,日常性的管理账号是用户角度,此时他访问和日常一样访问双机热备的虚拟网关管理用户没毛病吧?
等主机恢复上线后,这期间(比如几个小时或者一两天)的所有数据都会丢失。

对于这种情况:我想作为技术角度,可以从两方面下手。
1、要么你就直接将备的配置操作,直接不让用户操作(这显然不是站在用户角度的行为)
2、优化同步算法,其实同步这个算法很简单,只需要记录主机每次同步数据的最后时间,在这个时间之后两台机器产生的数据都取过来,融合一下同步给两个机器。
3、作为一名技术,目前来说,这个功能ikuai在逻辑或处理上,确实还存在较大的提升空间。
作者: xz_xiaoshan    时间: 2021-10-23 21:39
4、其实 “主” 只能向 “备” 同步,也可以换个思维,把这个 “主” 定义为当前的主机,而不是设置为主机的主机。这样当谁是当前的主机的时候,设就可以向 “当前的备机(不是设置为备机的备机)” 同步数据。
作者: zhh2018    时间: 2021-10-27 15:21
xz_xiaoshan 发表于 2021-10-23 21:39
4、其实 “主” 只能向 “备” 同步,也可以换个思维,把这个 “主” 定义为当前的主机,而不是设置为主机 ...

楼主好,该问题已收录,我们评估一下优化方案,感谢反馈
作者: xz_xiaoshan    时间: 2021-10-30 21:21
给一个专业点的建议(方案),可以深入了解或研究一下“MySQL基于binlog的主从数据同步原理”。
不是让你们用MYSQL当然也不可能(嵌入式显然还是sqlite最合适),意思是可以参考它这种原理方案。
这种方案和思路不局限于MYSQL,我也是一个10年+的 IT 技术,期待有机会能与贵司技术人员一对一交流。:lol




欢迎光临 iKuai爱快流控路由 (https://bbs.ikuai8.com/) Powered by Discuz! X3.3