iKuai爱快流控路由

标题: 爱快系统重启的监测机制是不是太敏感了? [打印本页]

作者: lbh123    时间: 2022-8-5 11:21
标题: 爱快系统重启的监测机制是不是太敏感了?
机型为畅网N5105 第三版,网卡I255 B3。底层系统Winserver2022,hyper-v虚拟爱快多播。爱快3.6.1-3.6.6(7月29日版)系统,nat1,网卡直通或不直通,经多次折腾,总结如下:64位系统,网卡直通情况下均有不定时重启现象,CPU1核心至4核心、内存1G均有测试,网卡不直通未测试。安装32位3.6.6系统,网卡不能直通成功,CPU1核心至2核心、内存1G,有重启现象,CPU4核心、内存1G情况下已4天未重启,比较稳定。但CPU占用比64位直通情况下多占用10%-20%。目前又折腾回64位3.6.6(7月29日版),直通网卡后重启现象依旧。
   发现几个有趣的现象:1、中途把连接光猫的网线从超五类网线换成超六类,大概不到30秒的样子,发现多播竟然未掉线,系统也未重启。
2022-08-05 03:39:24系统启动
2022-08-05 03:38:53线路检测: 接口(eth1)连接.
2022-08-04 23:56:45线路检测: 接口(eth1)连接.
2022-08-04 23:56:43线路检测: 接口(eth1)断开.
2022-08-04 23:56:32线路检测: 接口(eth1)断开.
2022-08-04 23:54:12线路检测: 接口(eth1)连接.
2022-08-04 23:53:47线路检测: 接口(eth1)断开.
2022-08-04 22:39:20线路检测: (adsl1)线路检测成功

2、拨号线路检测设置单独ping 192.168.20.1(网关)情况下,系统判断线路检测失败,但多播任然未掉线。拨号线路检测设置ping+网关正常了,ping任然为192.168.20.1。
   我个人的判断结论:网卡I255 B3直通情况下确实有驱动或其他毛病,但问题不会太大,爱快系统重启的监测机制有设置太敏感问题,估计商用用户多,怕断网吧!根据日志判断,检测wan口(eth1)有连接,日志未检测到eth1断开,就触发系统重启。这个检测wan口(eth1)有连接、就触发系统重启的时间是不是可以放宽到20秒到30秒?实际宽带并没有掉线,但爱快检测到接口(eth1)连接,就立刻触发系统重启?检测到接口(eth1)连接是网卡 断流了几秒?
    坚持了6个小时,刚系统又重启了,日志显示:
2022-08-05 10:37:47系统启动
2022-08-05 10:37:16线路检测: 接口(eth1)连接.
2022-08-05 08:14:55线路检测: (adsl2)线路检测成功
2022-08-05 08:14:25线路检测: (adsl7)线路检测成功

作者: lbh123    时间: 2022-8-5 11:28
本帖最后由 lbh123 于 2022-8-5 11:34 编辑

发个帖子能累死人,非要绑定云啊,这不是交流论坛吗?设置门槛高啊!网卡是I225 ,上面打错了。
作者: 小C    时间: 2022-8-5 11:41
lbh123 发表于 2022-8-5 11:28
发个帖子能累死人,非要绑定云啊,这不是交流论坛吗?设置门槛高啊!网卡是I225 ,上面打错了。 ...

绑定云是为了防止群发帖子,而且有些涉及敏感帖子,也是无奈之举
这个CPU和网卡的稳定性我们目前测试下来确实有些问题,还在优化,也发现其他系统存在同样问题,跟Intel原厂也进行过沟通,结论是有些主板的设计可能存在缺陷
作者: Jack8280    时间: 2022-8-5 11:43
还好,没有上N5105的车。
作者: lbh123    时间: 2022-8-5 11:43
这个检测wan口(eth1)有连接、就触发系统重启的时间是不是可以放宽到20秒到30秒?实际宽带并没有掉线,但爱快检测到接口(eth1)连接,就立刻触发系统重启?
作者: seanikua    时间: 2022-8-5 13:09
如果是在没有检测到断开的情况下又检测到连接后就重启,那要放宽什么时间呢?看你的日志,不就是在30秒后才重启的吗?
作者: seanikua    时间: 2022-8-5 13:19
本帖最后由 seanikua 于 2022-8-5 13:22 编辑

另外说下这个所谓第三版
貌似做了很多改进,但散热铜块和散热铝块分别与CPU和网卡芯片之间的固定间歇太大了,以至于有人发现导热硅胶垫根本就没有接触到网卡芯片,导热硅脂要填很厚才能填充CPU和散热铜块之间的间歇,这样的散热效果能好吗?所以各种死机,重启,掉盘,断线也就不奇怪了。
作坊的工艺太粗糙了。我也有一台这个所谓第三版,让人有想扔垃圾桶的冲动。

作者: lbh123    时间: 2022-8-5 13:45
seanikua 发表于 2022-8-5 13:09
如果是在没有检测到断开的情况下又检测到连接后就重启,那要放宽什么时间呢?看你的日志,不就是在30秒后才 ...

确实是30秒,问题是这时候网络并没有断,系统判断逻辑是必须重启,这30秒中间是不是没有进行路线检测?我的导热硅脂、硅胶垫都重新换过了。问题是换32位爱快不直通情况下它稳定得很,CPU占用大一些,就是不掉线,所以不是散热的问题,机子跑的虚拟机都一样。
作者: lbh123    时间: 2022-8-5 13:55
网上搜了很多这种情况,从3.2.*到3.6.*都有,我估计ikuai的判断逻辑有问题!
作者: lbh123    时间: 2022-8-5 14:05
@爱快技术支持01
不知道看得到吗
作者: 蓝染    时间: 2022-8-5 14:13
小C 发表于 2022-8-5 11:41
绑定云是为了防止群发帖子,而且有些涉及敏感帖子,也是无奈之举
这个CPU和网卡的稳定性我们目前测试下来 ...

我个人测试的结果,我是6个物理口的软路由,如果两个2.5g靠近插入一起,并且网线头屏蔽不好,就会有干扰,会触发多次多次断开重连,然后引起重启
但如果把两个头分别插远一点(隔一个物理网口),已经稳定运行10多天了 ,系统是3.6.6,7.5那个版本
作者: 蓝染    时间: 2022-8-5 14:15
seanikua 发表于 2022-8-5 13:19
另外说下这个所谓第三版
貌似做了很多改进,但散热铜块和散热铝块分别与CPU和网卡芯片之间的固定间歇太大了 ...

我自己测试和散热没关系,cpu温度持续打到80度左右(20分钟-一直告警)也没什么问题,我估计主要是网口互相干扰引起的掉线
作者: 爱快技术支持01    时间: 2022-8-5 14:23
楼主您好,所谓eth1接口断开会触发系统重启这个概念是错误的,没有这个说法。N5105建议BIOS 的 C-state 关闭掉, 虚拟机安装的话的系统类型选择   ”其它Linux 5.x“测试下==========================================================================
如回复您这边还有需要协助可联系爱快技术工程师爱快已开通快速服务码通道,使用服务码可通过多渠道(爱快路由官网、微信小程序爱快微云、手机APP爱快e云,微信公众号爱快智能网络)进行技术咨询可以快速解决您的问题,具体操作步骤请看以下帮助链接
新内核版本测试固件帖:https://bbs.ikuai8.com/thread-129069-1-1.html
文本教程:http://ikuai9.com:555/s/fu36pp
视频教程:http://ikuai9.com:555/s/t0katu


作者: lbh123    时间: 2022-8-5 14:23
蓝染 发表于 2022-8-5 14:15
我自己测试和散热没关系,cpu温度持续打到80度左右(20分钟-一直告警)也没什么问题,我估计主要是网口互 ...

我就插了wan口,其他三个是空着的,我也觉得这个i225可能对网线抗干扰要求高,现在换了山泽的超六类成品网线,基本上可以跑4-6小时不重启,用AC86U送的超五类网线是基本1个小时就重启,正在观察中......
作者: lbh123    时间: 2022-8-5 14:29
爱快技术支持01 发表于 2022-8-5 14:23
楼主您好,所谓eth1接口断开会触发系统重启这个概念是错误的,没有这个说法。N5105建议BIOS 的 C-state 关 ...

BIOS 的 C-state 是关闭掉的,看日志里是eth1接口连接会触发系统重启,不是断开
作者: seanikua    时间: 2022-8-5 17:33
蓝染 发表于 2022-8-5 14:15
我自己测试和散热没关系,cpu温度持续打到80度左右(20分钟-一直告警)也没什么问题,我估计主要是网口互 ...

我在某论坛发了个贴指出这个机器的散热设计缺陷,并附上了各种测试,结果很快就被删除了。。。
作者: ESXI    时间: 2022-8-6 07:46
畅网n5105的散热啊,说白了就是围绕N5105 CPU的散热,畅网已经做到被动散热的极致了,把能给的散热面积都用上了。缺陷肯定是有,就是落差问题,还有材质问题,相比GPU的散热,他的硅胶垫,用的薄了,应该更厚一点,至少是现在的二倍厚。铜块与核心的接触,只能硅脂,上的是有点多,不过为了更大的接触面积,把核心接触完全,其实可行。自己到家可以调整,他出货肯定要安全第一。有点DIY精神,这还是事。。
作者: lbh123    时间: 2022-8-7 12:57
lbh123 发表于 2022-8-5 14:23
我就插了wan口,其他三个是空着的,我也觉得这个i225可能对网线抗干扰要求高,现在换了山泽的超六类成品 ...

坚持了24小时没掉线
作者: 蓝染    时间: 2022-8-8 09:12
seanikua 发表于 2022-8-5 17:33
我在某论坛发了个贴指出这个机器的散热设计缺陷,并附上了各种测试,结果很快就被删除了。。。 ...

我是j4215的机器,主要现象就是稍微动一动网线口,就会触发网口断开重连,大量的断开重连,就会触发重启。有一段时间非常稳定了,我就下载测试,把cpu温度拉高了很长一段时间,也没重启,所以猜测和温度没关系。现在我升级到729的版本了,观察几天看看
作者: 小C    时间: 2022-8-8 09:26
seanikua 发表于 2022-8-5 17:33
我在某论坛发了个贴指出这个机器的散热设计缺陷,并附上了各种测试,结果很快就被删除了。。。 ...

哈哈哈哈,可以在这详细的发个帖,爱快不会删~




欢迎光临 iKuai爱快流控路由 (https://bbs.ikuai8.com/) Powered by Discuz! X3.3