iKuai爱快流控路由

标题: 爱快物理机频繁死机。带机人数超2000,麻烦官方出来看看 [打印本页]

作者: access99    时间: 2023-12-11 20:03
标题: 爱快物理机频繁死机。带机人数超2000,麻烦官方出来看看
经常死机,然后需要手动重启。麻烦官方看看是什么问题。

作者: access99    时间: 2023-12-11 20:16
死机频率在2天左右一次。有时候一天2次。 9号中午12点多掉一次,晚上23点左右又蹦一次,11号下午16点多又蹦一次。3.7.6 3.7.8 3.6.13 这些版本都跑过,都存在这个问题。现在退回3.7.5 看看 有没有这个问题
作者: 泽履电子    时间: 2023-12-11 20:18
这么高的配置


消息来自爱快e云

作者: 雪夜流星    时间: 2023-12-12 08:55
2000人还不买官方硬件
作者: 爱快技术支持07    时间: 2023-12-12 09:09
楼主您好,死机前的负载大概是多少呢,其次可以更换不同系统版本对比一下。
作者: klxyy    时间: 2023-12-12 10:23
雪夜流星 发表于 2023-12-12 08:552000人还不买官方硬件

官方硬件还没有能拖起2000的吧?
作者: access99    时间: 2023-12-12 11:00
雪夜流星 发表于2023-12-12 08:55:152000人还不买官方硬件
我华为的服务器 40核cpu还不够强吗
这个到底什么原因引起 确定买硬件就能解决吗


消息来自爱快e云

作者: access99    时间: 2023-12-12 11:01
爱快技术支持07 发表于2023-12-12 09:09:39楼主您好,死机前的负载大概是多少呢,其次可以更换不同系统版本对比一下。
负荷不高,cpu才用20 多


消息来自爱快e云

作者: access99    时间: 2023-12-12 11:03
爱快技术支持07 发表于2023-12-12 09:09:39楼主您好,死机前的负载大概是多少呢,其次可以更换不同系统版本对比一下。
我3跟专线负载均衡,100多跟ad做了协议分流,开启了增强分流。 单单3跟专线做负载均衡也会死机


消息来自爱快e云

作者: access99    时间: 2023-12-12 11:03
爱快技术支持07 发表于2023-12-12 09:09:39楼主您好,死机前的负载大概是多少呢,其次可以更换不同系统版本对比一下。
我上传有技术报告,你们可以分析下原因吗


消息来自爱快e云

作者: xibanya    时间: 2023-12-12 11:36
access99 发表于 2023-12-12 11:03我上传有技术报告,你们可以分析下原因吗

关掉ACPI看看?

ACPI Error: AE_ERROR, Returned by Handler for [PCI_Config] (20200925/evregion-293)
[    0.881950] ACPI Error: Aborting method \_SB.PCI0.PDRC._CRS due to previous error (AE_ERROR) (20200925/psparse-529)
[    0.881959] ACPI Error: Method execution failed \_SB.PCI0.PDRC._CRS due to previous error (AE_ERROR) (20200925/uteval-68)
[    0.884271] ACPI Error: AE_ERROR, Returned by Handler for [PCI_Config] (20200925/evregion-293)
[    0.884278] ACPI Error: Aborting method \_SB.PCI1.PDRC._CRS due to previous error (AE_ERROR) (20200925/psparse-529)
[    0.884287] ACPI Error: Method execution failed \_SB.PCI1.PDRC._CRS due to previous error (AE_ERROR) (20200925/uteval-68)
[    0.885158] ACPI Error: AE_ERROR, Returned by Handler for [PCI_Config] (20200925/evregion-293)
[    0.885165] ACPI Error: Aborting method \_SB.PCI2.PDRC._CRS due to previous error (AE_ERROR) (20200925/psparse-529)
[    0.885174] ACPI Error: Method execution failed \_SB.PCI2.PDRC._CRS due to previous error (AE_ERROR) (20200925/uteval-68)
[    0.886056] ACPI Error: AE_ERROR, Returned by Handler for [PCI_Config] (20200925/evregion-293)
[    0.886063] ACPI Error: Aborting method \_SB.PCI3.PDRC._CRS due to previous error (AE_ERROR) (20200925/psparse-529)
[    0.886071] ACPI Error: Method execution failed \_SB.PCI3.PDRC._CRS due to previous error (AE_ERROR) (20200925/uteval-68)
作者: QQ278438669    时间: 2023-12-12 12:24
就是并发连接数一大就死机,回滚3.7.5 会好一点
作者: QQ278438669    时间: 2023-12-12 12:26
瞬间并发连接数大,CPU 会干到100%过来人了。
作者: xianqgu    时间: 2023-12-12 13:01
ros解忧愁

作者: 雪夜流星    时间: 2023-12-12 13:13
klxyy 发表于 2023-12-12 10:23官方硬件还没有能拖起2000的吧?

官方硬件待机25000人的都有
作者: access99    时间: 2023-12-12 18:29
爱快技术支持07 发表于 2023-12-12 09:09楼主您好,死机前的负载大概是多少呢,其次可以更换不同系统版本对比一下。 ...

找到问题了吗?

作者: sbtqvn    时间: 2023-12-12 23:06
个人建议,最好抓包分析下,连接数那么高,终端机中毒的可能性是有的,还有排除多DHCP跟网络风暴引起的!
作者: access99    时间: 2023-12-13 09:35
QQ278438669 发表于 2023-12-12 12:24就是并发连接数一大就死机,回滚3.7.5 会好一点

已经回滚,今天凌晨没人上网又死了一次。
作者: 307970262    时间: 2023-12-15 09:02
access99 发表于 2023-12-13 09:35已经回滚,今天凌晨没人上网又死了一次。

70v2的华为2288hv2我也刷过爱快,跑十万的连接数都没有出现死机
感觉应该是你的设备出了问题,或者你用3.6.13试试,我当时系统是3.6.13,现在没在用了,宽带都死了
作者: 阳光守望者    时间: 2023-12-15 19:17
硬件兼容问题


消息来自爱快e云

作者: access99    时间: 2023-12-18 11:50
307970262 发表于 2023-12-15 09:0270v2的华为2288hv2我也刷过爱快,跑十万的连接数都没有出现死机
感觉应该是你的设备出了问题,或者你用 ...

3.6.13也会死机 现在3.7.5  这边稍微稳定点  3天左右死一次
作者: access99    时间: 2023-12-18 11:52
307970262 发表于 2023-12-15 09:0270v2的华为2288hv2我也刷过爱快,跑十万的连接数都没有出现死机
感觉应该是你的设备出了问题,或者你用 ...

我带机人数多哈,2000多人在线,然后还有182条ADSL宽带
作者: 307970262    时间: 2023-12-19 08:23
access99 发表于 2023-12-18 11:52我带机人数多哈,2000多人在线,然后还有182条ADSL宽带

你换个x99试试吧,x79感觉真的太老了
作者: QQ654183440    时间: 2023-12-19 10:44
个人建议排查一下内存条,遇到过其中一条ecc内存出问题引起死机的,建议插一条测试
作者: access99    时间: 2023-12-19 15:42
307970262 发表于 2023-12-19 08:23你换个x99试试吧,x79感觉真的太老了

在ESXI环境下又没事,ESXI会损耗转发性能
作者: access99    时间: 2023-12-19 15:44
QQ654183440 发表于 2023-12-19 10:44个人建议排查一下内存条,遇到过其中一条ecc内存出问题引起死机的,建议插一条测试 ...

跟内存没有关系的,我们拿另一台测试过了。现在基本断定不是兼容问题就是爱快本身免费版故意留的BUG
作者: MsTalent    时间: 2023-12-19 17:14
跟我的情况类似,我的也是不定时死机,硬件更换了三四台服务器,软件版本也试了几个,死机之前CPU占用被拉满,至今找不到原因和解决方案
作者: cxcjcy    时间: 2023-12-19 17:41
access99 发表于 2023-12-19 15:42在ESXI环境下又没事,ESXI会损耗转发性能

ESXI开启网卡硬件直通和sriov
作者: Spencer    时间: 2023-12-19 18:35
bios关超线程,超线程对于软路由不合适,数据会在cpu排队


消息来自爱快e云

作者: access99    时间: 2023-12-20 11:12
MsTalent 发表于 2023-12-19 17:14跟我的情况类似,我的也是不定时死机,硬件更换了三四台服务器,软件版本也试了几个,死机之前CPU占用被拉 ...

你的硬件是什么配置,是物理机环境安装吗?
作者: xibanya    时间: 2023-12-20 11:20
本帖最后由 xibanya 于 2023-12-20 11:22 编辑
access99 发表于 2023-12-19 15:42在ESXI环境下又没事,ESXI会损耗转发性能

esxi无故障那结果很显而易见了  

路由系统本身和你硬件兼容有些问题。

不用纠结了换机器
我之前也有帮别人在Tinkserver上也安装过ik,用的还是直通卡     经常无故死机    换了几台都无解。换了个组装机上去就好了。。。

作者: access99    时间: 2023-12-20 11:26
MsTalent 发表于 2023-12-19 17:14跟我的情况类似,我的也是不定时死机,硬件更换了三四台服务器,软件版本也试了几个,死机之前CPU占用被拉 ...

我有一台在ESXI环境部署的用来提供服务的,Docker里面中毒被人当肉机,短时间新建大量的连接数,导致爱快CPU占用拉满。现在这台是物理机,也看了,不存在被攻击。莫名就直接死机了。
作者: cxcjcy    时间: 2023-12-20 11:35
access99 发表于 2023-12-20 11:26我有一台在ESXI环境部署的用来提供服务的,Docker里面中毒被人当肉机,短时间新建大量的连接数,导致爱快 ...

用专线,最好在爱快前加个防火墙。
作者: 307970262    时间: 2023-12-21 08:57
access99 发表于 2023-12-19 15:42在ESXI环境下又没事,ESXI会损耗转发性能

那就是硬件有兼容问题无疑了
作者: MsTalent    时间: 2023-12-26 17:52
access99 发表于 2023-12-20 11:12你的硬件是什么配置,是物理机环境安装吗?

我都是物理机安装的,配置E5 2680 V4双路,32G DDR4, 网卡1块双口40G+4块82599ES
作者: MsTalent    时间: 2023-12-26 17:55
access99 发表于 2023-12-20 11:26我有一台在ESXI环境部署的用来提供服务的,Docker里面中毒被人当肉机,短时间新建大量的连接数,导致爱快 ...

我的已经可以判定不是硬件问题了,原来的线路移走几条就没再出现死机了,推测可能是被DDOS攻击了,爱快的诊断日志真是太垃圾了,完全没有参考价值
作者: access99    时间: 2024-1-9 22:53
MsTalent 发表于2023-12-26 17:52:53

我都是物理机安装的,配置E5 2680 V4双路,32G DDR4, 网卡1块双口40G+4块82599ES
你的是物理机安装吗?不定时死机的问题解决了吗


消息来自爱快e云

作者: wangyong    时间: 2024-1-9 23:57
xianqgu 发表于2023-12-12 13:01:10ros解忧愁


太难了都是英文



消息来自爱快e云

作者: access99    时间: 2024-3-20 00:37
MsTalent 发表于2023-12-26 17:55:07

我的已经可以判定不是硬件问题了,原来的线路移走几条就没再出现死机了,推测可能是被DDOS攻击了,爱快的诊断日志真是太垃圾了,完全没有参考价值
你的崩溃问题解决了吗


消息来自爱快e云

作者: access99    时间: 2024-3-20 00:39
307970262 发表于2023-12-19 08:23:30

你换个x99试试吧,x79感觉真的太老了
现在x99也会死


消息来自爱快e云

作者: access99    时间: 2024-3-20 00:40
QQ278438669 发表于2023-12-12 12:26:08瞬间并发连接数大,CPU 会干到100%过来人了。
怎么解决的


消息来自爱快e云

作者: iyg429    时间: 2024-3-21 10:58
雪夜流星 发表于 2023-12-12 08:552000人还不买官方硬件

官方那个硬件是可以支持  300 人的 ? 我有这个需求
作者: 雪夜流星    时间: 2024-3-21 21:13
iyg429 发表于 2024-3-21 10:58官方那个硬件是可以支持  300 人的 ? 我有这个需求

MSG200  都可以
作者: ojj90    时间: 2024-4-19 10:00
我这边改为单核就不死机了
作者: ckzyc007    时间: 2024-4-23 19:00
问题原因找到了吗 ?解决了吗 ?
作者: shadiaowangyou    时间: 2024-4-24 01:54
ojj90 发表于2024-04-19 10:00:46我这边改为单核就不死机了


单核带不动呀



消息来自爱快e云

作者: 网络浪子    时间: 2024-4-25 15:28
挺大胆               




欢迎光临 iKuai爱快流控路由 (https://bbs.ikuai8.com/) Powered by Discuz! X3.3