iKuai爱快流控路由

标题: 我不知道这是什么问题,我来说现象,技术们来判断吧--总结 [打印本页]

作者: gcx6671    时间: 2014-1-17 22:33
标题: 我不知道这是什么问题,我来说现象,技术们来判断吧--总结
本帖最后由 gcx6671 于 2014-1-18 17:14 编辑

首先,我的问题是从1月16号下午6-7点左右出现,在这之前是正常使用的。当时我正在派出所接受调查。
网管打电话告诉我 收费机不能收费了,出现离线状态,也就是说收费机连接不到外网。随后告诉我收费机也打不开网页了。重启也不能恢复正常。经公安民警同意我先回去处理问题,回头再去协助调查。
检查处理过程:
    用收费机ping内网网关不通,但可以通过Radmin控制其他机器,其他机器能够正常上网,客户端的顾客反映有些卡。初步怀疑内网病毒攻击收费机致使收费机不能联网。
1、重启所有内网机器及无盘服务器、路由器、监控、后 线路恢复正常,但大约在1小时后又出现类似现象。
2、再次出现问题后 怀疑租户使用的电脑中毒 于是将租户的线路全部断开,直接拔网线。再次重启所有机器后恢复正常,约半小时后 再次出现这个现象。
3、由于多数内网的有盘机器不上网只有无盘服务器做游戏更新,于是怀疑收费机本机中毒,重新ghost系统,结果安装完系统后 大约在半小时左右再次重现故障。
4、怀疑收费机网卡损坏,更换网卡,故障依旧
5、由此基本判断内网没有太大问题,怀疑重点指向路由器、由于路由器没有做过任何改动,一时没有任何思路。略作思考后 决定先解除ARP绑定,故障没有排除。
6、当时使用的版本是1226版,随决定升级最新版,升级后 故障依旧
7、此时时间已经过去了接近14个小时,实在没有任何解决思路。后来在群中 技术02 和我远程了一下,用arp-d命令清除arp缓存后,能够恢复上网,但大约2-3分钟后再次断开。怀疑是 内网有arp病毒,判断不是路由器问题。我问了2个问题 1如果是arp病毒,为什么清除以后只能联网2-3分钟,而重启路由却能联网接近1小时。2如果是arp病毒问题,为何只有这一台机器断网,大部分机器都能联网只是有些卡。02没有回答我。。。
8、此时我大脑已经非常的混乱了,实在想不出任何解决办法,随后又在群中和技术05聊了一下。05 先问了我 限速方式(智能)以及arp重新捆绑。故障依然没有解决。05又要求我 将所有的限制都去掉,只做路由使用,我依照05的办法去掉了所有限制,结果在去掉防火墙的时候,收费机离线状态瞬间恢复正常。
9、我将之前的设置 一一恢复设置,当我设置到 防火墙--高级设置里面的 所有连接数限制时  很多然说了一声 怎么这么卡,此时我再刷身份证时 收费软件反映非常慢。不久后 收费有出现离线状态,我将该项去掉后 收费软件迅速恢复正常,由此基本判断故障在此处。
从今天下午2点左右恢复正常后一直到现在已经过去了10个小时,基本可以判断故障点就在此项设置 我设置的数值是 300

通过观察,去掉所有连接数限制后 收费机单纯一个收费软件 连接数达到了 600以上,通过观察,很多连接都是等待状态,真正已连接的仅仅只有4-5个。这说明什么问题呢?
   去掉连接数限制后又出现了 CPU 占用高的问题。  顺便贴几张图。。。

(, 下载次数: 18)
(, 下载次数: 18)

(, 下载次数: 25)

[attach]13867[/attach]

作者: diaoni1616    时间: 2014-1-17 22:52
楼主做了什么坏事 要去接受调查。。。难道去做大保健被抓了。。?
作者: gcx6671    时间: 2014-1-17 23:02
diaoni1616 发表于 2014-1-17 22:52
楼主做了什么坏事 要去接受调查。。。难道去做大保健被抓了。。?

顾客捡到的身份证是网上通缉的。公安要求我去协助调查,
协助公安机关调查询问,是每个公民的义务。。。。。。。
作者: 网络浪子    时间: 2014-1-17 23:40
哈哈。。。在接受调查。。。
免费的东东仅限测试使用。。商用,还是掏点钱吧。
作者: gcx6671    时间: 2014-1-17 23:43
网络浪子 发表于 2014-1-17 23:40
哈哈。。。在接受调查。。。
免费的东东仅限测试使用。。商用,还是掏点钱吧。 ...

掏钱?买什么呀?

海蜘蛛 ?wayos ? 哥们你别逗了。。。。倒贴钱我还得考虑一下,是不是用这俩广告猪
作者: 小C    时间: 2014-1-17 23:44
网络浪子 发表于 2014-1-17 23:40
哈哈。。。在接受调查。。。
免费的东东仅限测试使用。。商用,还是掏点钱吧。 ...

何出此言?我们大部分用户都是商用场合正式使用的。
作者: 网络浪子    时间: 2014-1-17 23:47
小C 发表于 2014-1-17 23:44
何出此言?我们大部分用户都是商用场合正式使用的。

没啥没啥,只是还不太敢相信.....
作者: 小C    时间: 2014-1-17 23:48
网络浪子 发表于 2014-1-17 23:47
没啥没啥,只是还不太敢相信.....

可以关注每次版本上线时的作业。。。
作者: 网络浪子    时间: 2014-1-17 23:50
小C 发表于 2014-1-17 23:48
可以关注每次版本上线时的作业。。。

嗯,俺也刚装了套,先模拟个环境 试试啥样。。。
作者: gcx6671    时间: 2014-1-18 09:36
小C 发表于 2014-1-17 23:44
何出此言?我们大部分用户都是商用场合正式使用的。

不是让你来扯蛋的。。。。。你倒是说说这事怎么回事?

还有  我现在 调整到500 都不行。
作者: GFree_Wind    时间: 2014-1-18 10:11
通过观察,去掉所有连接数限制后 收费机单纯一个收费软件 连接数达到了 600以上,通过观察,很多连接都是等待状态,真正已连接的仅仅只有4-5个

---------------------- 这说明啥呢?说明Linux内核本身统计连接数,并不是已连接的才算连接数。只要占用了连接,即使还未成功,或者TIME_WAIT状态的,就算在连接数本身。—— 这也是很合理的行为。
作者: GFree_Wind    时间: 2014-1-18 10:13
gcx6671 发表于 2014-1-18 09:36
不是让你来扯蛋的。。。。。你倒是说说这事怎么回事?

还有  我现在 调整到500 都不行。 ...

你都说了你那个软件一开就好几百。
把连接数调大就好了。

不是已连接状态的连接同样会被统计在内的呢?不要认为这不科学。

如果只计算已连接的,那么随便写个工具,通过网关连很多不存在的IP,这样的连接数就完全不受控制了
作者: 爱快产品经理    时间: 2014-1-18 10:18
网络浪子 发表于 2014-1-17 23:40
哈哈。。。在接受调查。。。
免费的东东仅限测试使用。。商用,还是掏点钱吧。 ...

何出此言,目前爱快还是很稳定的,小区 网吧 企业都可以稳定商用。
作者: ikuai03    时间: 2014-1-18 10:18
LZ 你好,
   连接数限制是按需求而定,为什么你的收费机需要如此大的连接数,是否在收费 有什么P2P软件 或者 下载东西呢? 连接数限制 只是避免某一台机器产生过多的连接 导致影响整体的网络。
   比如:你给 限制连接数100,当某台机器连接数达到了 100连接数,那么再由新的连接(比如打开网页)的时候,那么就不能访问了。


LZ 你可以查一下为什么 一台收银机 为什么会有如此大的连接,一般 看PPS 电影的时候 也都在 300-400,收费机 600 都不行 这有点说不过去。
作者: gcx6671    时间: 2014-1-18 10:41
本帖最后由 gcx6671 于 2014-1-18 11:01 编辑
ikuai03 发表于 2014-1-18 10:18
LZ 你好,
   连接数限制是按需求而定,为什么你的收费机需要如此大的连接数,是否在收费 有什么P2P软件 或 ...


我也不知道 一个收费软件为什么有这么多的链接,我处理这件事情的过程也说了,收费机操作系统重新做了,网卡也换了, 在路由器中查看客户端链接状态 始终显示连接数 600以上,实际已链接 仅仅4-5个左右,

只有收费机出现打不开网页 ping 不通路由的情况,可以ping通内网其他任何机器。 其他机器能上网只是比较卡,也能正常访问路由器。
我现在 填写任何数字都不行  我刚才填写到1000  仍然出现问题,客户端有人喊卡  收费机打不开网页。

这个问题是 16号下午6-7点左右开始出现的 之前是好的,能正常使用的,为什么突然出现这个情况。
————————————————————————————————————
我将连接数 调整到1000 似乎没有问题,就在调整的时候 客户端卡了一下  收费机 反复刷新了几次也能打开网页了。现在再打开也不需要再刷新了。客户端似乎也没有叫卡的了

作者: gcx6671    时间: 2014-1-18 10:47
本帖最后由 gcx6671 于 2014-1-18 10:50 编辑
GFree_Wind 发表于 2014-1-18 10:13
你都说了你那个软件一开就好几百。
把连接数调大就好了。


我认为从我的帖子中能够反映一下几个问题

1、  爱快官方是否在16号 操作过什么,比如升级协议等  因为在之前是正常的,我使用了多久大家是有目共睹的。
2、在连接状态中只有4-5个连接是已连接状态,其他都是等待状态,是否说明了 路由器在处理无效链接方面有问题,造成大量的无效链接堆积,最终造成超过连接数而断网,因为重启路由后能够在一段时间内正常使用。

3  通过观察 路由器里面的链接状态  发现存在大量的 目标地址显示的是路由器内网地址(即内网网关)  外网地址显示的是 收费机的地址。这样的地址过多造成连接数超出而断网。

作者: ikuai03    时间: 2014-1-18 11:00
LZ 你好,你可以下载 360 卫士,或者 找一个查看连接数的工具,这样可以很清楚的看到 所产生的连接数 是由什么软件造成的。
作者: student    时间: 2014-1-18 11:02
赶快解决楼主问题才是正道!其他都是扯淡,找出问题,解决问题!
作者: GFree_Wind    时间: 2014-1-18 11:13
gcx6671 发表于 2014-1-18 10:47
我认为从我的帖子中能够反映一下几个问题

1、  爱快官方是否在16号 操作过什么,比如升级协议等  因为在 ...

TIME_WAIT是必须存在的。这个是内核负责的。一般都要等一段时间后,才会关闭。

至于连接是有大量内网地址,楼主应该查查,为啥有这么多内网之间的连接。路由总不能有连接请求,不让过吧
作者: gcx6671    时间: 2014-1-18 11:17
爱快产品经理 发表于 2014-1-18 10:18
何出此言,目前爱快还是很稳定的,小区 网吧 企业都可以稳定商用。

事实证明我是正确的。。。。

通过仔细观察 内网流量监视的链接状态 有的机器的链接状态是持续上升的,无效链接 爱快不能及时清除,此时如果勾选了 链接总数 无论设置多少,只要超过链接总数 就会造成客户端断开,打不开网页。
作者: gcx6671    时间: 2014-1-18 11:17
本帖最后由 gcx6671 于 2014-1-18 11:19 编辑
GFree_Wind 发表于 2014-1-18 11:13
TIME_WAIT是必须存在的。这个是内核负责的。一般都要等一段时间后,才会关闭。

至于连接是有大量内网地 ...


事实证明我是正确的。。。。

通过仔细观察 内网流量监视的链接状态 有的机器的链接状态是持续上升的,无效链接 爱快不能及时清除,此时如果勾选了 链接总数 无论设置多少,只要超过链接总数 就会造成客户端断开,打不开网页。

刚才我设置的数值是1000  当时保存的时候 顾客喊了一下卡  随后正常,但运行一段时间后 逐渐出现客户端打不开网页的情况

作者: GFree_Wind    时间: 2014-1-18 11:28
gcx6671 发表于 2014-1-18 11:17
事实证明我是正确的。。。。

通过仔细观察 内网流量监视的链接状态 有的机器的链接状态是持续上升的,无 ...

能抓个图吗?可以看看现在TIME_WAIT有多少个
作者: gcx6671    时间: 2014-1-18 11:36
GFree_Wind 发表于 2014-1-18 11:28
能抓个图吗?可以看看现在TIME_WAIT有多少个

(, 下载次数: 8)
作者: GFree_Wind    时间: 2014-1-18 12:29
从这里看,就是10.0.0.1在不断的连10.0.0.2.


作者: gcx6671    时间: 2014-1-18 13:42
GFree_Wind 发表于 2014-1-18 12:29
从这里看,就是10.0.0.1在不断的连10.0.0.2.

我认为 我反馈的问题不仅仅是这一点。
我一直用的很好,为什么突然在16号出现问题,而且升级以后问题依然存在,在这130即将发布的时候出现这个问题,不由的不让人猜测爱快在后台是不是有控制。 技术02说没有。可是解释不了为什么正常使用状态下突然出现这个问题。
作者: ylemfenga    时间: 2014-1-18 13:50
用抓包软件抓一下包,看一下是哪个IP、哪个软件的连接数造成的
作者: gcx6671    时间: 2014-1-18 13:54
ylemfenga 发表于 2014-1-18 13:50
用抓包软件抓一下包,看一下是哪个IP、哪个软件的连接数造成的

不是客户端造成的  只要不勾选 所有协议链接限制 就可以了。
作者: 秀字营    时间: 2014-1-18 13:56
爱快是没有做任何后台操作的, 这点请楼主放心, 你的图里的未定义网关地址.1和.2之间的连接是内网访问路由器web管理界面的时候产生的连接. 这个是没问题的.
问题解决:勾选丢弃无效连接.  然后总连接数稍微限制大点,如果CPU占用高的话,目前智能建议换个更好点的CPU,然后彻底查查为什么一个收费软件会产生这么多连接.我们这边看看是不是处理无效连接的时间不够及时,有些连接不能说不超时或者等待就直接丢弃的,这个是不行的,双方努力.有问题及时反馈.
作者: 534306413    时间: 2014-1-18 13:57
内部机器全部做死绑
作者: gcx6671    时间: 2014-1-18 14:06
秀字营 发表于 2014-1-18 13:56
爱快是没有做任何后台操作的, 这点请楼主放心, 你的图里的未定义网关地址.1和.2之间的连接是内网访问路由器 ...

丢弃无效链接 本来我就勾选了的,总连接数 本来设置的是200 后来改成 300  再后来就是 500 最后设置成 1000  都不行。

收费软件为什么连接数那么高 我也不清楚,系统是重做的   也用360扫描了。

去掉勾选的 所有协议总连接数 我现在上网是没有问题的,剩下的问题是 CPU 占用太高
作者: gcx6671    时间: 2014-1-18 14:10
534306413 发表于 2014-1-18 13:57
内部机器全部做死绑

对于我的问题。这样做不起任何作用, 你没仔细看帖子
作者: GFree_Wind    时间: 2014-1-18 14:20
gcx6671 发表于 2014-1-18 13:42
我认为 我反馈的问题不仅仅是这一点。
我一直用的很好,为什么突然在16号出现问题,而且升级以后问题依然 ...

这也太阴谋了吧。。。。


发新版本,就让你老版本出问题。。。。哪家公司会这么高。。升版本,又不能赚钱。楼主你太阴暗了。

16号出问题,你自己查查,抓包看看不就知道了
作者: gcx6671    时间: 2014-1-18 14:24
本帖最后由 gcx6671 于 2014-1-18 14:26 编辑
GFree_Wind 发表于 2014-1-18 14:20
这也太阴谋了吧。。。。


我当然希望也相信爱快不会这么做,所以我在1楼帖子中没提这个问题,但目前所有都不能解释 为什么突然出现这个问题,以前用的很好。

现在我只要不勾选 所有协议链接 就一切正常,只是CPU占用高,所以没有再抓包的必要了。

作者: ikuai03    时间: 2014-1-18 14:34
楼主,希望你下载一个360 或者 其他的抓包工具、连接数监视 等工具,可以查看本地连接是由什么软件 发起的。
工具一扫描就能知道什么软件发包。
如果没有的话 找IKUAI人员 可以给你传一个。
作者: ikuai03    时间: 2014-1-18 14:39
连接数限制 是要我们如何做呢 ?
用户自己电脑产生的连接 路由端只是帮你显示而已,并且连接数限制功能 是按你个人需求去设定。
比如你电脑 打开迅雷 PPS 等软件疯狂下载,然而把连接数 限制为200,那么你在打开网站 肯定是开不了,因为连接数超过了你自己的设置值。

连接数限制是你自己设定的,PC机的软件应用也是你装的。
那么请问楼主一句,路由 是超过连接数 不给限制呢? 还是给限制呢 ?

如果不限制 你会说连接数限制无效,如果限制了 你又说IKUAI 限制影响的。
作者: GFree_Wind    时间: 2014-1-18 14:48
gcx6671 发表于 2014-1-18 14:24
我当然希望也相信爱快不会这么做,所以我在1楼帖子中没提这个问题,但目前所有都不能解释 为什么突然出现 ...

网络出问题,不一定是路由的事情。

你的连接数那么高,不是路由再搞,路由不是杀毒软件。
作者: gcx6671    时间: 2014-1-18 15:11
ikuai03 发表于 2014-1-18 14:39
连接数限制 是要我们如何做呢 ?
用户自己电脑产生的连接 路由端只是帮你显示而已,并且连接数限制功能 是 ...

是呀,我也不知道我要对爱快说怎么做,我的主题就是让爱快人员来看怎么解决。
不管怎么说 问题确实存在的,这个是无疑的。
我想说的是2个问题
1、 为什么正常使用的,突然出现这个问题
2、是否能够做到 主动清理死链接,让正常的链接通过,现实的情况是 大量的死链接拥堵造成断网。
作者: gcx6671    时间: 2014-1-18 15:13
GFree_Wind 发表于 2014-1-18 14:48
网络出问题,不一定是路由的事情。

你的连接数那么高,不是路由再搞,路由不是杀毒软件。 ...

我倒是觉得连接数是正常的,不正常的是 死链接没有被清理掉,造成连接数过高。而不是客户端的问题。
作者: 秀字营    时间: 2014-1-18 15:13
gcx6671 发表于 2014-1-18 14:06
丢弃无效链接 本来我就勾选了的,总连接数 本来设置的是200 后来改成 300  再后来就是 500 最后设置成 10 ...

先换个好点的CPU解决眼前的问题吧,至于连接数控制怎么处理的问题,我们会反馈的.,谢谢你的详细反馈,.万分感谢.
作者: ikuai03    时间: 2014-1-18 15:15
本帖最后由 ikuai03 于 2014-1-18 15:19 编辑

连接数无效 10秒后 会被清除。
之前一直没事,那么请问之前 你的收银机器 连接数也是一直这么高吗?

楼主,连接数高 这明显异常 先用工具查查 是什么软件,要不然我们很难帮你解决问题。

作者: gcx6671    时间: 2014-1-18 15:18
ikuai03 发表于 2014-1-18 14:34
楼主,希望你下载一个360 或者 其他的抓包工具、连接数监视 等工具,可以查看本地连接是由什么软件 发起的 ...

我认为问题不在这里,你看我的图  在流量监视中连接数显示的是 680多的链接,但点开后只有十几个链接。你认为这是什么问题呢

(, 下载次数: 3)

作者: gcx6671    时间: 2014-1-18 15:19
秀字营 发表于 2014-1-18 15:13
先换个好点的CPU解决眼前的问题吧,至于连接数控制怎么处理的问题,我们会反馈的.,谢谢你的详细反馈,.万分 ...

CPU暂时够用
作者: gcx6671    时间: 2014-1-18 15:23
ikuai03 发表于 2014-1-18 15:15
连接数无效 10秒后 会被清除。
之前一直没事,那么请问之前 你的收银机器 连接数也是一直这么高吗?

我不认为这是异常的,之前我的收费机连接数是多少我不清楚,因为之前我限制的是 200

但现在我限制 1000 都不行。。。

另外从我上面的图中也能看出 实际的链接是很低的,而在流量监控中是很高的。
作者: ikuai03    时间: 2014-1-18 15:28
本帖最后由 ikuai03 于 2014-1-18 15:33 编辑

请加一下 技术03 QQ  1724978665 。
作者: gcx6671    时间: 2014-1-18 15:40
ikuai03 发表于 2014-1-18 15:28
请加一下 技术03 QQ 。

我已经加了技术02。
首先我想说的是 我的本意没有指责爱快的意思。
就像我的主题说的那样,从专业角度讲我不知道这是哪里的问题,所以我想让爱快技术来看一下。

通过我的观察,在客户度流量监视列表中 显示的连接数 如果超过 “所有协议链接控制”里面的设置,就会造成断网,ping路由不通,网页打不开,路由web页面进不去。
但此时如果 (用其他机器)点开 连接数里面显示的正常链接只有,几条或十几条,明显和状态链接数不符,而且悬殊比较大。

这说明有死链接占用,造成连接数过高而被路由拒绝服务。

还有一个问题是  在之前是正常使用的,你可以翻看我以前的帖子,里面也有我当时的 防火墙的设置。这个问题是突然出现的,让人无法理解。

作者: gcx6671    时间: 2014-1-18 16:24
本帖最后由 gcx6671 于 2014-1-18 16:53 编辑
小C 发表于 2014-1-17 23:44
何出此言?我们大部分用户都是商用场合正式使用的。


我为了解决问题接近24个小时没睡觉,而且打了这么多字,脑袋都流汗了,小C同志竟然只顾左右而言他,不来和我作对,完全漠视我的存在。。。。。。。。

而且还在背后给我使暗器,偷偷把我的帖子下沉,

伤心,愤怒,忧伤,惊讶  最后再鄙视一下





作者: smilingsoul    时间: 2014-2-18 13:13
现在问题解决了吗
作者: hwlxxx    时间: 2014-2-18 13:21
小C 发表于 2014-1-17 23:44
何出此言?我们大部分用户都是商用场合正式使用的。


小C不要理他们,啥都不懂就知道瞎叫唤,他出问题的那几天就是全国电信DNS出问你的时候,。
作者: lingminbao    时间: 2014-2-18 13:51
我觉得可以爱快可以考虑  连接数闲置超时时间  达到设定时间后  自动清除连接
交换机是不是也有问题
作者: gcx6671    时间: 2014-2-18 15:31
smilingsoul 发表于 2014-2-18 13:13
现在问题解决了吗

谢谢兄弟这么久了还关心我的问题,自从升级到130版本后,改善了很多。再没出现过连接数超出的问题,通过下图也能看出,连接数降低了很多,事实说明我反馈的问题不是由内网引起的。
但是 130版的以及后面的P1版本都有一个问题就是 路由器莫名重启。

(, 下载次数: 9)

就在今天,我是9点45分左右升级的,下午13点59分重启了。不知道什么原因。技术06帮我调整了几个选项,不知道能不能解决问题,现在正在使用中。。。。。。。。。。





欢迎光临 iKuai爱快流控路由 (https://bbs.ikuai8.com/) Powered by Discuz! X3.3