大概是前天或是大前天的時候,郵箱收到封郵件,在綠雲(GreenCloudVPS)家買的一個 VPS 報流量使用超過 80%,由於是東京的 VPS,本身流量就不多,大概幾個月之前主力獨服還出過容器內被鑽漏洞跑進來挖礦的程序,就下意識以為是上面跑的 Caddy 或是 V2Ray 出了漏洞,當下就直接重裝成 Alma 10,改回密鑰登入之後就沒有管了。
昨晚又再收到同樣的郵件,報流量使用超過 95%,這就很耐人尋味了。
一開始發現這台 VPS 有遷移過 Control Panel 的事情,於是懷疑綠雲的越南人技術力低下,把我這過 instance 不知怎麼的連到別人的去了。
況且 Control Panel 裡還有三條奇怪的記錄,我這個懷疑也很合理。

這種 Junior Tech Support 叫我重啟,其實我真的是不太想理他,就自己去查了一下。

先從應用層開始,nethogs 很明顯看到流量接近 100MB/s 的速度一直在傳入,但 iftop -P 卻又看不到有 PID,PID 是個問號。
這就很明顯不在應用層,至於防火牆,由於 Alma 10 (或者説 RHEL 10 也是) 開始改用了 nftables,我還習慣用 firewalld 去管理,除了 docker 自行管理的 chain 外也沒有添加什麼,問題肯定不會出在防火牆這層。
只好拿 tcpdump 去捉流量,明顯看到一堆過路的轉發流量,而內核的 ipv4 forward 也關掉了,根本不是我可控的。到這就很清晰了,大概率是節點上的隔離沒做好,途經的流量都廣播到我這台可憐的 VPS 上。

發現這些事情後,這個人只是啟用了端口隔離……事實上這沒有什麼用,不過稍微提一下。
最後的最後,換了個 Senior 級別的人來,我原本以為會找出真正的問題,結果他只是幫我換到另一個 node 上。
搞笑的是,那 750G 流量至少有 740G 都是他們的技術爛跑出來的,最後只補償我 300G。

問題處理完都已經是週一的 00:30 了,而回頭一看這些使用的指令,以及中間用到的 linux 和網絡基礎知識,我真想不懂垃圾大學到底教了我什麼。逼得我畢業後從頭學這麼多東西。
發佈留言