前言:
廢話少說(shuō),上線一個(gè)用golang寫的高頻的任務(wù)派發(fā)系統(tǒng),上線跑著很穩(wěn)定,但有個(gè)缺點(diǎn)就是當(dāng)沒有任務(wù)的時(shí)候,cpu的消耗也在幾個(gè)百分點(diǎn)。 平均值在3%左右的cpu使用率。你沒有任務(wù)的時(shí)候,cpu還跑到3%,這個(gè)說(shuō)不過(guò)去呀。通過(guò)查看進(jìn)程pidstat捕獲得知,system系統(tǒng)的cpu消耗也不少。
sys的cpu占用率高一般是由于大量的syscall系統(tǒng)調(diào)用引起的….

下面的截圖是用strace統(tǒng)計(jì)出來(lái)的系統(tǒng)調(diào)用…. 我們發(fā)現(xiàn) futex 和 pselect6 的syscall非常的多…. futex 是鎖的調(diào)用,pselect6可以理解為select的加強(qiáng)版,除了我們不關(guān)心的信號(hào)掩碼外,他是支持納秒級(jí)別的定時(shí)器。
那我們知道,在golang里很多的鎖操作,比如sync.Mutex 已經(jīng)被抽象成 標(biāo)志位及waitQueue,加runtime調(diào)度的模式。這也是所有協(xié)程框架會(huì)做的事情,抽象鎖的操作,避免陷入內(nèi)核上下文切換,使用協(xié)程內(nèi)置的調(diào)度器,golang是通過(guò)runtime來(lái)做使這些Goroutine排隊(duì)的喚醒和拿鎖。 我們用戶層除了cgo之外,是不容易調(diào)用futex syscall….
有人說(shuō)了,channel是有鎖的,對(duì)的,channel的底層數(shù)據(jù)結(jié)構(gòu)是有鎖對(duì)象的,但是他的鎖操作正如我上面說(shuō)的那樣,已經(jīng)被抽象成atomic cas了, 不可能這么多futex的。
下面是火焰圖的表現(xiàn).

那我們先放棄futex的追查,先來(lái)排查下 pselect6為毛這么多? 整個(gè)系統(tǒng)里看起來(lái)會(huì)用到超時(shí)邏輯的只有select了。 為了避免channel讀寫長(zhǎng)時(shí)間阻塞,我們通常都會(huì)加一個(gè)定時(shí)器,比如使用 time.After, time.NewTicker, time.NewTimer ….
測(cè)試定時(shí)器與futex及pselect6的關(guān)系
既然確定是 定時(shí)器的問(wèn)題,那么我們來(lái)做測(cè)試下各種的組合,把協(xié)程數(shù)和定時(shí)器時(shí)間的精度提高來(lái)看。

下面是 300個(gè)協(xié)程,sleep 100ms 的cpu占用比.

下面是 800個(gè)協(xié)程,sleep 100ms的cpu占用比 .

下面是800個(gè)協(xié)程,sleep加長(zhǎng)到1s 之后的cpu表現(xiàn).
通過(guò)測(cè)試來(lái)看,只要把定時(shí)器的時(shí)間精度放到1秒,cpu占用率還是降低了不少…. 所以說(shuō),有用 …
那么回到問(wèn)題,前面說(shuō)的 futex 怎么一回事? 跟定時(shí)器是否有聯(lián)系? 答案是有聯(lián)系的 . 定時(shí)器精度小的時(shí)候,futex鎖操作次數(shù)相對(duì)應(yīng)的變高。 反之,定時(shí)器提升到大幾秒,futex邊的更少了…
那么問(wèn)題又來(lái)了,定時(shí)器為什么會(huì)產(chǎn)生鎖? 定時(shí)器不外乎就那幾個(gè)方法,小頂堆呀,紅黑樹呀…. golang使用堆來(lái)構(gòu)建全局定時(shí)器,既然是堆,那么肯定就要有鎖,開了幾百個(gè)協(xié)程,如果有N個(gè)P,那么幾百個(gè)協(xié)程會(huì)分派在不同的P上。 協(xié)程需要跑在線程上,那么這么多的線程去操作heap堆,自然就會(huì)有更多的鎖沖突,鎖操作了。
先前的cpu占用率高的代碼樣例:
# xiaorui.cc
var ticker = time.NewTicker(100 * time.Millisecond)
defer ticker.Stop()
var counter = 0
for {
select {
case -serverDone:
return
case -ticker.C:
counter += 1
}
}
}
如何解決上面說(shuō)的問(wèn)題?
要么就不要用定時(shí)器
如果非要使用,可以把時(shí)間精度放大,或者 自定義定時(shí)器,比如開發(fā)一個(gè)時(shí)間輪,時(shí)間輪的刻度可以配置成一毫秒,這樣可以收斂很多的定時(shí)任務(wù)。 時(shí)間輪也是各大公司推薦的方案。
可以參考下面時(shí)間輪的實(shí)現(xiàn)…

END
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問(wèn)大家可以留言交流,謝謝大家對(duì)腳本之家的支持。
您可能感興趣的文章:- Golang定時(shí)器的2種實(shí)現(xiàn)方法與區(qū)別
- golang定時(shí)器和超時(shí)的使用詳解
- Golang 定時(shí)器(Timer 和 Ticker),這篇文章就夠了
- Golang中定時(shí)器的陷阱詳解
- 用golang實(shí)現(xiàn)一個(gè)定時(shí)器任務(wù)隊(duì)列實(shí)例
- golang time包下定時(shí)器的實(shí)現(xiàn)方法
- Golang 定時(shí)器的終止與重置實(shí)現(xiàn)