這一篇筆記我們簡述一下
- MySQL的B+Tree索引到底是咋回事?
- 聚簇索引索引到底是如何長高的。
一點(diǎn)一點(diǎn)看,其實(shí)蠻好理解的。
如果你看過了我之前的筆記,你肯定知道了MySQL進(jìn)行CRUD是在內(nèi)存中進(jìn)行的,也就是在Buffer Pool中。然后你也知道了當(dāng)內(nèi)存中沒有MySQL需要的數(shù)據(jù)時(shí),MySQL會(huì)從Disk中通過IO操作將數(shù)據(jù)讀入內(nèi)存中。讀取的單位呢就是:數(shù)據(jù)頁
一般數(shù)據(jù)頁長下面這樣

沒錯(cuò),數(shù)據(jù)頁中存儲(chǔ)著真實(shí)的數(shù)據(jù),而且數(shù)據(jù)頁在內(nèi)存中是以雙向聯(lián)表的方式組織起來的!如下圖

而在B+Tree的設(shè)定中,它要求主鍵索引時(shí)遞增的,也就是說如果主鍵索引時(shí)遞增的話,那么就要求右側(cè)的數(shù)據(jù)頁中的所有數(shù)據(jù)均比左側(cè)數(shù)據(jù)頁中的數(shù)據(jù)大。但是很明顯上圖并不符合,因此需要通過頁分裂來調(diào)整成下面這樣。

好,現(xiàn)在你回想一下,之前你肯定有聽說過:MySQL的B+Tree聚簇索引,只有葉子節(jié)點(diǎn)才存儲(chǔ)真實(shí)的數(shù)據(jù),而非葉子節(jié)點(diǎn)中存儲(chǔ)的是索引數(shù)據(jù),而且葉子節(jié)點(diǎn)之間是通過雙向鏈表連接起來
沒錯(cuò),那所有的B+Tree的葉子節(jié)點(diǎn)就是上圖中的數(shù)據(jù)頁,并且它們確實(shí)是通過雙向鏈表關(guān)聯(lián)起來的!
我們接著往下看,如果只看上圖由數(shù)據(jù)頁連接起來的雙向鏈表的話,這時(shí)如果我們檢索id=7的數(shù)據(jù)行,那會(huì)發(fā)生什么?
很明顯我們要從頭開始掃描!
那你可能會(huì)問:方才不是說B+Tree要求主鍵是遞增的嘛?并且有頁分裂機(jī)制保證右邊的數(shù)據(jù)頁中的所有數(shù)據(jù)均比它左邊的數(shù)據(jù)頁的索引值大。那進(jìn)行二分查找不行嘛?
答:是的,確實(shí)可以在單個(gè)數(shù)據(jù)頁中進(jìn)行二分查找,但是數(shù)據(jù)頁之間的組織關(guān)系是鏈表呀,所以從頭開始遍歷是避免不了的。
那MySQL怎么辦的呢?
如下圖:MySQL針對(duì)諸多的數(shù)據(jù)頁抽象出了一個(gè)索引目錄

那有了這個(gè)索引目錄我們?cè)僭谥T多的數(shù)據(jù)頁中檢索時(shí)看起來就容易多了!直接就擁有了二分檢索的能力!
而且這個(gè)所以目錄其實(shí)也是存在于數(shù)據(jù)頁中的,不同于葉子節(jié)點(diǎn)的是,它里面知識(shí)存儲(chǔ)了索引信息,而葉子節(jié)點(diǎn)中存儲(chǔ)的是真實(shí)數(shù)據(jù)?
而索引頁的誕生也就意味著B+Tree的雛形已經(jīng)誕生了!
隨著用戶不斷的select,buffer pool中的數(shù)據(jù)頁的越來越多,那么索引頁中的數(shù)據(jù)也會(huì)水漲船高。當(dāng)現(xiàn)有的索引體量超過16KB(一個(gè)數(shù)據(jù)頁的容量)時(shí)就不得不搞一個(gè)新的索引頁來存儲(chǔ)新的索引信息。這時(shí)這顆B+Tree就會(huì)慢慢變得越來越胖。
那你也知道B+Tree是B樹的變種,而B樹其實(shí)可以是2-3樹、2-3-4數(shù)....等等M階樹的泛稱,當(dāng)每個(gè)節(jié)點(diǎn)中能存儲(chǔ)的元素達(dá)到上限后,樹就會(huì)長高(上一篇文章有講過)。
就像下圖這樣:

以上就是一看就懂的MySQL的聚簇索引及聚簇索引是如何長高的的詳細(xì)內(nèi)容,更多關(guān)于MySQL聚簇索引的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
您可能感興趣的文章:- MySQL學(xué)習(xí)教程之聚簇索引
- 詳解MySQL 聚簇索引與非聚簇索引
- mysql聚簇索引的頁分裂原理實(shí)例分析