风凌天下,小说阅读网

人們在使用SQL時往往會陷入一個誤區(qū)，即太關(guān)注于所得的結(jié)果是否正確，而忽略了不同的實現(xiàn)方法之間可能存在的性能差異，這種性能差異在大型的或是復(fù)雜的數(shù)據(jù)庫環(huán)境中（如聯(lián)機事務(wù)處理OLTP或決策支持系統(tǒng)DSS）中表現(xiàn)得尤為明顯。

筆者在工作實踐中發(fā)現(xiàn)，不良的SQL往往來自于不恰當(dāng)?shù)乃饕?/SPAN>設(shè)計、不充份的連接條件和不可優(yōu)化的where子句。

在對它們進(jìn)行適當(dāng)?shù)?/SPAN>優(yōu)化后，其運行速度有了明顯地提高！

下面將從這三個方面分別進(jìn)行總結(jié)：

為了更直觀地說明問題，所有實例中的SQL運行時間均經(jīng)過測試，不超過１秒的均表示為（ 1秒）。----

測試環(huán)境: 主機：HP LH II---- 主頻：330MHZ---- 內(nèi)存：128兆----

操作系統(tǒng)：Operserver5.0.4----

數(shù)據(jù)庫：Sybase11.0.3

一、不合理的索引設(shè)計----

例：表record有620000行，試看在不同的索引下，下面幾個 SQL的運行情況：

---- 1.在date上建有一非個群集索引

select count(*) from record where date >'19991201' and date '19991214'and amount >2000 (25秒)

select date ,sum(amount) from record group by date(55秒)

select count(*) from record where date >'19990901' and place in ('BJ','SH') (27秒)

---- 分析：----

date上有大量的重復(fù)值，在非群集索引下，數(shù)據(jù)在物理上隨機存放在數(shù)據(jù)頁上，在范圍查找時，必須執(zhí)行一次表掃描才能找到這一范圍內(nèi)的全部行。

---- 2.在date上的一個群集索引

select count(*) from record where date >'19991201' and date '19991214' and amount >2000 （14秒）

select date,sum(amount) from record group by date（28秒）

select count(*) from record where date >'19990901' and place in ('BJ','SH')（14秒）

---- 分析：---- 在群集索引下，數(shù)據(jù)在物理上按順序在數(shù)據(jù)頁上，重復(fù)值也排列在一起，因而在范圍查找時，可以先找到這個范圍的起末點，且只在這個范圍內(nèi)掃描數(shù)據(jù)頁，避免了大范圍掃描，提高了查詢速度。

---- 3.在place，date，amount上的組合索引

select count(*) from record where date >'19991201' and date '19991214' and amount >2000 （26秒）

select date,sum(amount) from record group by date（27秒）

select count(*) from record where date >'19990901' and place in ('BJ, 'SH')（ 1秒）

---- 分析：---- 這是一個不很合理的組合索引，因為它的前導(dǎo)列是place，第一和第二條SQL沒有引用place，因此也沒有利用上索引；第三個SQL使用了place，且引用的所有列都包含在組合索引中，形成了索引覆蓋，所以它的速度是非?？斓?。

---- 4.在date，place，amount上的組合索引

select count(*) from record where date >'19991201' and date '19991214' and amount >2000( 1秒)

select date,sum(amount) from record group by date（11秒）

select count(*) from record where date >'19990901' and place in ('BJ','SH')（ 1秒）

---- 分析：---- 這是一個合理的組合索引。它將date作為前導(dǎo)列，使每個SQL都可以利用索引，并且在第一和第三個SQL中形成了索引覆蓋，因而性能達(dá)到了最優(yōu)。

---- 5.總結(jié)：----

缺省情況下建立的索引是非群集索引，但有時它并不是最佳的；合理的索引設(shè)計要建立在對各種查詢的分析和預(yù)測上。

一般來說：

①.有大量重復(fù)值、且經(jīng)常有范圍查詢（between, >, ，>=, =）和order by、group by發(fā)生的列，可考慮建立群集索引；

②.經(jīng)常同時存取多列，且每列都含有重復(fù)值可考慮建立組合索引；

③.組合索引要盡量使關(guān)鍵查詢形成索引覆蓋，其前導(dǎo)列一定是使用最頻繁的列。

二、不充份的連接條件：

例：表card有7896行，在card_no上有一個非聚集索引，表account有191122行，在account_no上有一個非聚集索引，試看在不同的表連接條件下，兩個SQL的執(zhí)行情況：

select sum(a.amount) from account a,card b where a.card_no = b.card_no（20秒）

select sum(a.amount) from account a,card b where a.card_no = b.card_no and a.account_no=b.account_no（ 1秒）

---- 分析：---- 在第一個連接條件下，最佳查詢方案是將account作外層表，card作內(nèi)層表，利用card上的索引，其I/O次數(shù)可由以下公式估算為：

外層表account上的22541頁+（外層表account的191122行*內(nèi)層表card上對應(yīng)外層表第一行所要查找的3頁）=595907次I/O

在第二個連接條件下，最佳查詢方案是將card作外層表，account作內(nèi)層表，利用account上的索引，其I/O次數(shù)可由以下公式估算為：外層表card上的1944頁+（外層表card的7896行*內(nèi)層表account上對應(yīng)外層表每一行所要查找的4頁）= 33528次I/O

可見，只有充份的連接條件，真正的最佳方案才會被執(zhí)行。

總結(jié)：

1.多表操作在被實際執(zhí)行前，查詢優(yōu)化器會根據(jù)連接條件，列出幾組可能的連接方案并從中找出系統(tǒng)開銷最小的最佳方案。連接條件要充份考慮帶有索引的表、行數(shù)多的表；內(nèi)外表的選擇可由公式：外層表中的匹配行數(shù)*內(nèi)層表中每一次查找的次數(shù)確定，乘積最小為最佳方案。

2.查看執(zhí)行方案的方法-- 用set showplanon，打開showplan選項，就可以看到連接順序、使用何種索引的信息；想看更詳細(xì)的信息，需用sa角色執(zhí)行dbcc(3604,310,302)。

三、不可優(yōu)化的where子句

1.例：下列SQL條件語句中的列都建有恰當(dāng)?shù)乃饕?，?/SPAN>執(zhí)行速度卻非常慢：

select * from record wheresubstring(card_no,1,4)='5378'(13秒)

select * from record whereamount/30 1000（11秒）

select * from record whereconvert(char(10),date,112)='19991201'（10秒）

分析：

where子句中對列的任何操作結(jié)果都是在SQL運行時逐列計算得到的，因此它不得不進(jìn)行表搜索，而沒有使用該列上面的索引；

如果這些結(jié)果在查詢編譯時就能得到，那么就可以被SQL優(yōu)化器優(yōu)化，使用索引，避免表搜索，因此將SQL重寫成下面這樣：

select * from record where card_no like'5378%'（ 1秒）

select * from record where amount 1000*30（ 1秒）

select * from record where date= '1999/12/01'（ 1秒）

你會發(fā)現(xiàn)SQL明顯快起來！

2.例：表stuff有200000行，id_no上有非群集索引，請看下面這個SQL：

select count(*) from stuff where id_no in('0','1')（23秒）

分析：---- where條件中的'in'在邏輯上相當(dāng)于'or'，所以語法分析器會將in ('0','1')轉(zhuǎn)化為id_no ='0' or id_no='1'來執(zhí)行。

我們期望它會根據(jù)每個or子句分別查找，再將結(jié)果相加，這樣可以利用id_no上的索引；

但實際上（根據(jù)showplan）,它卻采用了"OR策略"，即先取出滿足每個or子句的行，存入臨時數(shù)據(jù)庫的工作表中，再建立唯一索引以去掉重復(fù)行，最后從這個臨時表中計算結(jié)果。因此，實際過程沒有利用id_no上索引，并且完成時間還要受tempdb數(shù)據(jù)庫性能的影響。

實踐證明，表的行數(shù)越多，工作表的性能就越差，當(dāng)stuff有620000行時，執(zhí)行時間竟達(dá)到220秒！還不如將or子句分開：

select count(*) from stuff where id_no='0'select count(*) from stuff where id_no='1'

得到兩個結(jié)果，再作一次加法合算。因為每句都使用了索引，執(zhí)行時間只有3秒，在620000行下，時間也只有4秒。

或者，用更好的方法，寫一個簡單的存儲過程：

create proc count_stuff asdeclare @a intdeclare @b intdeclare @c intdeclare @d char(10)beginselect @a=count(*) from stuff where id_no='0'select @b=count(*) from stuff where id_no='1'endselect @c=@a+@bselect @d=convert(char(10),@c)print @d

直接算出結(jié)果，執(zhí)行時間同上面一樣快！

---- 總結(jié)：----
可見，所謂優(yōu)化即where子句利用了索引，不可優(yōu)化即發(fā)生了表掃描或額外開銷。

1.任何對列的操作都將導(dǎo)致表掃描，它包括數(shù)據(jù)庫函數(shù)、計算表達(dá)式等等，查詢時要盡可能將操作移至等號右邊。

2.in、or子句常會使用工作表，使索引失效；如果不產(chǎn)生大量重復(fù)值，可以考慮把子句拆開；拆開的子句中應(yīng)該包含索引。

3.要善于使用存儲過程，它使SQL變得更加靈活和高效。

從以上這些例子可以看出，SQL優(yōu)化的實質(zhì)就是在結(jié)果正確的前提下，用優(yōu)化器可以識別的語句，充份利用索引，減少表掃描的I/O次數(shù)，盡量避免表搜索的發(fā)生。其實SQL的性能優(yōu)化是一個復(fù)雜的過程，上述這些只是在應(yīng)用層次的一種體現(xiàn)，深入研究還會涉及數(shù)據(jù)庫層的資源配置、網(wǎng)絡(luò)層的流量控制以及操作系統(tǒng)層的總體設(shè)計。

1、開發(fā)人員如果用到其他庫的Table或View，務(wù)必在當(dāng)前庫中建立View來實現(xiàn)跨庫操作，最好不要直接使用“databse.dbo.table_name”，因為sp_depends不能顯示出該SP所使用的跨庫table或view，不方便校驗。

2、開發(fā)人員在提交SP前，必須已經(jīng)使用set showplan on分析過查詢計劃，做過自身的查詢優(yōu)化檢查。

3、高程序運行效率，優(yōu)化應(yīng)用程序，在SP編寫過程中應(yīng)該注意以下幾點：

a) SQL的使用規(guī)范：

i. 盡量避免大事務(wù)操作，慎用holdlock子句，提高系統(tǒng)并發(fā)能力。

ii. 盡量避免反復(fù)訪問同一張或幾張表，尤其是數(shù)據(jù)量較大的表，可以考慮先根據(jù)條件提取數(shù)據(jù)到臨時表中，然后再做連接。

iii. 盡量避免使用游標(biāo)，因為游標(biāo)的效率較差，如果游標(biāo)操作的數(shù)據(jù)超過1萬行，那么就應(yīng)該改寫；如果使用了游標(biāo)，就要盡量避免在游標(biāo)循環(huán)中再進(jìn)行表連接的操作。

iv. 注意where字句寫法，必須考慮語句順序，應(yīng)該根據(jù)索引順序、范圍大小來確定條件子句的前后順序，盡可能的讓字段順序與索引順序相一致，范圍從大到小。

v. 不要在where子句中的“=”左邊進(jìn)行函數(shù)、算術(shù)運算或其他表達(dá)式運算，否則系統(tǒng)將可能無法正確使用索引。

vi. 盡量使用exists代替select count(1)來判斷是否存在記錄，count函數(shù)只有在統(tǒng)計表中所有行數(shù)時使用，而且count(1)比count(*)更有效率。

vii. 盡量使用“>=”，不要使用“>”。

viii. 注意一些or子句和union子句之間的替換

ix. 注意表之間連接的數(shù)據(jù)類型，避免不同類型數(shù)據(jù)之間的連接。

x. 注意存儲過程中參數(shù)和數(shù)據(jù)類型的關(guān)系。

xi. 注意insert、update操作的數(shù)據(jù)量，防止與其他應(yīng)用沖突。如果數(shù)據(jù)量超過200個數(shù)據(jù)頁面（400k），那么系統(tǒng)將會進(jìn)行鎖升級，頁級鎖會升級成表級鎖。

b) 索引的使用規(guī)范：

i. 索引的創(chuàng)建要與應(yīng)用結(jié)合考慮，建議大的OLTP表不要超過6個索引。

ii. 盡可能的使用索引字段作為查詢條件，尤其是聚簇索引，必要時可以通過index index_name來強制指定索引

iii. 避免對大表查詢時進(jìn)行table scan，必要時考慮新建索引。

iv. 在使用索引字段作為條件時，如果該索引是聯(lián)合索引，那么必須使用到該索引中的第一個字段作為條件時才能保證系統(tǒng)使用該索引，否則該索引將不會被使用。

v. 要注意索引的維護(hù)，周期性重建索引，重新編譯存儲過程。

c) tempdb的使用規(guī)范：

i. 盡量避免使用distinct、order by、group by、having、join、***pute，因為這些語句會加重tempdb的負(fù)擔(dān)。

ii. 避免頻繁創(chuàng)建和刪除臨時表，減少系統(tǒng)表資源的消耗。

iii. 在新建臨時表時，如果一次性插入數(shù)據(jù)量很大，那么可以使用select into代替create table，避免log，提高速度；如果數(shù)據(jù)量不大，為了緩和系統(tǒng)表的資源，建議先create table，然后insert。

iv. 如果臨時表的數(shù)據(jù)量較大，需要建立索引，那么應(yīng)該將創(chuàng)建臨時表和建立索引的過程放在單獨一個子存儲過程中，這樣才能保證系統(tǒng)能夠很好的使用到該臨時表的索引。

v. 如果使用到了臨時表，在存儲過程的最后務(wù)必將所有的臨時表顯式刪除，先truncate table，然后drop table，這樣可以避免系統(tǒng)表的較長時間鎖定。

vi. 慎用大的臨時表與其他大表的連接查詢和修改，減低系統(tǒng)表負(fù)擔(dān)，因為這種操作會在一條語句中多次使用tempdb的系統(tǒng)表。

d) 合理的算法使用：

根據(jù)上面已提到的SQL優(yōu)化技術(shù)和ASE Tuning手冊中的SQL優(yōu)化內(nèi)容,結(jié)合實際應(yīng)用,采用多種算法進(jìn)行比較,以獲得消耗資源最少、效率最高的方法。具體可用ASE調(diào)優(yōu)命令：set statistics io on, set statistics time on , set showplan on 等

您可能感興趣的文章:

大數(shù)據(jù)量時提高分頁的效率
數(shù)據(jù)庫高并發(fā)情況下重復(fù)值寫入的避免字段組合約束
大數(shù)據(jù)量分頁存儲過程效率測試附測試代碼與結(jié)果
大數(shù)據(jù)量，海量數(shù)據(jù)處理方法總結(jié)
MySQL數(shù)據(jù)庫優(yōu)化經(jīng)驗詳談(服務(wù)器普通配置)
MySQL數(shù)據(jù)庫十大優(yōu)化技巧
SQL Server數(shù)據(jù)庫的高性能優(yōu)化經(jīng)驗總結(jié)
sql 存儲過程分頁代碼支持億萬龐大數(shù)據(jù)量
數(shù)據(jù)庫性能優(yōu)化三：程序操作優(yōu)化提升性能
數(shù)據(jù)庫性能優(yōu)化二：數(shù)據(jù)庫表優(yōu)化提升性能
數(shù)據(jù)庫性能優(yōu)化一：數(shù)據(jù)庫自身優(yōu)化提升性能
Oracle 數(shù)據(jù)庫優(yōu)化實戰(zhàn)心得總結(jié)
優(yōu)化mysql數(shù)據(jù)庫的經(jīng)驗總結(jié)
mysql數(shù)據(jù)庫優(yōu)化總結(jié)(心得)
oracle數(shù)據(jù)庫sql的優(yōu)化總結(jié)
sql 百萬級數(shù)據(jù)庫優(yōu)化方案分享
優(yōu)化Mysql數(shù)據(jù)庫的8個方法
mysql數(shù)據(jù)庫sql優(yōu)化原則(經(jīng)驗總結(jié))
針對Sqlserver大數(shù)據(jù)量插入速度慢或丟失數(shù)據(jù)的解決方法
MySQL數(shù)據(jù)庫優(yōu)化詳解
MySQL中實現(xiàn)高性能高并發(fā)計數(shù)器方案（例如文章點擊數(shù)）
超大數(shù)據(jù)量存儲常用數(shù)據(jù)庫分表分庫算法總結(jié)
sqlserver數(shù)據(jù)庫優(yōu)化解析（圖文剖析）
詳解MySQL性能優(yōu)化（一）
詳解MySQL性能優(yōu)化（二）
19個MySQL性能優(yōu)化要點解析
大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化詳解

標(biāo)簽：湘潭預(yù)約服務(wù) 周口營口欽州河源寧夏鄂爾多斯

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《關(guān)于數(shù)據(jù)庫優(yōu)化問題收集匯總》，本文關(guān)鍵詞關(guān)于,數(shù)據(jù)庫,優(yōu)化,問題,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。