這篇文章主要講如何使用正則匹配中文字符,中文正則表達(dá)式的匹配規(guī)則不像其他正則規(guī)則一樣容易記住,下面一起看看這個(gè)中文正則表達(dá)式是怎么樣的。
\w匹配的僅僅是中文,數(shù)字,字母,對于國人來講,僅匹配中文時(shí)常會(huì)用到,見下
匹配中文字符的正則表達(dá)式: [\u4e00-\u9fa5]
或許你也需要匹配雙字節(jié)字符,中文也是雙字節(jié)的字符
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^\x00-\xff]
注:可以用來計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1)
更多常用正則表達(dá)式匹配規(guī)則:
英文字母:[a-zA-Z]
數(shù)字:[0-9]
匹配中文,英文字母和數(shù)字及_:
//code from http://caibaojian.com/zhongwen-regexp.html
^[\u4e00-\u9fa5_a-zA-Z0-9]+$
同時(shí)判斷輸入長度:·
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}
^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$
1、一個(gè)正則表達(dá)式,只含有漢字、數(shù)字、字母、下劃線不能以下劃線開頭和結(jié)尾:
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
其中:
^ 與字符串開始的地方匹配
(?!_) 不能以_開頭
(?!.*?_$) 不能以_結(jié)尾
[a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一個(gè)漢字、數(shù)字、字母、下劃線
$ 與字符串結(jié)束的地方匹配
放在程序里前面加@,否則需要\\進(jìn)行轉(zhuǎn)義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"
(或者:@"^(?!_)\w*(?!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )
2、只含有漢字、數(shù)字、字母、下劃線,下劃線位置不限:
^[a-zA-Z0-9_\u4e00-\u9fa5]+$
3、由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串
^\w+$
4、2~4個(gè)漢字
@"^[\u4E00-\u9FA5]{2,4}$";
5、
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
用:(Abc)+ 來分析: XYZAbcAbcAbcXYZAbcAb
總結(jié)
以上所述是小編給大家介紹的中文正則表達(dá)式匹配問題之正則表達(dá)式中文匹配使用方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
您可能感興趣的文章:- Python使用中文正則表達(dá)式匹配指定中文字符串的方法示例
- Java使用正則表達(dá)式(regex)匹配中文實(shí)例代碼
- Python匹配中文的正則表達(dá)式
- 匹配中文漢字的正則表達(dá)式介紹
- C#匹配中文字符串的4種正則表達(dá)式分享
- php用正則表達(dá)式匹配中文實(shí)例詳解
- 正則表達(dá)式匹配中文與雙字節(jié)的代碼