本文實例講述了正則表達式中環(huán)視的簡單應用。分享給大家供大家參考,具體如下:
由于開發(fā)工作需要對文本中內(nèi)容進行過濾,刪除或替換掉一些無用的或不符合要求的信息。于是發(fā)現(xiàn)一個問題,某一類工程性文本中,用到很多英文寫法相同、但含義不同的單位,需要將其分別轉(zhuǎn)為真實含義對應的漢字。比如:"粘度為17s,移動距離為350厘米,要求混凝土必須內(nèi)實外光。振搗時間為30s。",很明顯第一個s是粘度的單位,第二s是時間單位,現(xiàn)在需要將文本中所有表示時間的s替換為“秒”,在朋友指引下,發(fā)現(xiàn)通過正則表達式中的環(huán)視可以方便實現(xiàn)這功能。
正則表達式中的環(huán)視,大家公認的基本原理是依據(jù)位置信息來進行匹配。我認為,還可以把它理解為依據(jù)目標字符的上下文進行匹配。
具體的Java代碼如下
package ccnu; import java.util.regex.Matcher; import java.util.regex.Pattern; import java.util.regex.PatternSyntaxException; public class regex { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub String tempHtmlString="粘度為17s,移動距離為350厘米,要求混凝土必須內(nèi)實外光。振搗時間為30s。"; Pattern p_html; Matcher m_html; String regEx = "([^粘度][u4e00-u9fa5]{1,10}(?=[0-9]))s([^a-z]$)"; p_html = Pattern.compile(regEx); m_html = p_html.matcher(tempHtmlString); String resultString=""; try { resultString = m_html.replaceAll("$1秒"); } catch (PatternSyntaxException ex) { // Syntax error in the regular expression } catch (IllegalArgumentException ex) { // Syntax error in the replacement text (unescaped $ signs?) } catch (IndexOutOfBoundsException ex) { // Non-existent backreference used the replacement text } System.out.println(resultString); } }
結(jié)果:粘度為17s,移動距離為350厘米,要求混凝土必須內(nèi)實外光。振搗時間為30秒。
PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:
JavaScript正則表達式在線測試工具:
http://tools.jb51.net/regex/javascript
正則表達式在線生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述對大家正則表達式學習有所幫助。