" /> " />

亚洲乱码午夜理论不卡公息肉欲_无遮挡一级毛片在线播放_国产AV无码国产永久播放_中出欧美美脚在线观看

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應(yīng)
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

教程精選:正則表達式快速入門<四>

發(fā)布時間:  2012/8/13 13:52:36
 在上一篇文章里,我們介紹了正則表達式中斷言相關(guān)的一些概念,在本文里,我們會介紹正則表達式中遞歸的運用與利用正則表達式修改目標(biāo)字符串。

  正則表達式中的遞歸

  接觸過程序的朋友可能都遇到過成對的各種括號吧,這些括號常常相互嵌套,而且嵌套的層次數(shù)目無法確定。試想一下如果想提取一段程序里用括號括起的一段代碼,這里面很可能包含了層次數(shù)目不定的其它括號對,用正則表達式該如何完成?

  在Perl 5.6之前這的確有點困難,不過從Perl 5.6之后,引入了遞歸正則表達式,這個問題得到了解決。通常在正則表達式里用“(?R)”表示一個對自己的引用,下面讓我們看看用什么正則表達式來解決剛才提出的問題。

/\( ( (?>[^()]+) | (?R) )* \)/x


現(xiàn)在讓我們來分析這個模式的含義,這里使用了“x”模式修正符,以便可以在模式中加入空格以方便閱讀。

  模式的開頭是匹配第一個左圓括號,然后我們需要捕獲的子模式,注意,字模式后面跟了量詞“*”,表示此模式可以重復(fù)0到多次。最后是一個結(jié)束圓括號。現(xiàn)在我們分析子模式( (?>[^()]+) | (?R) )的內(nèi)容。這是一個分支子模式,表示模式可以有兩種情況,第一種是(?>[^()]+),這是一個一次性子模式,代表一個以上的非括號字符,另一種情況是| (?R),也即對正則表達式自己的遞歸調(diào)用——\( ( (?>[^()]+) | (?R) )* \),又尋找一個左圓括號,開始查找一對嵌套的圓括號包含的內(nèi)容。

  分析到這里,這個正則表達式的含義已經(jīng)基本清楚,但你注意到?jīng)]有,這里為什么要使用一次性子模式(?>[^()]+)來查找非括號字符串?

  事實上,由于遞歸的層次是無限的,這種處理非常必要,特別是遇到不匹配的字符串時,它不會讓你陷入長時間的等待?紤]一下下面這個目標(biāo)字符串,

  (aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa()

  在得出不匹配的最終結(jié)果前,如果不使用一次性子模式,解析器將嘗試每一種可能的方法來分割目標(biāo)字符串,這將浪費大量的時間。

  用正則表達式修改目標(biāo)

  并非所有的正則表達式工具都允許你修改目標(biāo)字符串,它們中的一些僅僅使用正則表達式來查找匹配指定模式的字符串,在Linux中,最為廣泛使用的支持正則表達式的工具就是grep命令,這是一個專門用來查找的工具,再就是一些文本編輯器工具,它們有的允許使用正則表達式替換,有的則不允許,這需要查看你使用的工具的在線手冊。

  對于那些允許你使用正則表達式來修改目標(biāo)字符串的工具中,它們之間的一些不同你必然放在心上:

  這些不同首先表現(xiàn)在替換的具體形式上,有的是以對話框的形式分別讓你輸入需要查找的模式和被替換的內(nèi)容,有些則使用命令使界面通過定界符來分隔匹配的模式與需要替換的內(nèi)容,對于一些編程語言工具,它們通常通過函數(shù)的不同參數(shù)來分別定義需要匹配的模式與替換的內(nèi)容。

  另一個需要注意的不同是這些工具具體修改的對象。大多數(shù)基于Linux的命令行工具一般是通過標(biāo)準(zhǔn)輸出或者管道來修改緩存的內(nèi)容而非直接修改磁盤上存儲的文件,而文本編輯器工具或編程語言通常會直接修改目標(biāo)文件。

  我們下面用Linux下sed命令的格式來舉幾個正則表達式的例子:

  模式:s/cat/dog/g

  輸入:wild dogs, bobcats, lions, and other wild cats

  輸出:wild dogs, bobdogs, lions, and other wild dogs

  模式:s/[a-z]+i[a-z]*/nice/g

  輸入:wild dogs, bobcats, lions, and other wild cats

  輸出: nice dogs, bobcats, nice, and other nice cats

  當(dāng)我們使用模式進行替換操作時,目標(biāo)字符串中所有匹配模式的字符串都將被替換。

  下面再舉一個使用逆向引用進行替換的例子:

  模式:s/([A-Z])([0-9]{2,4}) /\2:\1 /g

  輸入: A37 B4 C107 D54112 E1103 XXX

  輸出: 37:A B4 107:C D54112 1103:E XXX

  前面已經(jīng)介紹過默認(rèn)情況下的匹配一般是greedy的,這常會使實際匹配的部分大于你希望匹配的內(nèi)容,特別是在進行替換操作時這將更加危險,因為如果你在錯誤匹配的情況下執(zhí)行了一次替換操作,實際上你是刪除了目標(biāo)中的有效內(nèi)容,特別是當(dāng)這種操作面向文件時造成的危害就更大了。因此,牢記一個不嚴(yán)格的字符類加上一個不嚴(yán)格的量詞足以造成不可挽回的后果,執(zhí)行類似操作前一定要多測試一下不同的目標(biāo)字符串,盡可能避免這種情況的發(fā)生。

  在本教程的下一篇文章里,我們會介紹一款可以方便進行正則表達式學(xué)習(xí)的工具和一些正則表達式編寫的思路。


本文出自:億恩科技【www.ruiliheng.com】

服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1-20183354
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務(wù)器/云主機 24小時售后服務(wù)電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務(wù)電話:0371-60135900
  • 網(wǎng)絡(luò)版權(quán)侵權(quán)舉報電話:0371-60135995
  • 警情提示:注意防范電信網(wǎng)絡(luò)詐騙
  • 專注服務(wù)器托管17年
    掃掃關(guān)注-微信公眾號
    0371-60135900
    Copyright© 1999-2026 ENKJ All Rights Reserved 地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務(wù)所郝建鋒、杜慧月律師  B1-20183354   京公網(wǎng)安備41019702002023號 
      1
     
     
     
     

    0371-60135900
    7*24小時客服服務(wù)熱線