Tuesday, February 15, 2011

re

python 的 RE 模块非常好用,记得 pattern 描述用 raw string,这主要是避免 \ 被多次转义非常麻烦。

re 有两种用法,一个直接调用 re.func,常用的有 match(从头开始匹配)、search(任意位置开始匹配) 、sub 替换、findall 和 finditer(用于迭代),也可以用 re.compile( r're') 预先编译产生一个 RE 对象,这样做类似的操作会快很多。像 search 的结果一般放在 group 里面,调用 match object 的 group(0) 返回所有。

下面是一个简单的 snippet 用于 incremental 搜索某个 re:
import re
xxx_pat = re.compile( r'"(.*?)"' )
res = xxx_pat.search( my_text )
for s in res:
    print s.group(1)

No comments:

Post a Comment