存档

文章标签 ‘正则’

java 正则表达式pattern类Matcher类

2009年11月11日 没有评论

Pattern类:
例子:

       Pattern pattern = Pattern.compile("[,\\s]+");
        String[] result = pattern.split("one two three,four,five, six");
        for(int i = 0; i

输出结果是:
one
two
three
four
five
six
Pattern类的静态方法compile用来编译正则表达式,在此[,\\s]+表示若干个","或者若干个空格匹配
split方法使用正则匹配将字符串切割成各子串并且返回

Matcher类:
注意,Matcher的获得是通过Pattern.matcher(CharSequence charSequence);输入必须是实现了CharSequence接口的类
常用方法:
matches()判断整个输入串是否匹配,整个匹配则返回true
例如下面会输出true

        String str1 = "hello";
        Pattern pattern1 = Pattern.compile("hello");
        Matcher matcher1 = pattern1.matcher(str1);
        System.out.println(matcher1.matches());

lookingAt()从头开始寻找,找到匹配则返回true
例如下面会输出true

       String str2 = "hello yangfan!";
        Pattern pattern2 = Pattern.compile("hello");
        Matcher matcher2 = pattern2.matcher(str2);
        System.out.println(matcher2.lookingAt());

find()扫描输入串,寻找下一个匹配子串,存在则返回true
例如下面将会将所有no替换成yes

        Pattern pattern = Pattern.compile("no");
        Matcher matcher = pattern.matcher("Does jianyue love yangfan? no;" +
                "Does jianyue love yangfan? no;Does jianyue love yangfan? no;");
        StringBuffer sb = new StringBuffer();
        boolean find = matcher.find();
        while(find){
            matcher.appendReplacement(sb, "yes");
            find = matcher.find();
        }
        matcher.appendTail(sb);
        System.out.println(sb.toString());
分类: Java 标签: , ,

优化Java中的正则表达式

2009年2月6日 1 条评论

如果你花费了数小时和正则表达式做斗争,只是为了让它完成它几秒内就可以完成的匹配,那么这篇文章正是为你量身定做的。Cristian Mocanu指出了在什么地方正则模式匹配会发生延迟,并且解释了为什么。然后,他演示了如何做更多的回缩(backtracking)而不是迷失在其中,如何优化贪婪模式和勉强模式(译者注——这个翻译是在网上查到,总感觉不太合适,原文是reluctant quantifier),以及Possessive quantifiers(译者注——这个有的地方称为抢占量子)、独立分组(independent grouping)和环视(look-around)为什么是你的朋友。

编写正则表达式不仅仅是一种技巧,更是一种艺术 ——Jeffrey Friedl

本文中,我将介绍一些正则表达式中使用默认的java.util.regex包的常见缺点。我将解释为什么回缩(backtracking)既是使用正则表达式进行模式匹配的基础,又是应用程序代码中的常见瓶颈;为什么在使用贪婪模式和勉强模式要学会谨慎,以及它是你正则表达式优化的要素。然后我会介绍优化正则表达的技巧,并讨论通过Java模式匹配引擎运行新的正则表达式时会发生什么。
阅读全文...

分类: 编程 标签: , ,