Java Regex捕获组-Java 学习之路

问题

我试图理解这个代码块。在第一个中，我们在表达中寻找什么？

我的理解是它是任何字符(0次或更多次*)后跟0到9之间的任何数字(一次或多次)，后跟任何字符(0次或更多次*)。

执行此操作时，结果为：

Found value: This order was placed for QT3000! OK?
Found value: This order was placed for QT300
Found value: 0

有人可以和我一起讨论吗？

使用捕获组有什么好处？

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexTut3 {

    public static void main(String args[]) {
        String line = "This order was placed for QT3000! OK?"; 
        String pattern = "(.*)(\\d+)(.*)";

        // Create a Pattern object
        Pattern r = Pattern.compile(pattern);

        // Now create matcher object.
        Matcher m = r.matcher(line);

        if (m.find()) {
            System.out.println("Found value: " + m.group(0));
            System.out.println("Found value: " + m.group(1));
            System.out.println("Found value: " + m.group(2));
        } else {
            System.out.println("NO MATCH");
        }
    }

}

#1 热门回答(181 赞)

你遇到的问题是量词的类型。你在你的第一组中使用a贪婪的quantifier(index1-索引0代表整个Pattern)，这意味着它将尽可能多地匹配(并且因为它是字符，它将匹配那么多字符那里是为了满足下一组的条件)。

简而言之，只要下一组\\d+可以匹配某些内容(在这种情况下，最后一位数字)，你的第一组.*就会匹配任何内容。

根据第3组，它将匹配最后一位数后的任何内容。

如果你在第一组中将其更改为a不情愿的quantifier，你将得到我认为你期望的结果，即3000部分。

请注意第一组中的问号。

String line = "This order was placed for QT3000! OK?";
Pattern pattern = Pattern.compile("(.*?)(\\d+)(.*)");
Matcher matcher = pattern.matcher(line);
while (matcher.find()) {
    System.out.println("group 1: " + matcher.group(1));
    System.out.println("group 2: " + matcher.group(2));
    System.out.println("group 3: " + matcher.group(3));
}

输出：

group 1: This order was placed for QT
group 2: 3000
group 3: ! OK?

有关JavaPatternhere的更多信息。

最后，捕获组由圆括号分隔，并且一旦yourPattern与输入匹配，就提供了一种非常有用的方法来使用反向引用(以及其他内容)。

在Java 6中，只能按顺序引用组(谨防嵌套组和排序的细微之处)。

在Java 7中，它更容易，因为你可以使用命名组。

#2 热门回答(12 赞)

这完全没问题。

第一组(m.group(0))始终捕获正则表达式覆盖的整个区域。在这种情况下，它是整个字符串。
默认情况下正则表达式是贪婪的，这意味着第一组在不违反正则表达式的情况下尽可能多地捕获。 (。*)(\ d)(正则表达式的第一部分)涵盖了...... QT300在第一组中，0在第二组中。
你可以通过使第一组非贪婪来快速解决此问题：将(。)更改为(。？)。

有关贪婪与懒惰的更多信息，请查看this site.

#3 热门回答(3 赞)

你的理解是正确的。但是，如果我们走过：

(。*)将吞下整个字符串;
它需要回馈字符以使(\ d)满意(这就是为什么0被捕获，而不是3000);
最后(。*)将捕获其余部分。

但是，我不确定作者的初衷是什么。

原文链接

Java Regex捕获组

问题

#1 热门回答(181 赞)

#2 热门回答(12 赞)

#3 热门回答(3 赞)

相关问题