问题

我想编写一个将CamelCase转换为人类可读名称的方法。

这是测试用例:

public void testSplitCamelCase() {
    assertEquals("lowercase", splitCamelCase("lowercase"));
    assertEquals("Class", splitCamelCase("Class"));
    assertEquals("My Class", splitCamelCase("MyClass"));
    assertEquals("HTML", splitCamelCase("HTML"));
    assertEquals("PDF Loader", splitCamelCase("PDFLoader"));
    assertEquals("A String", splitCamelCase("AString"));
    assertEquals("Simple XML Parser", splitCamelCase("SimpleXMLParser"));
    assertEquals("GL 11 Version", splitCamelCase("GL11Version"));
}

#1 热门回答(300 赞)

这适用于你的测试用例:

static String splitCamelCase(String s) {
   return s.replaceAll(
      String.format("%s|%s|%s",
         "(?<=[A-Z])(?=[A-Z][a-z])",
         "(?<=[^A-Z])(?=[A-Z])",
         "(?<=[A-Za-z])(?=[^A-Za-z])"
      ),
      " "
   );
}

这是一个测试工具:

String[] tests = {
        "lowercase",        // [lowercase]
        "Class",            // [Class]
        "MyClass",          // [My Class]
        "HTML",             // [HTML]
        "PDFLoader",        // [PDF Loader]
        "AString",          // [A String]
        "SimpleXMLParser",  // [Simple XML Parser]
        "GL11Version",      // [GL 11 Version]
        "99Bottles",        // [99 Bottles]
        "May5",             // [May 5]
        "BFG9000",          // [BFG 9000]
    };
    for (String test : tests) {
        System.out.println("[" + splitCamelCase(test) + "]");
    }

它使用零长度匹配正则表达式与lookbehind和lookforward来查找插入空格的位置。基本上有3种模式,我使用String.format将它们组合在一起以使其更具可读性。

这三种模式是:

UC在我身后,UC在我面前跟着LC

XMLParser   AString    PDFLoader
    /\        /\           /\

#UC,非UC在我身后,UC在我面前

MyClass   99Bottles
  /\        /\

###在我身后的信,在我面前的非信

GL11    May5    BFG9000
  /\       /\      /\

###参考文献

  • regular-expressions.info/Lookarounds

###相关问题

使用零长度匹配的外观来分割:

  • 正则表达式拆分字符串但保留分隔符
  • Java分裂正在吃我的角色

#2 热门回答(93 赞)

你可以使用org.apache.commons.lang.StringUtils来做到这一点

StringUtils.join(
     StringUtils.splitByCharacterTypeCamelCase("ExampleTest"),
     ' '
);

#3 热门回答(9 赞)

如果你不喜欢"复杂的"正则表达式,并且完全不关心效率,那么我已经用这个例子在三个阶段达到了同样的效果。

String name = 
    camelName.replaceAll("([A-Z][a-z]+)", " $1") // Words beginning with UC
             .replaceAll("([A-Z][A-Z]+)", " $1") // "Words" of only UC
             .replaceAll("([^A-Za-z ]+)", " $1") // "Words" of non-letters
             .trim();

它通过了上面的所有测试用例,包括带有数字的测试用例。

正如我所说,这不如在其他一些例子中使用一个正则表达式那么好 - 但有人可能会发现它很有用。


原文链接