设置默认的Java字符编码?

问题

如何以编程方式正确设置JVM(1.5.x)使用​​的默认字符编码?

我已经读过9223146461用于成为旧JVM的方法......我没有那么奢侈,因为我不会进入。

我努力了:

System.setProperty("file.encoding", "UTF-8");

并且属性已设置,但它似乎不会导致下面的最终getBytes调用使用UTF8:

System.setProperty("file.encoding", "UTF-8");

    byte inbytes[] = new byte[1024];

    FileInputStream fis = new FileInputStream("response.txt");
    fis.read(inbytes);
    FileOutputStream fos = new FileOutputStream("response-2.txt");
    String in = new String(inbytes, "UTF8");
    fos.write(in.getBytes());

#1 热门回答(253 赞)

不幸的是,必须在JVM启动时指定2974749070属性;在输入main方法时,String.getBytes()使用的字符编码和InputStreamReaderOutputStreamWriter的默认构造函数已被永久缓存。

AsEdward Grech points out,在这种特殊情况下,环境变量JAVA_TOOL_OPTIONS可用于指定此属性,但通常如下所示:

java -Dfile.encoding=UTF-8 … com.x.Main

Charset.defaultCharset()将反映对file.encoding属性的更改,但核心Java库中需要确定默认字符编码的大多数代码都不使用此机制。

在编码或解码时,可以查询file.encoding属性或Charset.defaultCharset()以查找当前的默认编码,并使用适当的方法或构造函数重载来指定它。


#2 热门回答(152 赞)

来自JVM™ Tool Interface文件......

由于无法始终访问或修改命令行,例如在嵌入式VM中或仅在脚本内深入启动的VM中,因此提供了JAVA_TOOL_OPTIONS变量,以便在这些情况下可以启动代理。

通过设置(Windows)环境变量JAVA_TOOL_OPTIONSto-Dfile.encoding=UTF8,每次启动JVM时都会自动设置(Java)System属性。你将知道该参数已被选中,因为以下消息将发布到System.err

选择JAVA_TOOL_OPTIONS:-Dfile.encoding = UTF8


#3 热门回答(54 赞)

我有一种绝对有效的hacky方式!

System.setProperty("file.encoding","UTF-8");
Field charset = Charset.class.getDeclaredField("defaultCharset");
charset.setAccessible(true);
charset.set(null,null);

这样你就会欺骗JVM,它会认为charset没有设置,并让它在运行时再次设置为UTF-8!