查询字符串参数的Java URL编码

问题

说我有一个URL

http://example.com/query?q=

我有一个用户输入的查询,例如:

随机字500英镑银行$

我希望结果是一个正确编码的URL:

http://example.com/query?q=random%20word%20%A3500%20bank%20%24

实现这一目标的最佳方法是什么?我尝试了URLEncoder并创建了URI / URL对象,但它们都没有完全正确。


#1 热门回答(926 赞)

URLEncoder应该是要走的路。你只需要记住只编码单个查询字符串参数名称和/或值,而不是整个URL,肯定不是查询字符串参数分隔符character&或参数名称 - 值分隔符character=

String q = "random word £500 bank $";
String url = "http://example.com/query?q=" + URLEncoder.encode(q, "UTF-8");

请注意,查询参数中的空格由+表示,而不是%20,这是合法有效的。 %20通常用于表示URI本身的空间(URI查询字符串分隔符之前的部分character?),而不是查询字符串(?之后的部分)。

另请注意,有两种encode()方法。一个没有charset论证,另一个没有。没有charset参数的那个被弃用了。永远不要使用它,并始终指定charset参数。 javadoceven明确建议使用UTF-8编码,如RFC3986W3C所规定。

所有其他字符都是不安全的,首先使用某种编码方案将其转换为一个或多个字节。然后每个字节由3个字符的字符串"%xy"表示,其中xy是字节的两位十六进制表示。建议使用的编码方案是UTF-8。但是,出于兼容性原因,如果未指定编码,则使用平台的默认编码。

也可以看看:

  • 每个Web开发人员必须了解的URL编码

#2 热门回答(130 赞)

我不会用URLEncoder。除了错误的命名(URLEncoder与URL无关),效率低下(它使用aStringBuffer而不是Builder并做其他一些很慢的事情)它也太容易搞砸了。

相反,我会使用URIBuilder或Spring的org.springframework.web.util.UriUtils.encodeQuery或Commons ApacheHttpClient。原因是你必须以不同于参数值的方式转义查询参数名称(即BalusC的answerq)。

上面唯一的缺点(我痛苦地发现)是URL's are not a true subset of URI's

示例代码:

import org.apache.http.client.utils.URIBuilder;

URIBuilder ub = new URIBuilder("http://example.com/query");
ub.addParameter("q", "random word £500 bank \$");
String url = ub.toString();

// Result: http://example.com/query?q=random+word+%C2%A3500+bank+%24

由于我只是链接到其他答案,我将其标记为社区维基。随意编辑。


#3 热门回答(82 赞)

你需要首先创建一个URI,如:

String urlStr = "http://www.example.com/CEREC® Materials & Accessories/IPS Empress® CAD.pdf"
    URL url= new URL(urlStr);
    URI uri = new URI(url.getProtocol(), url.getUserInfo(), url.getHost(), url.getPort(), url.getPath(), url.getQuery(), url.getRef());

然后将该Uri转换为ASCII字符串:

urlStr=uri.toASCIIString();

现在你的url字符串被完全编码,我们首先进行简单的url编码,然后我们将其转换为ASCII字符串,以确保US-ASCII之外的字符不会保留在字符串中。这正是浏览器的作用。