转自博客堂
先看下面两个Url,他们传递的参数一样么? aaa.aspx?tag=.net%bc%bc%ca%f5 aaa.aspx?tag=.net%e6%8a%80%e6%9c%af
看起来好像是不一样,其实他们都是对".net技术"进行了UrlEncode,不过一个是GB2312的编码,一个是Utf-8的编码。 如下代码就可以获得上面的编码后效果:
string tmp1 = System.Web.HttpUtility.UrlEncode(".net技术", System.Text.Encoding.GetEncoding("GB2312")); string tmp2 = System.Web.HttpUtility.UrlEncode(".net技术", System.Text.Encoding.UTF8);
我们实际的Web页面,可能会被其他程序调用。 比如:简体中文操作系统上的一个ASP页面,需要向一个ASP.net页面传递一个带中文的参数。 默认情况下,简体中文操作系统上, ASP 的 Server.UrlEncode 方法会把中文以GB2312的编码进行编码, 但是默认情况下,ASP.net的页面是采用的UTF-8编码。 这种情况下,你在用 Request.QueryString["Tag"] 接受值的时候会接受不到中文信息,单步调试看到的是乱码。 这时候虽然用Request.QueryString["Tag"] 接受的是乱码,但这时候的Url并不是乱码。
解决方法就是自己分析Url中的参数,然后对参数的值按照 GB2312的编码反解密,而不是用.net 默认的Utf-8的编码反解密。 其实微软类似的提供了相应的函数,我们不必自己用正则表达式去分析url字符串了。
演示代码如下:
string q = Request.Url.Query;
System.Collections.Specialized.NameValueCollection nv = System.Web.HttpUtility.ParseQueryString(q, System.Text.Encoding.GetEncoding("GB2312")); Response.Write(nv["Tag"]);
我们用 Lutz Roeder’s .NET Reflector 来看 System.Web.HttpUtility.ParseQueryString 方法的实现: 一直反查进去,我们可以看到最终处理Url参数字符串分析的代码如下: System.Web.HttpValueCollection 类的如下函数实现了对Url参数的解析 这里我们看到,它是自己一个个字符进行的分析。
internal void FillFromString(string s, bool urlencoded, Encoding encoding) { int num1 = (s != null) ? s.Length : 0; for (int num2 = 0; num2 < num1; num2++) { int num3 = num2; int num4 = -1; while (num2 < num1) { switch (s[num2]) { case ’=’: if (num4 < 0) { num4 = num2; } break; } num2++; } string text1 = null; string text2 = null; if (num4 >= 0) { text1 = s.Substring(num3, num4 - num3); text2 = s.Substring(num4 + 1, (num2 - num4) - 1); } else { text2 = s.Substring(num3, num2 - num3); } if (urlencoded) { base.Add(HttpUtility.UrlDecode(text1, encoding), HttpUtility.UrlDecode(text2, encoding)); } else { base.Add(text1, text2); } if ((num2 == (num1 - 1)) && (s[num2] == ’&’)) { base.Add(null, string.Empty); } } }
至于对方传递给自己的是哪种编码方式,最好也一并作为参数传递过来,这样我们就可以根据用户的这个参数进行解密操作。
[打印] [关闭]
|