日期:2014-05-17  浏览次数:20446 次

提取网页源码,遇到编码转换的问题
在提取某繁体网页的源代码时,

在浏览器显示的是【加州萬里 】的繁体中文,

在源代码里却是显示了以下代码

<a href="#" class=table_text>&#21152;&#24030;&#33836;&#37324;</a>

&#21152; = 加
&#24030; = 州
&#33836; = 萬
&#37324; = 里

请问应该怎么根据这些编码转换成繁体或简体呢?

------解决方案--------------------

C# code
string str = "<a href=\"#\" class=table_text>&#21152;&#24030;&#33836;&#37324;</a>";
HttpUtility.HtmlDecode(str)