日期:2014-05-17  浏览次数:20814 次

去掉内容中的HTML代码

以下代码会将内容中的全部HTML代码删除:

参数input为所要进行操作的字符串,参数length为字符串的长度,本人调用此类FilterHTML中的方法splitAndFilterString时,一定要事先对字符串进行空判断,否则将会报异常!

public class FilterHTML {
?public static String splitAndFilterString(String input, int length) {
??if (input == null || input.trim().equals("")) {
???return "";
??}
??// 去掉所有html元素,
??String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
????"<[^>]*>", "");
??str = str.replaceAll("[(/>)<]", "");
??int len = str.length();
??if (len <= length) {
???return str;
??} else {
???str = str.substring(0, length);
???str += "......";
??}
??return str;
?}
}