【c#正则】有没有比较简单通用的正则写法提取网页内信息,该如何处理-C#教程-爱易网页

【c#正则】有没有比较简单通用的正则写法提取网页内信息,该如何处理

日期：2014-05-17　浏览次数：21169 次

【c#正则】有没有比较简单通用的正则写法提取网页内信息
比如说网页内有很多很长的字符串待提取，如下
abcdkkkefgnothingstartcontentend

abcd是待提取字符串1左侧固定特征
kkk是待提取字符串1
efg是待提取字符串1右侧固定特征

nothing是一长串无用的数据，无需提取

start是待提取字符串2左侧固定特征
content是待提取字符串2
end是待提取字符串2右侧固定特征

实际过程中字符串可能含有中文符号等各种网页源码中可能包含的东西
现在要提取kkk、content，求针对上述这种的正则写法，越通用越好(匹配不了时执行时间不能过长，我曾经用了好多贪婪结果悲剧了，偶只会用贪婪)

这里只是举例，其实要提取的信息可能有20多个，我曾经自己写了个正则，匹配时毫无问题，但一旦不匹配，就导致匹配的函数执行时间过长，几分钟都没解决，求问有没有相对于这种的正则表达式的写法呢？高手帮一下吧

正则表达式网页源码分析

------解决方案--------------------
設置個timeout, 正則只能是有規律的情況下對應去寫
------解决方案--------------------
(?<=start)((?!end).)*?(?=end)
------解决方案--------------------
正则:(?<=abcd).*(?=efg)
------解决方案--------------------
(?<=start).*(?=end) 能匹配你需要的结果
2楼这个((?!end).)*? 的意思是匹配end后面不为end的字符
你的abcd和efg和start和end是固定的,要其中间的字符就用我上面的正则就可以了

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

【c#正则】有没有比较简单通用的正则写法提取网页内信息,该如何处理

相关资料更多>

推荐阅读更多>