Asp.net写采集有关问题-C#教程-爱易网页

Asp.net写采集有关问题

日期：2014-05-18　浏览次数：21432 次

Asp.net写采集问题
Asp.net写采集问题
现在主要写的功能是采集起开始标签到结束标签的思路，这感觉不是很好，不知道还有没有其他的思路方法

------解决方案--------------------
一般都是，先缩小采集的源码范围，之后正则匹配标签。
缩小范围，简单的就是设定开始标签，结束标签
------解决方案--------------------

C# code


    /// <summary>  
    /// 取得网页源码  
    /// </summary>  
    /// <param name="url">网页地址，eg: "http://www.yongfa365.com/" </param>   
    /// <param name="charset">网页编码，eg: Encoding.UTF8</param>  
    /// <returns>返回网页源文件</returns>  
    public static string GetHtmlSource(string url, Encoding charset)  
    {  
        //处理内容  
        string html = "";  
        try  
        {  
            HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);  
            HttpWebResponse response = (HttpWebResponse)request.GetResponse();  
            Stream stream = response.GetResponseStream();  
            StreamReader reader = new StreamReader(stream, charset);  
            html = reader.ReadToEnd();  
            stream.Close();  
        }  
        catch (Exception e)  
        {  
        }  
        return html;  
    }

------解决方案--------------------
貌似也只能这样把。

我现在采集还没用正则，不知道哪个效率高

------解决方案--------------------
有范围就正则取内容，没范围取全部！

------解决方案--------------------
http://jsq2f.p2sp.baidu.com/queryfid?type=str&url=qvod%3a%2f%2f104285780%7cA7E63C9014A6B181F3A775086A470FCBD198DD93%7c%e7%81%ab%e5%bd%b1%e5%bf%8d%e8%80%85472.rmvb%7c

我的这个地址 ，为什么 获取不了 网页源码啊

总是报：服务器提交了协议冲突. Section=ResponseStatusLine

------解决方案--------------------
顶下。实在是 不知道为什么了

------解决方案--------------------
探讨

引用:
C# code

/// <summary>
/// 取得网页源码
/// </summary>
/// <param name="url">网页地址，eg: "http://www.yongfa365.com/" </param>
/// <param name="charset">网页编码，eg: Encoding.UTF8……


……


------解决方案--------------------
Chinajiyong
可以帮我看下我的问题呢，
http://topic.csdn.net/u/20120312/20/8ab2f0b9-9a4a-416b-9f17-ad529d6e0d8c.html?seed=1511642043&r=77870313

那边我自己顶的。都3连了。。。。

------解决方案--------------------
采集的话不是所有网页都会给你采集下来的
要看是否网页有回发的

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

Asp.net写采集有关问题

相关资料更多>

推荐阅读更多>