日期:2014-05-20  浏览次数:20640 次

用jsoup去获取网页的所有链接问题。
代码如下:
import java.io.File;  
import java.io.IOException
import org.jsoup.Jsoup;  
import org.jsoup.nodes.Document;  
import org.jsoup.select.Elements; 
import org.jsoup.Connection.*; 
public class Teste{
public static void main(String[] args){
 try {  
            Document doc = Jsoup
           
            .connect("http://news.sina.com.cn/")
             
            .userAgent(  
                        "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15)")
                         
            .timeout(5000)
            .get();  
            String tile=doc.title();
            String text = doc.body().text();
            Elements hrefs = doc.select("a[href]");  
             System.out.println(hrefs);  
                  } catch (IOException e) {  
            e.printStackTrace();  
        }   
        }
        }
通过语句 Elements hrefs = doc.select("a[href]");  可以获取所有链接,但当我怎么做可以一条一条的取出子链接(因为我需要再对每个子链接在进行测试)

------解决方案--------------------
你要写个迭代函数