日期:2014-05-20  浏览次数:20564 次

CrawlScript语言————一门用javascript语法在JAVA环境下,快捷开发网络爬虫的脚本语言
先不多说,直接上代码:
doc=$("http://www.baidu.com");

doc.each("a",function(e){
print(e);
write("log.txt",e.text()+":"+e.attr("href")+"\n");
});

       几行代码,可以完美地提取百度所有的超链接信息,并存储到文件。这就是CrawlScript语言,一门基于JAVA的跨平台的网络爬虫脚本语言,可在JAVA程序中被轻松调用。

CrawlScript语言官方网站:
        http://crawlscript.github.io/

网络爬虫脚本语言 CrawlScript:
       网络爬虫即自动获取网页信息的一种程序,有很多JAVA、C++的网络爬虫类库,但是在这些类库的基础上开发十分繁琐,需要大量的代码才可以完成一个简单的操作。鉴于这个问题,我们开发了CrawlScript这种脚本语言,程序员只需要写2-3行简单的代码,就可以制作一个强大的网络爬虫。同时,CrawlScript由JAVA编写,可以在其他JAVA程序中被简单调用。

CrawlScript是一种具有爬虫功能的javascript:
       CrawlScript是在ECMA标准的基础上设计的语言,是一种javascript,在语法上和网页开发中使用的javascript完全相同,但是并不支持网页开发中所特有的函数和对象,如document、alert()在CrawlScript中会失效。CrawlScript有自己的一套特有的函数和对象,详细请看CrawlScript API。
    
 CrawlScript是跨平台的:
    CrawlScript在任何有JDK环境的电脑上都可以运行,无论是windows、linux还是unix。

 CrawlScript需要配置环境么?:
    CrawlScript是绿色组件,不许要配置环境。只要有JAVA环境可以运行和开发。


 CrawlScript的教程有哪些?:
    1.CrawlScript的官方网站提供的教程:http://crawlscript.github.io/tutorial.html
    2.CSDN博客上连载的教程:http://blog.csdn.net/ajaxhu/article/details/18310265


------解决方案--------------------
nodejs 呢
------解决方案--------------------
怎么有点perl的味道