linux上怎么配置分布式检索-Linux-爱易网页

linux上怎么配置分布式检索

日期：2014-05-16　浏览次数：21168 次

linux下如何配置分布式检索

1、确保这台机子上已经安装了tomcat.
2、把nutch-1.2/nutch-1.2.war拷贝到$TOMCAT_HOME/webapps.
3、进入$TOMCAT_HOME/webapps/WEB-INF/classes.
?? 3.1 配置nutch-site.xml
?????? <property>
?????? ??? ? <name>http.agent.name</name>
??? ? <value>nutch-1.0</value>
??? ? <description>HTTP 'User-Agent' request header.</description>
?????? </property>
?????? <property>
??? ? <name>searcher.dir</name>
??? ? <value>/opt/hadoop/51crawl< alue>
??? ? <description>Path to root of crawl.</description>
?????? </property>
?? 3.2、配置hadoop-site.xml
?????? <property>
????????? <name>fs.default.name</name>
????????? <value>hdfs://192.168.9.170:9080</value>
????????? <description> </description>
?????? </property>
?????? 这个配置很重要，主要是通过RPC链接到HDFS上，路径：hdfs://192.168.9.170:9080/opt/hadoop/51crawl ，然后做检索。
?? 3.3、配置master
?????? 这里面写上你hadoop运行的master即可。
?? 3.4、配置slave
?????? 这里面写上你hadoop运行的slave即可。
4、启动tomcat
总结：在单机上配置和分布式配置唯一的区别是在多了一步hadoop-site.xml。

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

linux登陆其余机器执行命令取回结果

linux 怎么删除某一目录及其子目录上的所有文件或文件夹

linux使DOS及XP下都看不见硬盘了解决办法

探索linux的道路上有点迷失了，希望大家给小弟提点建议，多谢啦

Linux 暂时改变字符用法

linux 上安装apache 有关问题

如何判断和设定当前字符串的字符集

linux下的iconv库是怎么识别原始编码的

为什么联想笔记本使用MeeGo这个“破”系统？该怎么解决

linux上怎么配置分布式检索

相关资料更多>

推荐阅读更多>