日期:2014-05-20  浏览次数:20649 次

商品搜索比价中的分类及搜索显示价格区间的问题
1.爬虫抓过来的商品数据,怎么进行归类,类别太多,这么多类别需要人工整理,工作量特别大,有什么好的办法么?
2.搜索显示的价格区间,比如: 0-160元(340) 160-190元(394) 190-230元(354) 230-290元(353) 290-440元(310) 440元以上(93) 对应不类别的商品,价格区间不一样,怎么样实现分的区间的商品数量相差不大呢? 多谢大牛们指点!检索是用的solr实现
 


------解决方案--------------------
1、真没太好的办法。首先需要有人工设定分配,然后大量的分类识别规则,但最终仍然逃脱不了人工。
Taobao也是以人工分类为主。

2、第一次直接按照min~max价格来平均切分,而后用定时任务在晚上定期进行预统计和分区,别无它法。
------解决方案--------------------
貌似可以使用分词分类吧