這篇文章主要講解了“Storm怎么寫一個(gè)爬蟲”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“Storm怎么寫一個(gè)爬蟲”吧!
在廣昌等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都網(wǎng)站制作、成都網(wǎng)站建設(shè) 網(wǎng)站設(shè)計(jì)制作按需制作,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站設(shè)計(jì),全網(wǎng)整合營銷推廣,成都外貿(mào)網(wǎng)站制作,廣昌網(wǎng)站建設(shè)費(fèi)用合理。
package com.digitalpebble.storm.crawler.bolt.indexing; import java.util.Map; import org.slf4j.LoggerFactory; import backtype.storm.task.OutputCollector; import backtype.storm.task.TopologyContext; import backtype.storm.topology.OutputFieldsDeclarer; import backtype.storm.topology.base.BaseRichBolt; import backtype.storm.tuple.Tuple; import com.digitalpebble.storm.crawler.StormConfiguration; import com.digitalpebble.storm.crawler.util.Configuration; /** * A generic bolt for indexing documents which determines which endpoint to use * based on the configuration and delegates the indexing to it. ***/ @SuppressWarnings("serial") public class IndexerBolt extends BaseRichBolt { private Configuration config; private BaseRichBolt endpoint; private static final org.slf4j.Logger LOG = LoggerFactory .getLogger(IndexerBolt.class); public void prepare(Map conf, TopologyContext context, OutputCollector collector) { config = StormConfiguration.create(); // get the implementation to use // and instanciate it String className = config.get("stormcrawler.indexer.class"); if (className == null) { throw new RuntimeException("No configuration found for indexing"); } try { final Class<BaseRichBolt> implClass = (Class<BaseRichBolt>) Class .forName(className); endpoint = implClass.newInstance(); } catch (final Exception e) { throw new RuntimeException("Couldn't create " + className, e); } if (endpoint != null) endpoint.prepare(conf, context, collector); } public void execute(Tuple tuple) { if (endpoint != null) endpoint.execute(tuple); } public void declareOutputFields(OutputFieldsDeclarer declarer) { if (endpoint != null) endpoint.declareOutputFields(declarer); } }
感謝各位的閱讀,以上就是“Storm怎么寫一個(gè)爬蟲”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)Storm怎么寫一個(gè)爬蟲這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!
網(wǎng)站標(biāo)題:Storm怎么寫一個(gè)爬蟲
當(dāng)前鏈接:http://bm7419.com/article38/pssisp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護(hù)、App設(shè)計(jì)、Google、動(dòng)態(tài)網(wǎng)站、網(wǎng)站營銷、響應(yīng)式網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)