kettlemodifiedjavascript步驟的一個例子-創(chuàng)新互聯(lián)

例子里用到的 org.htmlparser.Parser 是一個html 的解析器,可以在 sourceforge 上下載。

10年積累的成都做網站、網站設計經驗,可以快速應對客戶對網站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網絡服務。我雖然不認識你,你也不認識我。但先網站設計后付款的網站建設流程,更有丹棱免費網站建設讓你可以放心的選擇與我們合作。

這個例子使用 org.htmlparser.Parser 包來解析一個 html 格式的字符串,要解析的 html 字符串保存在conntentOld 字段里。

解析過程去除了 html 格式里所有標簽,并將結果保存在 content 字段里。

注意事項:

1. 需要事先將htmlparser.jar包 放在kettle 的 libext 目錄,kettle 在啟動時會自動加載libext 目錄下的所有 jar 包。

2. modified java script 步驟要選中 compatibility mode,并將 content 設置為輸出的字段。

代碼如下:

[@more@]var parser = new Packages.org.htmlparser.Parser( contentOld );
var visitor = new Packages.org.htmlparser.visitors.TextExtractingVisitor();
parser.visitAllNodesWith(visitor);
var content = visitor.getExtractedText();

本文名稱:kettlemodifiedjavascript步驟的一個例子-創(chuàng)新互聯(lián)
文章轉載:http://bm7419.com/article36/dgdcpg.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供電子商務全網營銷推廣、標簽優(yōu)化、網頁設計公司、用戶體驗、域名注冊

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化