教程詳情
文件下載 | 文件名稱:Nutch搜索引擎高級視頻教程 | 文件大小:6.30GB |
下載聲明:本站文件大多來自于網絡,僅供學習和研究使用,不得用于商業用途,如有版權問題,請聯系博豬! | ||
下載地址: 下載教程 |
教程目錄:
01-概述、運行方式、連接Hadoop、分析Nutch腳本.mp4
02-nutch-default.xml配置項、常用命令.mp4
03-詳解Nutch的存儲文件夾data、crawldb&segments&linkdb命令.mp4
04-深入分析Nutch的抓取周期、3大merge和3大read命令闡釋、反轉鏈接、解析頁面.mp4
05-域統計、webgraph.mp4
06-注入分值、輕量級抓取.mp4
07-indexchecker、安裝配置Solr、運行Solr并提交索引、使用Luke工具查看索引、給Solr配置分詞器mmseg4j.mp4
08-指定Luke工具的分詞器、運行Solr并提交索引.mp4
09-安裝Windows上的Nutch運行環境Cygwin、運行Nutch.mp4
10-Hadoop單機本地模式、Hadoop單機僞分布式模式、執行Nutch的crawl命令.mp4
11-配置Cygwin支持無密碼SSH登錄、Windows上的Hadoop單機僞分布式、執行wordcount命令.mp4
12-Hadoop多機完全分布式模式.mp4
13-改變機器負載、SecondaryNameNode、啓用回收站.mp4
14-動态增加DataNode節點和TaskTracker節點.mp4
15-限制Hadoop節點連接、動态删除DataNode節點和TaskTracker節點.mp4
16-運行基準測試.mp4
17-配置服務端、配置客戶端、訪問頁面、集成Hadoop.mp4
18-壓縮數據、以不同壓縮方法注入URL、Hadoop配置Snappy壓縮.mp4
19-Ganglia以組播或單播方式監控同一個網段中的多個集群、Ganglia監控不同網段中的多個集群.mp4
20-Ganglia以單播方式監控跨多個網段的單一集群、配置Hadoop集群使用單播地址、擴展集群讓其節點分别位于3個不同網段、配置host138.mp4
教程截圖
教程試看
https://v.youku.com/v_show/id_XNTgxNDU1Nzc3Mg==.html
教程下載
原文鏈接:【教程寶盒網】 https://www.jc-box.com/3854.html,轉載請注明出處。
請先
!