Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
![Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著精美图片](https://img3m3.ddimg.cn/50/16/1401735803-1_h_1.jpg)
Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著电子书下载地址
- 文件名
- [epub 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 epub格式电子书
- [azw3 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 azw3格式电子书
- [pdf 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 pdf格式电子书
- [txt 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 txt格式电子书
- [mobi 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 mobi格式电子书
- [word 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 word格式电子书
- [kindle 下载] Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著 kindle格式电子书
寄语:
新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!
内容简介:
开篇介绍了HadoopYARN,MapReduce,HDFS以及其它Hadoop生态系统组件的安装。在本书的指引下,你很快就会学习到很多激动人心的主题,例如MapReduce模式,使用Hadoop从事分析、归类、在线销售、推荐、数据索引及搜索。
书籍目录:
Preface
Chapter 1:Getting Started with Hadooo v2
IntrOductiOn
Setting up Hadoop v2 on your local machine
Writing a WordCount MapReduce application,bundling it
and running it using the Hadoop local mode
Adding a combiner step to the WordCount MapReduce program
Setting up HDFS
Setting up Hadoop YARN in a distributed cluster environment
using Hadoop v2
Setting up Hadoop ecosystem in a distributed cluster environment
using a Hadoop distribution
HDFS command—line file operations
Running the WordCount program in a distributed cluster environment
Benchmarking HDFS using DFSIO
Benchmarking Hadoop MapReduce using TeraSort
Chapter 2:Cloud Deployments—Using Hadoop YARN on
Cloud Environments
Introduction
Running Hadoop MapReduce v2 computations using Amazon
Elastic MapReduce
Saving money using Amazon EC2 Spot Instances to execute EMR job flows
Executing a Pig using EMR
Executing a Hive using EMR
Creating an Amazon EMR job flow using the AWS Command Line Interface
Deploying an Apache HBase cluster on Amazon EC2 using EMR
Using EMR bootstrap actions to configure VMs for the Amazon EMR jobs
Using Apache Whirr to deploy an Apache Hadoop cluster in a
cloud environment
Chapter 3:Hadoop Essentials—C0nfigurations,Unit Tests,and Other APIs
Introduction
Optimizing Hadoop YARN and MapReduce cOnfiguratiOns for
cluster deployments
Shared user Hadoop clusters——using Fair and Capacity schedulers
Setting classpath precedence to user—provided JARs
Speculative execution of straggling tasks
Unit testing Hadoop MapReduce applications using MRUnit
Integration testing Hadoop MapReduce applications using
MiniYarnCluster
Adding a new DataNode
Decommissioning DataNodes
Using multiple disks/volumes and limiting HDFS disk usage
Setting the HDFS block size
Setting the file replication factor
Using the HDFs Java API
Chapter 4:Develooin~ComDlex Hadooo MaoReduce Aoolications
IntrOductiOn
Choosing appropriate Hadoop data types
Implementing a custom Hadoop Writable data type
Implementing a custom Hadoop key type
Emitting data of different value types from a Mapper
Choosing a suitable Hadoop InputFormat for your input data format
Adding support for new input data formats——implementing
a custom InputFormat
Formatting the results of MapReduce computations——using
Hadoop OutputFormats
Writing multiple outputs from a MapReduce computation
Hadoop intermediate data partitioning
Secondary sorting——sorting Reduce input values
BrOadcasting and distributing shared resources to tasks in a
MapReduce job—Hadoop DistributedCache
Using Hadoop with legacy applications——Hadoop streaming
Adding dependencies between MapReduce jobs
Hadoop counters to report custom metrics
Chapter5:Analvtics
Introduction
Simple analytics using MapReduce
Performing GROUP BY using MapReduce
Calculating frequency distributions and sorting using MapReduce
Plotting the Hadoop MapReduce results using gnuplot
Calculating histograms using MapReduce
Calculating Scatter plots using MapReduce
Parsing a complex dataset with Hadoop
Joining two datasets using MapReduce
Chapter6:Hadooo Ecosystem—Apache Hive
Introduction
Getting started with Apache Hive
Creating databases and tables using Hive CLI
Simple SQL—style data querying using Apache Hive
Creating and populating Hive tables and views using Hive query results
Utilizing different storage formats in Hive.storing table data
using ORC files
Using Hive built—in functions
Hive batch mode—using a query file
Performing a join with Hive
Creating partitioned Hive tables
Writing Hive User·defined Functions(UDF)
HCatalog—·performing Java MapReduce computations on
data mapped to Hive tables
HCatalog——writing data to Hive tables from Java
MapReduce computations
Chapter7:HadooD Ecosystem II—Pig.HBase.Mahout.and Sannn
Introduction
Getting started with Apache Pig
Joining two datasets using Pig
Accessing a Hive table data in Pig using HCatalog
Getting started with Apache HBase
Data random access using Java client APIs
Running MapReduce jobs on HBase
Using Hive to insert data into HBase tables
Getting started with Apache Mahout
Running K—means with Mahout
Importing data to HDFS from a relational database using Apache Sqoop
Exporting data from HDFs to a relational database using Apache Sqoop
Tahie OrContencs
Chapter8:Searching and Indexine
Introduction
Generating an inverted index using Hadoop MapReduce
Intradomain web crawling using Apache Nutch
Indexing and searching web documents using Apache Solr
Configuring Apache HBase as the backend data store for Apache Nutch
Whole web crawling with Apache Nutch using a HadooP/HBase cluster
Elasticsearch for indexing and searching
Generating the in—links graph for crawled web pages
Chapter 9:CIassmcatiOns。Recommendations,and Findineg RelationshipS
Introduction
Performing content—based recommendations
Classification using the naive Bayes classifier
Assigning advertisements to keywords using the Adwords
balance algorithm
Chapter 10:Mass Text Data processing
Introduction
Data preprocessing using Hadoop streaming and Python
De—duplicating data using Hadoop streaming
Loading large datasets to an Apache HBase data store—importtsv
and bulkload
Creating TF and TF—IDF vectors for the text data
Clustering text data using Apache Mahout
Topic discovery using Latent Dirichlet Allocation(LDA)
Document classification using Mahout Naive Bayes Classifier
Index
作者介绍:
Thilina Guna rathne是KPMG LLP的不错数据科学家。在进入KPMG LLP之前,他在Link AnglytiCS负责Hadoop的关研究。他对于Apache Hadoop以及大规模数据密集计算的相关技术有着丰富的经验。他还和srinath Perera博士合著了本书的靠前版。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
暂无其它内容!
网站评分
书籍多样性:9分
书籍信息完全性:8分
网站更新速度:7分
使用便利性:6分
书籍清晰度:3分
书籍格式兼容性:6分
是否包含广告:5分
加载速度:4分
安全性:3分
稳定性:5分
搜索功能:7分
下载便捷性:7分
下载点评
- 差评(371+)
- 速度快(275+)
- 无水印(154+)
- 全格式(163+)
- 无缺页(314+)
- 不亏(301+)
- 三星好评(503+)
- 一般般(154+)
- 无颠倒(62+)
- 可以购买(249+)
- 体验还行(401+)
下载评价
- 网友 谢***灵:
推荐,啥格式都有
- 网友 訾***雰:
下载速度很快,我选择的是epub格式
- 网友 孙***美:
加油!支持一下!不错,好用。大家可以去试一下哦
- 网友 寿***芳:
可以在线转化哦
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 养***秋:
我是新来的考古学家
- 网友 冉***兮:
如果满分一百分,我愿意给你99分,剩下一分怕你骄傲
- 网友 邱***洋:
不错,支持的格式很多
- 网友 芮***枫:
有点意思的网站,赞一个真心好好好 哈哈
- 网友 谭***然:
如果不要钱就好了
- 网友 屠***好:
还行吧。
- 网友 冯***丽:
卡的不行啊
- 网友 温***欣:
可以可以可以
- 网友 陈***秋:
不错,图文清晰,无错版,可以入手。
喜欢"Hapdoop MapReduce v2参考手册 (美)冈纳拉森(Thilina Gunarathne) 著"的人也看了
Kiki猫成长记(套装共25册) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
北京 (城市,全图,政区,交通,旅游指南) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
网络与新媒体创新:个案与模式 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
文物展具与装具 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
Africa 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
临淄地方币 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
黄冈小状元同步作文(4上) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
藏式住屋的变迁:拉萨地区1980年代之后乡村民居的演变研究 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
外研社现代英汉汉英词典(精) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
无形资产:INTANGIBLE ASSETS 评估与经济利益 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 高中题型大解读 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 法律基础 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 孕产营养40周宜忌 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 北梦琐言 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 投资的常识 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 测绘案例分析——考点剖析与试题解析(2022版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 24堂财富课 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 美味的科学 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 班组长现场管理培训教程 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 2015年全国物业管理师执业资格考试历年真题及专家押题试卷基本制度与政策 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
书籍真实打分
故事情节:9分
人物塑造:4分
主题深度:9分
文字风格:7分
语言运用:5分
文笔流畅:6分
思想传递:8分
知识深度:9分
知识广度:8分
实用性:6分
章节划分:6分
结构布局:7分
新颖与独特:8分
情感共鸣:5分
引人入胜:3分
现实相关:8分
沉浸感:6分
事实准确性:3分
文化贡献:5分