Hadoop大数据分析技术
图书信息
作者:迟殿委,陈鹏程编
出版社:清华大学出版社
定价:69.00
ISBN:9787302620990
出版时间:2022-11-01
分类:图书,行业职业,计算机,数据库
商品介绍
目录
第1章Hadoop概述与大数据环境准备
1.1大数据定义
1.2Hadoop生态介绍
1.2.1Hadoop简介
1.2.2Hadoop版本简介
1.2.3Hadoop生态系统和组件介绍
13Hadoop3新特性
1.4虚拟机安装
1.5安装Linux操作系统
1.6SSH工具与使用
1.7Linux统一设置
1.8小结
第2章Hadoop伪分布式集群搭建
2.1安装独立运行的Hadoop
2.2Hadoop伪分布式环境准备
2.3Hadoop伪分布式安装
2.4HDFS操作命令
……
内容简介
伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。
本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。
本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。
作者简介
迟殿委,计算机软件与理论专业硕士,毕业于南昌大学,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE培训经验,熟练掌握JavaEE全栈技术框架,对Java核心编程技术有深刻理解。主要擅长JavaEE系统架构设计、大数据分析与挖掘。
主编推荐
本书系统讲解Hadoop生态圈各组件的核心知识、操作方法和分析技术,并通过两个综合实战项目——影评大数据分析、旅游酒店评价大数据分析,来贯穿Hadoop大数据分析的完整流程。
- 东南大学史 第二卷(1949-1992)(朱斐,东南大学)
- 电气火灾调查(张金专 著)
- 高考舞蹈强化训练(王光辉 编著)
- 中学生创意作文(邵荣霞 主编,长江文艺)
- 新编Premiere Pro标准教程(黄德庆编著,海洋)
- 从皮肤看自己(小多北京文化传媒有限公司 译 美国卡洛斯出版集团)
- 董源潇湘图夏景山口待渡图(,上海书画)
- 无人机系统纯方位定位技术及应用(刘忠、黄亮、石章松等著,国防工业)
