全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  技术干货  >  大数据技术干货  >  详情

Hadoop集群安装系列------单机安装 (根据官方文档编写)

来源:千锋教育
发布人:qyf
2022-11-07

推荐

在线提问>>

  1. 注意

  单机不需要启动任何服务即可使用,在单一的jvm中运行,一般只用于调试

  2. 实例

  2.1 跑wordcount例子时注意

  创建数据源 mkdir /root/hadoopdata/input

  将一些数据导入 cp /usr/local/hadoop-2.7.1/etc/hadoop/*.xml /root/hadoopdata/input

  对input中文件的单词数量进行运算

  格式 hadoop jar命令 例子架包 wordcount函数 参数一:数据来源 参数二: 数据输出(统计后的结果)

  [root@bihai6 mapreduce]# hadoop jar hadoop-mapreduce-examples-2.7.1.jar wordcount /root/hadoopdata/input /root/hadoopdata/output/

  注意:数据输出路径必须是空的,系统会自动创建

  要保证bihai6是etc/hosts与etc/sysconfig/network中的名字相同

  2.2 跑九宫格

  hadoop jar hadoop-mapreduce-examples-2.7.1.jar sudoku /root/hadoopdata/sudoku.txt

  先把下面的数据放入sudoku.txt文件中

1

  2.3 跑teragen

  注意:输出路径也不存在 ,最后是要查找的关键字

  hadoop jar hadoop-mapreduce-examples-2.7.1.jar grep /root/hadoopdata/input/core-site.xml /root/hadoopdata/output1 'xml'

  2.4 SecondarySort 二次排序

  [root@bihai6 output2]# hadoop jar hadoop-mapreduce-examples-2.7.1.jar secondarysort /root/hadoopdata/SecondarySort.dat /root/hadoopdata/output2

  下面是数据源,将数据放在SecondarySort.dat中

2

相关文章

hadoop搭建完全分布式

spark和hadoop的区别

redis数据类型有几种

hadoop的核心是哪两部分

spark有什么用

开班信息 更多>>

课程名称
全部学科
咨询

HTML5大前端

Java分布式开发

Python数据分析

Linux运维+云计算

全栈软件测试

大数据+数据智能

智能物联网+嵌入式

网络安全

全链路UI/UE设计

Unity游戏开发

新媒体短视频直播电商

影视剪辑包装

游戏原画

    在线咨询 免费试学 教程领取