hadoop定时执行du -sk导致磁盘IO过高，如何解决？

近期执行job时容易失败，查看服务器的时候发现在执行
du -sk /bigdata/hdfs/dn/current/BP-449914029-11.11.11.21-1522055433405
每秒大概4M左右，持续小时，导致正常的任务无法完成

举报该问题

推荐答案 2018-05-06

考虑通过将原有的du命令替换，并基于df命令来编写一个新的du命令来取而代之。
[root@idc1-server2 ~]# mv /usr/bin/du /usr/bin/du.orig
[root@idc1-server2 ~]# vim /usr/bin/du
1 #!/bin/sh
2
3 mydf=$(df -Pk $2 | grep -vE '^Filesystem|tmpfs|cdrom' | awk '{ print $3 }')
4 echo -e "$mydf\t$2"
[root@idc1-server2 ~]# chmod +x /usr/bin/du
不过这样的话，统计出来的结果不就不准确了吗？
但具体情况具体应对，一般来说，Hadoop的datanode都会采用不同的磁盘并划分分区来存储数据，那么使用df统计出来的结果，误差应该是很小的。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/DDDeneIBBejDrZBTjrI.html

相似回答

linux培训主要学什么内容,多长时间能学完?答：在千锋教育的Linux培训课程中，我们主要涵盖了以下内容：更系统全面的学习资料，点击查看1. Linux系统入门：学习Linux操作系统的基本概念、特点以及常用命令。2. Linux网络管理：学习Linux网络配置、网络协议、网络服务等。3. Linux安全管理：学习Linux的安全防护措施、漏洞修补、日志分析等。4. Shell编程：学...

大家正在搜

hadoop mapreduce hadoop hdfs hadoop和spark spark和hadoop哪个好 hadoopfromlocal hadoop shell hadoophdfs命令上传 hadoopfschownr hadoop fs