多个MapReduce作业相互依赖时，使用JobControl进行管理

MNTMs

浏览: 158490 次
性别:
来自: 长沙

最近访客更多访客>>

裴喜龙

yokoboy

javaflex

Netpet_11

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

hadoop JobControl addDepending()依赖

要处理复杂关系的数据，一个工程里面绝对不止一个MapReduce作业，当有多个MapReduce作业时，并且每个作业之间有依赖关系，所谓的依赖就是一个作业得到的结果是另外一个作业的输入，这个时候我们可以使用JobControl吊用其中的的addDepending()方法，管理每个MapReduce工作间的依赖关系，具体的示例如下：

step1:

//设置各个Configuration
Configuration Aconf = new Configuration();
Configuration Bconf = new Configuration();
Configuration Cconf = new Configuration();
Configuration Dconf = new Configuration();

step2:

//创建job对象，需要注意的是JobControl要求作业必须封装成job对象
Job Ajob = new Job(Aconf);
Job Bjob = new Job(Bconf);
Job Cjob = new Job(Cconf);
Job Djob = new Job(Dconf);

step3:

//设置依赖关系，构造一个DAG作业
Bjob.addDepending(Ajob);
Cjob.addDepending(Ajob);
Djob.addDepending(Bjob);
Djob.addDepending(Cjob);

step4:

//创建JobControl对象，由他对作业进行监控和调度
JobControl JC = new JobControl("Native Bayes");

step5:

//把四个作业添加到JobControl中
JC.addJob(Ajob);
JC.addJob(Bjob);
JC.addJob(Cjob);
JC.addJob(Djob);

step6:

//提交DAG作业
JC.run();

在实际运行过程中，不依赖于其他任何作业的Ajob会优先得到调度，一旦运行完成，Bjob,Cjob两个作业同时被调度，待他们全部运行完成后Djob被调用，参看上面的依赖的顺序！！！

2
顶

0
踩

分享到：

致命方块 | 第一个完整的Map/Reduce小程序

2014-06-30 23:06
浏览 1568
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

多个MapReduce作业相互依赖时，使用JobControl进行管理

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

多个MapReduce作业相互依赖时，使用JobControl进行管理

评论

发表评论

相关推荐

hive常用函数

求猛戳进来

HDFS 常用的文件操作命令

hadoop中M/R的点点滴滴

多个mapreduce工作相互依赖处理方法完整实例（JobControl）

Permission denied: win7下面eclipse上传本地文件到DFS && 运行M/R程序时出现的同样的错误解决方法

hadoop常见配置含义

Hadoop实现Secondary Sort (转)

第一个完整的Map/Reduce小程序

Hadoop 解除 "Name node is in safe mode"（转）

win7+centos虚拟机hadoop安装eclipse插件运行时报权限错误处理方法

hadoop之在集群上跑Pig脚本语言

hadoop之Pig(一)--简介

hadoop文件系统中文件复本的默认布局

hadoop源码分析（一）

最近访客更多访客>>