`
wbj0110
  • 浏览: 1549529 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

HADOOP工作流调度系统OOZIE

阅读更多
  1. e.WordCount.Reduce</value>  
  2.                 </property>  
  3.                 <property>  
  4.                     <name>mapred.input.dir</name>  
  5.                     <value>${inputDir}</value>  
  6.                 </property>  
  7.                 <property>  
  8.                     <name>mapred.output.dir</name>  
  9.                     <value>${outputDir}</value>  
  10.                 </property>  
  11.             </configuration>  
  12.         </map-reduce>  
  13.         <ok to='end'/>  
  14.         <error to='end'/>  
  15.     </action>  
  16.     <kill name='kill'>  
  17.         <message>Something went wrong: ${wf:errorCode('wordcount')}</message>  
  18.     </kill/>  
  19.     <end name='end'/>  
  20. </workflow-app>
复制代码



配置打包后通过OozieClient提交给Hadoop就直接可以运行了
任务种类Oozie任务分为三种模式:

  • workflow – 这种方式最简单,就是定义DAG来执行。
  • coordinator – 它构建在workflow工作方式之上,提供定时运行和触发运行任务的功能。
  • bundle – bundle的作用就是将多个coordinator管理起来。这样我们只需要提供一个bundle提交即可。然后可以start/stop/suspend/resume任何coordinator。

Shell Action如果想通过Oozie调度远程服务器上的命令,可以通过ssh action来执行任意的shell命令。用户必须明确的上传所需要的第三方库。Oozie通过Hadoop的分布式缓冲来上传、打标签、使用。
Shell命令会在任意一个hadoop计算节点上运行,但是计算节点上默认安装的工具集可能会不一样。不过在所有的计算节点上,通常都装有大部分普通的unix工具。因此需要明确的很重要的一点是:Oozie只支持有被安装到计算节点上的命令或者通过分布式缓存上传的命令。也就是说,我们必须通过file上传我们要用到的文件。

http://www.aboutyun.com/forum.php?highlight=Oozie&mod=viewthread&tid=7288

 

 

分享到:
评论

相关推荐

    Oozie大数据调度系统从入门到精通视频教程

    1.Shell脚本工作流调度开发实战 2.Hive Job工作流调度开发实战 3.MapReduce工作流调度开发实战 4.复杂工作流调度实战 5.分支与合并逻辑控制组件 第四章:Oozie定时依赖调度 1.基于时间的任务流调度 2....

    从 Oozie 工作流到 Airflow DAG 的迁移工具_python_代码_下载

    一个在Apache Oozie工作流和Apache Airflow...Apache Oozie 是一个用于管理 Apache Hadoop 作业的工作流调度系统。Oozie 工作流也被设计为XML 中的有向无环图 (DAG)。 更多详情、使用方法,请下载后阅读README.md文件

    Apache Hadoop---Oozie.docx

    Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架,是用于Hadoop平台的开源的工作流调度引擎,是用来管理Hadoop作业,属于web应用程序,由Oozie client和Oozie Server两个组件构成,Oozie Server运行于Java ...

    09.大数据工作流引擎Oozie.pptx.pptx

    Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架,是用于Hadoop平台的开源的工作流调度引擎,是用来管理Hadoop作业,属于web应用程序,

    2018最新高清大数据协作框架全套视频教程(Sqoop,Flume,Oozie,WEB工具Hue)

    3.02_02_03_01 工作流调度框架Oozie功能初步认识 网页.mp4 3.02_02_03_02 Linux Crontab调度讲解 网页.mp4 3.02_02_03_03 大数据Hadoop常用三种调度框架讲解 网页.mp4 3.02_02_03_04 Oozie 功能架构及三大Server讲解...

    Oozie安装部署及任务定义说明

    配置oozie工作流 10 Workflow.xml中控制流程节点说明 10 action节点 10 start节点 11 end节点 11 Kill节点 12 decision节点 12 fork节点和join节点 12 工作流配置实例(oracle-hdfs-oacle) 13 Oozie任务定时调度 15 ...

    oozie配置mysql:表结构详解

    oozie配置mysql所需表结构。Apache Oozie是用于Hadoop平台的一种工作流调度引擎。

    oozie-5.0.0.tar.gz

    2019-06-25 最新oozie5.0.0.tar.gz基于工作流调度hadoop作业web工具

    Hadoop学习资料

    1.Hadoop生态系统及版本演化 2.HDFS 2.0 应用场景、原理、基本架构及使用方法 3.YARN应用场景、基本架构与资源调度 ...13.工作流引擎Oozie与Azkaban应用 14.两个综合案例:日志分析系统与机器学期平台

    oozie-to-airflow:Oozie从Workflow到Airflow DAG的迁移工具

    Apache Oozie是一个工作流调度程序系统,用于管理Apache Hadoop作业。 Oozie工作流还被设计为XML中的有向无(DAG)。 以下是一些区别: 规格任务依存关系“子工作流程” 参数化通知Oozie XML格式动作节点控制节点子...

    oozie:Apache Oozie的镜子

    阿帕奇·奥兹(Apache Oozie)什么是Oozie Oozie是一个可扩展,可扩展且可靠的系统,用于通过Web服务定义,管理,调度和执行复杂的Hadoop工作负载。 更具体地说,这包括: 基于XML的声明性框架,用于指定作业或相关...

    深入大数据平台心脏:饿了么调度系统全解

    Ooize基于工作流调度引擎,是雅虎的开源项目,属于JavaWeb应用程序。由OozieClient和OozieServer两个组件构成。OozieServer运行于JavaServlet容器(Tomcat)中的Web程序。工作流必须是一个有向无环图,实际上Oozie就...

    oozie

    Oozie是一个工作流调度程序系统,用于管理Apache Hadoop作业。 Oozie与其余Hadoop堆栈集成在一起,支持开箱即用的几种类型的Hadoop作业(例如Java map-reduce,Streaming map-reduce,Pig,Hive,Sqoop和Distcp)...

    Hadoop实战(第2版)

    数据逻辑.2 将数据导入导出Hadoop.2.1 导入导出的关键要素2.2 将数据导入Hadoop .2.2.1 将日志文件导入Hadoop技术点1 使用Flume 将系统日志文件导入HDFS 2.2.2 导入导出半结构化和二进制文件技术点2...

    a_azkaban.zip

    1.为什么需要工作流调度系统 一份完整的数据分析系统通常又大量的任务单元组成 shell,java,mapreduce,hive 2.各个单元之间存在时间先后及依赖关系:先后,依赖关系,定时执行 3.任务调度工具能够更加好地管理这些,以及...

    examples.zip

    Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架,是用于Hadoop平台的开源的工作流调度引擎,是用来管理Hadoop作业,属于web应用程序,由Oozie client和Oozie Server两个组件构成,Oozie Server运行于Java ...

    kite-apps:基于Kite和Hadoop说明性应用程序

    该库处理所有调度工作,生成并部署所需的Oozie协调器,工作流和应用程序库本身。 该库仍在日趋成熟,并且可能会进行非被动更改。 已在CDH 5.4上进行了测试。编写风筝应用程序该库的用户使用两个主要概念: ...

    Hadoop硬实战 [(美)霍姆斯著][电子工业出版社][2015.01]_PDF电子书下载 带书签目录 高清完整版.rar )

    技术点3 使用Oozie 定期执行数据导入活动 2.2.3 从数据库中拉数据 技术点4 使用MapReduce 将数据导入数据库 技术点5 使用Sqoop 从MySQL 导入数据 2.2.4 HBase 技术点6 HBase 导入HDFS 技术点7 将...

Global site tag (gtag.js) - Google Analytics