Flink 1.14.0 on Yarn 安装配置文档 (修订版)
欢迎您在底部评论区留言,一起交流~
Flink 1.14.0 on Yarn 安装配置文档 (修订版)
适用环境:
- 大数据省赛容器环境 (Master, Slave1, Slave2)
- 已完成 Hadoop 3.1.3 完全分布式集群的部署与启动。
- 使用
root用户进行操作。
- 所有命令均使用绝对路径。
- 注意:根据省赛样题要求,Flink 任务需在 Yarn 上以 Per Job 模式运行。因此,本安装文档不启动 Flink 自带的 Standalone 集群(即不执行
start-cluster.sh),仅配置好环境以便通过 Yarn 提交任务。
第一步:在 Master 节点解压 Flink 安装包
- 登录到 Master 节点。
- 将 Flink 安装包解压到
/opt/module/目录,并重命名为flink以便管理。
第二步:配置 Flink 环境变量
- 编辑
/etc/profile文件,为所有用户设置 Flink 环境变量。
- 在文件末尾添加以下内容:
- 使环境变量立即生效。
- 验证配置是否成功。 如果正确输出 Flink 版本信息,则说明 Master 节点环境变量配置成功。
第三步:修改 Flink 核心配置文件
所有配置文件均位于
/opt/module/flink/conf/ 目录下。- 配置
flink-conf.yaml
修改:
添加:
- 配置
masters
修改为:
- 配置
workers
修改为:
第四步:分发 Flink 安装包到 Slave 节点 ✅ (新增关键步骤)
将 Master 节点上配置好的整个 Flink 目录分发到 Slave1 和 Slave2 节点,确保集群环境的一致性。
第五步:在 Slave 节点配置环境变量 ✅ (新增关键步骤)
- 登录到 Slave1 节点。
- 编辑
/etc/profile文件。
- 添加与 Master 节点相同的环境变量:
- 使环境变量生效。
- (可选)验证环境变量:
- 重复步骤 1-5,在 Slave2 节点上完成相同配置。
第六步:在 Yarn 上运行测试任务
- 确保 Hadoop Yarn 服务已启动。
- 在 Master 节点上,直接运行以下命令提交 WordCount 作业到 Yarn 集群:
- 观察命令行输出,等待任务执行完成,并按要求截取最后10行结果。
至此,Flink 1.14.0 的完整安装、配置与分发流程已全部完成。 此流程确保了集群所有节点的环境一致性,符合生产实践和竞赛的严谨性要求。
- 作者:神秘人
- 链接:https://blog.tianjiaji.top//url/279183c0-6139-808c-bf26-c3979eefc880
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。










