Lazy loaded image
Apache Flume 1.9.0 安装与配置文
字数 795阅读时长 2 分钟
2025-9-25
2025-9-25

Apache Flume 1.9.0 安装与配置文档

💡
欢迎您在底部评论区留言,一起交流~

Apache Flume 1.9.0 安装与配置文档

适用环境:
  • 大数据省赛容器环境 (Master 节点)
  • 已完成 Hadoop 3.1.3 完全分布式集群的部署与启动。
  • 使用 root 用户进行操作。
  • 所有命令均使用绝对路径。
  • 注意:根据样题要求,Flume 用于采集 Hadoop 集群日志并写入 HDFS,因此只需在 Master 节点部署即可。

第一步:在 Master 节点解压 Flume 安装包

  1. 登录到 Master 节点。
    1. 将 Flume 安装包解压到 /opt/module/ 目录,并重命名为 flume 以便管理。

      第二步:配置 Flume 环境变量

      1. 编辑 /etc/profile 文件,为所有用户设置 Flume 环境变量。
        1. 在文件末尾添加以下内容:
          1. 使环境变量立即生效。
            1. 验证配置是否成功。 如果正确输出 Flume 版本信息,则说明环境变量配置成功。

              第三步:创建并配置 Flume Agent

              1. 进入 Flume 配置文件目录。
                1. 创建一个新的配置文件 1.conf
                  1. 将以下配置内容完整粘贴到文件中:

                    第四步:解决 Flume 与 Hadoop 的 JAR 包冲突

                    Flume 自带的 guava 库版本与 Hadoop 3.x 不兼容,需要进行替换。
                    1. 复制 Hadoop 的核心配置文件到 Flume 的 conf 目录,确保 Flume 能正确连接 HDFS。
                      1. (可选)配置 Flume 的 Java 环境。复制模板文件并编辑。 取消注释并修改 JAVA_HOME 行:
                        1. 关键步骤:替换冲突的 Guava JAR 包

                          第五步:启动 Flume Agent

                          在 Master 节点上,启动名为 a1 的 Flume Agent,并在控制台实时查看日志。
                          查看是否有内容
                          • n a1: 指定要启动的 Agent 名称为 a1
                          • c conf/: 指定配置文件目录。
                          • f conf/1.conf: 指定具体的配置文件。
                          • Dflume.root.logger=INFO,console: 设置日志级别为 INFO 并输出到控制台,方便调试。
                          启动成功后,Flume 会开始监控 /opt/module/hadoop-3.1.3/logs/ 目录下所有包含 namenodedatanode 的日志文件,并将新增内容实时采集并写入 HDFS 的 tmp/flume/ 路径下。

                          至此,Apache Flume 1.9.0 已安装、配置并成功启动。 您可以通过访问 HDFS Web UI 或使用 hdfs dfs -ls tmp/flume/ 命令来验证数据是否已成功写入。
                          上一篇
                          Apache Hudi 安装与配置文档
                          下一篇
                          Flink 1.14.0 on Yarn 安装配置文档

                          评论
                          Loading...