Python实现日志采集功能

news/2024/9/21 15:26:17 标签: python, 开发语言, 日志采集, Filebeat, Fluentd

目录

    • 一、技术栈选型
    • 二、系统架构图
    • 三、代码实现
      • 1. 日志采集系统的类设计
      • 2. Python 代码实现
      • 3. 代码解析
        • 1. `Logger` 类
        • 2. `LogCollector` 类
        • 3. `LogProcessor` 类
      • 4. 示例运行
      • 5. 整合 FilebeatFluentd
    • 四、总结

在本文中,我们将基于上一篇文章的设计方案,选择合适的技术栈,并通过Python实现日志采集功能。我们会采用面向对象的编程思想,设计一个简化版的日志采集器,并通过 FilebeatFluentd 配合 Python 来完成日志的采集与传输。

一、技术栈选型

根据之前的设计,我们选择以下技术栈来实现日志采集功能:

  • Python:用作核心编程语言,负责日志生成和采集。
  • Filebeat:轻量级日志采集器,用于从本地文件采集日志。
  • Fluentd:灵活的日志处理工具,将日志传输到中央存储系统。
  • Elasticsearch:用于存储和查询日志数据,便于后续的分析。

二、系统架构图

简化后的日志采集系统架构如下:

  1. 应用日志生成器(Python程序):生成模拟日志并输出到本地文件。
  2. Filebeat:从本地文件采集日志,传输给Fluentd
  3. Fluentd:接收Filebeat传输的日志,并处理后将其存储到Elasticsearch中。

三、代码实现

我们通过Python来实现一个简单的日志生成器,并设计一个日志采集器类,模拟应用程序的日志生成和采集过程。

1. 日志采集系统的类设计

我们将创建一个面向对象的日志采集系统,包括以下类:

  • Logger:负责生成模拟日志。
  • LogCollector:负责从本地采集日志。
  • LogProcessor:模拟日志的处理和传输。

2. Python 代码实现

python">import os
import time
import random
import logging

# 模拟日志的产生器类
class Logger:
    def __init__(self, log_file):
        self.log_file = log_file
        self.logger = self._setup_logger()

    def _setup_logger(self):
        logger = logging.getLogger('ApplicationLogger')
        logger.setLevel(logging.INFO)
        handler = logging.FileHandler(self.log_file)
        formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
        handler.setFormatter(formatter)
        logger.addHandler(handler)
        return logger

    def generate_log(self):
        log_levels = ['INFO', 'WARNING', 'ERROR', 'DEBUG']
        while True:
            level = random.choice(log_levels)
            if level == 'INFO':
                self.logger.info('This is an info message.')
            elif level == 'WARNING':
                self.logger.warning('This is a warning message.')
            elif level == 'ERROR':
                self.logger.error('This is an error message.')
            elif level == 'DEBUG':
                self.logger.debug('This is a debug message.')
            time.sleep(1)


# 日志采集器类
class LogCollector:
    def __init__(self, log_file):
        self.log_file = log_file

    def collect_logs(self):
        if os.path.exists(self.log_file):
            with open(self.log_file, 'r') as f:
                logs = f.readlines()
                # 模拟传输到LogProcessor
                LogProcessor().process_logs(logs)
        else:
            print("Log file does not exist.")


# 日志处理器类,模拟处理传输日志
class LogProcessor:
    def process_logs(self, logs):
        print("Processing logs...")
        for log in logs:
            print(log.strip())

# 主程序,模拟运行日志生成和日志采集
if __name__ == "__main__":
    log_file = "application.log"

    # 生成日志
    logger = Logger(log_file)
    
    # 在一个线程中生成日志,可以使用多线程或异步处理
    try:
        # 模拟日志生成和采集的流程
        print("Starting log generation...")
        logger.generate_log()  # 持续生成日志

        # 模拟日志采集器定期采集日志
        collector = LogCollector(log_file)
        while True:
            print("Collecting logs...")
            collector.collect_logs()
            time.sleep(5)  # 模拟每隔5秒采集一次日志
    except KeyboardInterrupt:
        print("Log generation and collection stopped.")

3. 代码解析

1. Logger

Logger 类负责日志的生成。通过 Python 的 logging 模块,我们将日志信息写入本地文件 application.loggenerate_log 方法会模拟生成不同级别的日志(INFO、WARNING、ERROR、DEBUG),并每隔一秒写入一条。

2. LogCollector

LogCollector 类负责从本地日志文件中读取日志,并将其传递给 LogProcessor 进行处理。每隔 5 秒,LogCollector 会读取日志文件中的所有内容,并模拟将其传输到下游的日志处理模块。

3. LogProcessor

LogProcessor 类简单模拟了对日志的处理。它接收到日志后,将日志打印到控制台,后续可以扩展为传输到 Fluentd 或 Elasticsearch。

4. 示例运行

当我们运行代码时,系统会模拟不断生成日志并持续采集、处理这些日志:

$ python log_collector.py
Starting log generation...
Collecting logs...
Processing logs...
2023-09-21 10:00:00 - INFO - This is an info message.
2023-09-21 10:00:01 - ERROR - This is an error message.
Collecting logs...
Processing logs...
2023-09-21 10:00:06 - DEBUG - This is a debug message.

Filebeat__Fluentd_141">5. 整合 FilebeatFluentd

上述 Python 实现的日志生成和采集流程可以与 FilebeatFluentd 集成:

  1. Filebeat 配置:通过配置 Filebeat 采集本地日志文件,并将日志传输到 Fluentd
  2. Fluentd 配置:在 Fluentd 中配置接收 Filebeat 日志,并将其处理后存储到 Elasticsearch。

示例 Filebeat 配置:

filebeat.inputs:
  - type: log
    paths:
      - /path/to/application.log

output:
  logstash:
    hosts: ["localhost:5044"]  # 发送到 Fluentd 或 Logstash

示例 Fluentd 配置:

<source>
  @type forward
  port 5044
</source>

<match **>
  @type elasticsearch
  host localhost
  port 9200
  index_name logs
</match>

四、总结

通过本文的实现,我们完成了日志采集系统的一个基础功能模块,模拟了日志生成、采集、处理等流程。采用面向对象的思想,设计了 LoggerLogCollectorLogProcessor 类,清晰地将日志的生成、采集和处理功能分离。同时,我们还展示了如何通过 FilebeatFluentd 实现日志的集中采集和传输。

这个系统可以进一步扩展,添加日志的传输、存储和分析功能,最终形成一个完善的日志搜集分析平台。


http://www.niftyadmin.cn/n/5669013.html

相关文章

活动目录安全

活动目录安全 1.概述2.常见攻击方式SYSVOL与GPP漏洞MS14-068漏洞Kerberoast攻击内网横移抓取管理员凭证内网钓鱼与欺骗用户密码猜解获取AD数据库文件 3.权限维持手段krbtgt账号与黄金票据服务账号与白银票据利用DSRM账号利用SID History属性利用组策略利用AdminSDHolder利用SSP…

Linux笔记---简单指令

1. 使用的环境 博主使用的是华为云服务器xshell终端的方式学习的&#xff0c;因为据说这样的方式比较接近以后的工作环境。 其中云服务器安装的是Ubuntu操作系统(以Linux为内核&#xff0c;适合新手学习Linux的一个版本) 这里的云服务器不一定使用华为的&#xff0c;但是我在…

基于51单片机的汽车倒车防撞报警器系统

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 本课题基于微控制器控制器&#xff0c; 设计一款汽车倒车防撞报警器系统。 要求&#xff1a; 要求&#xff1a;1.配有距离&#xff0c; 用于把车和障碍物之间的距离信号送入控制器。 2.配有报警系…

CDA Level1 数据分析基本概念

前言 由于最近有些工作上的焦虑&#xff0c;所以想要换个思路&#xff0c;提升一下自己&#xff0c;最近刚好在研究数据分析这块&#xff0c;报名了CDA一级 的考试&#xff0c;记录一下自己的学习笔记。因为本身有一些软件开发基础&#xff0c;笔记会比较粗糙。另对于考试资料…

鸿蒙OpenHarmony【轻量系统内核通信机制(互斥锁)】子系统开发

互斥锁 基本概念 互斥锁又称互斥型信号量&#xff0c;是一种特殊的二值性信号量&#xff0c;用于实现对共享资源的独占式处理。 任意时刻互斥锁的状态只有两种&#xff0c;开锁或闭锁。当任务持有互斥锁时&#xff0c;该互斥锁处于闭锁状态&#xff0c;这个任务获得该互斥锁…

Qt日志输出及QsLog日志库

目录 Qt日志输出及QsLog日志库日志输出格式化日志普通格式化条件格式化环境变量设置格式化日志输出位置日志输出对象信息禁用输出 QsLog日志库使用方法1. 将QsLog目录添加到项目中2. 配置CMakeLists.txt文件3. 配置.pro文件4. 日志记录器的配置5. 运行程序6. 启用行号和文件名C…

Unity C# 网络学习—WWWForm

目录 一、WWWForm是什么 二、表单是什么 三、如何填表 1.创建一个表格 2.填写表格 四、发出表单 五、案例代码 一、WWWForm是什么 WWWForm中&#xff0c;WWW代表网络的意思&#xff0c;Form的英文翻译是表单。 WWWForm是unity的一个格式&#xff0c;所以写完表格&#…

Linux 磁盘清理重新格式化挂载脚本及问题解决

Linux 磁盘清理重新格式化挂载脚本&#xff1a;diskformat.sh #!/bin/bash for i in {1…8} do umount /data0$i done PIDARRAY() for i in a b c d e f g h do parted -s /dev/sd i m k l a b e l g p t p a r t e d − s / d e v / s d i mklabel gpt parted -s /dev/sd im…