python 多线程日志切割+日志分析
楼主最近刚刚接触python,还是个小菜鸟,没有学习python之前可以说楼主的shell已经算是可以了,但用shell很多东西实现起来还是不可能的事情,例如最明显的一点大日志分析,由于楼主的公司,每天的日志量很大,用shell分析的会非常非常的慢。
通过学习python,楼主有了一种想法,想法如下
可不可以分割日志,把日志分割成很多的小块,利用多线程去分析日志,这个难点在哪,难点就在如何去分割日志,前几篇文件楼主写过日志分割的python版,但是存在很大的弊端,只能够针对小日志进行分割,因为上一篇是把日志先写到列表中,大家都知道列表时要站内存的,那如果说日志很大,岂不一下就把内存吃满了。废话就不多说了,楼主来阐明下如何解决此问题
首先创建一个文本,文本内容如下
1
2
3
。
。
。
1000
1.计算出文本一行的大小比如说是4B
2.用服务器的总内存数除以4B 计算出我的服务器可以一次性分析多大的文件,这个数就是我一个文本应该为多少行,也就是说我切割的日志,一个文件是多少行
下面奉献出日志切割的脚本
#!/usr/bin/python
from time import ctime
def splitFile(fileLocation, targetFoler):
file_handler = open(fileLocation, 'r')
block_size = 100 (为我每个文件的行数)
line = file_handler.readline()
temp = []
countFile = 1
while line:
for i in range(block_size):
if i == (block_size-1):
# write block to small files
file_writer = open(targetFoler + "file_"+str(countFile)+".txt", 'a+')
file_writer.writelines(temp)
file_writer.close()
temp = []
print " file " + str(countFile) + " generated at: " + str(ctime())
countFile = countFile + 1
else:
temp.append(file_handler.readline())
if countFile == 11:
break;
file_handler.close()
if __name__ == '__main__':
print "Start At: " + str(ctime())
splitFile("/home/python/test.txt", "/tmp/")
分割完日志后,下面就该进行日志分析了
脚本如下
#!/usr/bin/python
import os
import re
import threading
def chaFile(path):
a=os.listdir(path)
for i in range(len(a)):
b=a[i]
c=open("/home/python/rizhifenge.txt","a+")
kk="\n"+b
c.writelines(kk)
c.close()
d=open("/home/python/rizhifenge.txt","r")
f=d.read()
e=re.findall("file.*",f)
return e
d.close()
def chaZhao(path):
aa=open(path,"r+")
bb=aa.read()
cc=re.search("\d.",bb)
if cc:
print cc.group()
aa.close()
if __name__ == "__main__":
ff="/tmp/"
for i in chaFile(ff):
gg=ff+i
a=threading.Thread(target=chaZhao,args=(gg,))
a.start()
转载于:https://blog.51cto.com/4249964/1368577
相关文章:

redis入门(03)redis的配置
一、配置文件 Redis 的配置文件位于 Redis 安装目录下,文件名为 redis.conf。你可以通过 CONFIG 命令查看或设置配置项。 二、查看修改 1、查看配置 1.1、vi redis.conf 1.2、redis 127.0.0.1:6379> config get CONFIG_SETTING_NAME 2、修改配置 2.1、vi redis.c…

WMI Series :管理对象的信息查询和方法访问
管理对象的信息查询和方法访问在这一节内容,我们将通过几个实例来学习如何查询管理对象信息和访问管理对象提供的方法,这一部分内容将使用到我们在前面讲述到的System.Management命名空间中的相关类对象。管理对象的信息查询管理对象的信息查询有两种方式…

穿山甲发布聚合产品GroMore,为开发者变现赋能
近日,穿山甲发布聚合产品「GroMore」,该产品整合多个主流广告平台资源,支持App开发者将广告请求同时发送至多个平台,并根据各平台的出价能力,合理分配流量,最终达到广告收益最大化的目的。聚合产品在海外市…

使用SQLServer配置管理器配置SQLServer数据库引擎实例,以便侦听特定的固定1433端口。...
最近在安装SQLServer2012 SP1的时候,初始安装的情况下开启的是动态端口,为了使远程服务器连接到SQlServer我们需要开启固定的1433端口。 默认的端口状态。 开启的方法 配置相关的SQL实例的网络配置 重启SQLServer服务 查看一下端口状态 转载于:https://b…

P1194 买礼物
P1194 买礼物 题目描述 又到了一年一度的明明生日了,明明想要买B样东西,巧的是,这B样东西价格都是A元。 但是,商店老板说最近有促销活动,也就是: 如果你买了第I样东西,再买第J样,那么…

.NET 框架中的 WMI 命名空间
.NET 框架中的WMI 命名空间.NET框架中与WMI规范有关的命名空间有两个,分别是System.Management和System.Management.Instrumentation两个命名空间。其中System.Managemen命名空间提供的类对象为访问各种管理对象提供了面向对象的编程接口,而System.Management.Instr…

一个已经存在 10 年,却被严重低估的库!
来源 | 写代码的明哥头图 | 下载于视觉中国今天介绍的是一个已经存在十三年,但是依旧不红的库 decorator,好像很少有人知道他的存在一样。这个库可以帮你做什么呢 ?其实很简单,就是可以帮你更方便地写 python 装饰器代码ÿ…

linux_shell 第一章 变量
2019独角兽企业重金招聘Python工程师标准>>> #!/bin/sh //解释器 a"1"; //对a进行赋值,等号两边不能有空格,以冒号("")方式传入,变量不需要先定义即可使用 b"2;" string"…

让vim不要自动添加新的注释行
vim里面有一个特性,如果你在一行注释后新加一行,vim会自动在下一行的开始位置添加注释符号。例如对于C/C来说 //This is a comment line// 第二行的"//"符号就是vim自动添加的。如果是在大量编写注释,…

WMI使用技巧集
WMI使用技巧集 很多的朋友对WMI可能见过但理解不深,我也是十分想了解关于WMI的知识,可一直找不对太合适的资料,在网上的一些资料不是有很多错误,就是讲解不清,我有空的时候将关于WMI的知识集中一下,放在这…

如果不被吐槽,那我还是程序员吗
一组漫画看看中美两国程序员的差别网友:不能更形象了... 本文原创公众号:不会笑青年 60专家,13个技术领域,CSDN 《IT 人才成长路线图》重磅来袭!直接扫码或微信搜索「CSDN」公众号,后台回复关键词「路线图」…

Symantec BE 12.5 备份Exchange错误排除
备份时,提示以下错误:最终错误: 0xe0008703 - 作业失败于自身测试运行。解决方法:先备份本地的很小的文件(不是测试备份),成功后,再测试Exchange的备份。以下是官网的详细解答。http://www.syma…

oc75--不可变字典NSDictionary
// // main.m // NSDictionary // //#import <Foundation/Foundation.h>int main(int argc, const char * argv[]) {// 1.如何创建NSDictionary *dict1 [NSDictionary dictionaryWithObject:"lnj" forKey:"name"];NSString *name1 [dict1 object…

特殊SQL语句及优化原则
1.按姓氏笔画排序:Select * From TableName Order By CustomerName Collate Chinese_PRC_Stroke_ci_as 2.数据库加密:select encrypt(原始密码)select pwdencrypt(原始密码)select pwdcompare(原始密码,加密后密码) 1--相同;否则不相同 encrypt(原始密码)select pw…

以AI制作AI,当AutoML加入AI研究员内卷大潮
导读:「深度赋智」首推以知识驱动的全自动机器学习架构,应用于2020四月结束的国际自动机器学习领域的顶级赛事 NeurIPS-AutoDL竞赛,并以压倒性优势获得世界冠军,相关论文于近日被人工智能顶刊IEEE TPAMI接收。 「深度赋智」一直专…

oracle 导入数据
1.在数据库中建立实例数据库之后,运行cmd 2.键入 imp空格(实例数据库名)/(实例数据库口令)空格file“拖入数据地址” 比如czt.dmp文件直接拖进去(空格)fully 3.按enter建转载于:https://www.cnblogs.com/dieyaxianju/p/3593522.html

C#隐藏手机号中间四位为*
使用正则:Regex.Replace(手机号, "(\\d{3})\\d{4}(\\d{4})", "$1****$2"); 效果:

FTP命令大全
文件传输软件的使用格式为:FTP<FTP地址>,若连 接成功,系统将提示用户输入用户名及口令:LOGIN: (输入合法的用户名或者“ANONMOUS”):PASSWORD: (输入合法的口令,若以“ANONMOU…

ecshop 缓存
2019独角兽企业重金招聘Python工程师标准>>> 1、加缓存: if ($act list) {$cache_id event_list;/* 如果没有缓存,生成缓存 */if (!$smarty->is_cached(event.dwt, $cache_id)){$smarty->assign(page_title, 限量抢购_.$GLOBALS[_CFG…

打造数字原生引擎,易捷行云EasyStack发布新一代全栈信创云
作为新基建的基石,信息技术应用创新产业正迎来黄金发展期。作为企业数字化转型的核心平台, 信创云对下承载包括芯片、整机、操作系统等软硬件基础设施,对上支撑大数据、人工智能、物联网、5G等新一代企业级应用,在整个信创产业链体系中起到承…

第一章 软件自动化测试的基础知识
测试工具以及测试方法并不能代表自动化测试,大多数人提到自动化测试,都会说会使用什么工具或者什么技术,这完全是错误的,和我在刚接触的时候一样,以为掌握了Selenium/QTP就以为自己是一名自动化测试工程师了࿰…

Request.ServerVariables获取环境变量
Request.ServerVariables("HTTP_X_FORWARDED_FOR") 透过代理服务器取得客户端的真实IP地址,有些用此方法读取到的仍然是代理服务器的IP。还有一点需要注意的是:如果客户端没有通过代理服务器来访问,那么取到的值将是空的。 Request…

Java虚拟机JVM学习06 自定义类加载器 父委托机制和命名空间的再讨论
Java虚拟机JVM学习06 自定义类加载器 父委托机制和命名空间的再讨论 创建用户自定义的类加载器 要创建用户自定义的类加载器,只需要扩展java.lang.ClassLoader类,然后覆盖它的findClass(String name)方法即可,该方法根据参数指定的类的名字&a…

腾讯千帆战略升级,推出企业应用连接器
4月26日,腾讯在北京举行“2021腾讯千帆战略发布会”,解读其SaaS生态战略,并面向行业和客户发布了“企业应用连接器”。 2019年,腾讯发布千帆计划1.0,两年之后,这个涵盖腾讯SaaS生态的计划已经进化到2.0。与…

游戏角度分析产品
2019独角兽企业重金招聘Python工程师标准>>> 游戏角度分析 1:减少用户时间成本 - 碎片化的时间可玩 2:减少用户学习成本 - 操作够简单 3:增强用户的范围 - 操作够简单 -> 儿童,女生大量增加 4:增强用户骚浪体验 - 炫耀的快感 5:增强游戏物品的稀确性 - 花钱也买不…

EXCEL数据导入数据库
1、类设计,EXCEL要据配置读入DATASET using System;using System.Data;using System.Collections;using System.Data.OleDb; namespace HKH.Common{ /// <summary> /// Excel 表格中 列标头 与 列索引 的对应转换 /// </summary> /// <remarks>…

免费正则表达式辅助工具(转)
免费正则表达式辅助工具 前段时间由于工作需要,学了一天的正则表达式,发现正则表达式功能实在是强大,但是也很奇怪,刚接触会很不习惯。我不需要很深入地了解,所以也没学多久,不过找了几款很不错的免费的正则…

@所有人,CSDN 粉丝专属福利来啦!
属于CSDN粉丝专属福利来了!不一样的专属福利,只属于少数人的免费计算资源!即日起,并行科技联袂CSDN针对社区粉丝,推出“免费算力限时领”活动,新用户填写表单,即可获得“5000核时CPU或500元卡时…

算法:快速排序实现 定制比较函数
1. 快速排序基本算法 1 #include<stdio.h>2 const static int NUM 47; 3 4 int quick_sort(int *a, int start, int end){5 if (start > end) 6 return 0; 7 8 int partition a[start]; //分割点value, 设置为第一个点.最后patition点设置为这个…

人民币大小写转换
using System;using System.Text;using System.Text.RegularExpressions; namespace HKH.Common{ /// <summary> /// 人民币大小写格式转换 /// </summary> /// <remarks> Create By Lwt on 2006/09/23 /// </remarks> public class clsRMB { privat…