简单版 直接打开日志文件,往另外一个文件中按照要过滤的要求进行过滤 import io;with open(a.txt, w) as f: for line in open(c:/201509.txt): if line.find(更改项目)0 and line.find(500)0: f.write(line+\n);print(输出完成); 注意.find返回的是字符串在
简单版
直接打开日志文件,往另外一个文件中按照要过滤的要求进行过滤
注意.find返回的是字符串在目标的第几位,要和0作比较 另外使用and而不是&&作为"和",使用or而不是||作为"或" w是写,r是读,a是追加
读取utf-8带bom的文件 微软会在在 UTF-8 文件中放置 BOM头(顺便提一下:把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明,这也是微软的习惯。不含BOM的UTF-8才是标准形式,UTF-8不需要BOM,带BOM的UTF-8文件的开头会有U+FEFF,所以Windows新建的空文件会有3字节的大小。
注意编码格式是utf_8_sig 对多个文件进行过滤,可以借助其名称的规律,遍历文件之后
清洗数据同时记录订单号并排序
清洗sql文件,将数据表名放入excel中 安装openpyxl
安装之后就可以进行sql建表语句的过滤了,将所有的表名和注释写入我们的excel文件中。
总结 人生苦短,我用 Python,在强大的第三方库帮助下,我们只需很少的代码就可以实现很大数据量的文件的清洗。 |
2019-06-18
2019-07-04
2021-05-23
2021-05-27
2021-05-27