招聘兼职:一个比较复杂的apache日志分析模块

招聘兼职

Golang完成一个Apache日志分析工具,日志格式是自定义的,分析的结果也是自定义的。

软件功能综述

根据配置文件解析日志配置文件类似ini,联系最后后发给你。

命令行参数

  1. 需要记录的信息有date、user、ip、filename(下载文件名)、unit(单位,有篇,期刊论文;集,视频;页,考试网页;)。
  2. filename有两类,一类是下载的文件名,这类是下载的pdf、caj、swf等文件;有时候是页面标题
  3. 同一个用户在30秒内(是interval参数指定的30s),下载同一篇文章或访问同一个页面,所一次有效记录。
  4. 默认解析日志时间范围为昨天一整天。
  • 昨天的日志可能横跨两个文件log_2015-06-09.log和log_2015-06-10.log.(apache日志bug,6.9靠近23:55分之后的日志可能会写入到log_2015-06-10.log文件中)

参数:

  1. -n,—name 指定ini文件中的对应域,不指定解析所有存在的域
  2. -f,—file 指定单个日志文件
  3. -d,—dir 指定一个目录下的所有日志文件
  4. —date-start 指定开始日期,含开始日期,默认开始日期为昨天开始
  5. —date-end 指定结束日期,不含结束日期,默认结束日期为今天开始
  6. -s,—save-file 指定保存文件,指定了保存文件的,同时保存分析结果到文件,如果是search类,保存文件名在加上search_,例如-s mylog.log,search类就是search_mylog.log
  7. -q,—save-sql true或者false,表明是否保存到数据库
  8. -p,—postfix 域名后缀,例如com
    原始日志中的域名,有些是带有后缀的,如www.163.com解析日志的时候,如果有域名后缀,就把域名后缀去掉。仅保留www.163。

以上部分功能,具体功能联系后发给您

价格面议,联系方式:26365685# $qq.com

共 0 个回复