Initial commit

This commit is contained in:
Zhongwei Li
2025-11-29 18:24:37 +08:00
commit 8cd5c7679d
61 changed files with 6788 additions and 0 deletions

View File

@@ -0,0 +1,88 @@
tool_id: BASH-ANALYZE-LOGS-002
tool_name: "日志分析器"
基本信息:
语言: bash
文件: analyze-logs.sh
复杂度: level-2
创建日期: 2025-11-14
作者: CodeConscious
用途分类:
- DATA # 数据分析
- MONITOR # 监控诊断
功能描述:
简介: "分析日志文件,按级别过滤、时间范围筛选、模式匹配和错误统计"
详细: |
支持功能:
- 按日志级别统计ERROR/WARN/INFO/DEBUG
- 按关键词模式搜索(正则表达式)
- 错误模式识别(超时、连接错误、内存问题)
- 统计汇总和建议生成
- 支持时间范围筛选(需要日志包含日期)
使用场景:
- "分析生产环境错误日志,找到崩溃原因"
- "统计API接口错误频率和类型分布"
- "监控服务健康状况,识别异常模式"
- "排查性能问题,定位慢请求和超时"
- "验证修复效果,比较修复前后的日志"
使用方法:
命令: "bash analyze-logs.sh <日志文件> [模式] [级别] [日期范围]"
参数:
日志文件: "日志文件路径(必需)"
模式: "要搜索的正则表达式(可选)"
级别: "日志级别: ERROR/WARN/INFO/DEBUG默认: INFO"
日期范围: "日期范围, 如: 2025-11-01~2025-11-14可选需要日志包含日期"
示例:
- "分析应用日志: bash analyze-logs.sh /var/log/app.log"
- "搜索错误: bash analyze-logs.sh /var/log/app.log 'timeout|error' ERROR"
- "按时间筛选: bash analyze-logs.sh /var/log/app.log 'database' WARN 2025-11-01~2025-11-07"
依赖要求:
系统命令:
- bash: 支持bash 4.0+
- awk: 文本处理
- grep: 模式匹配
- wc: 计数
- du: 文件大小
输入输出:
输入:
- 类型: 文本文件
- 格式: 任意日志格式(支持自定义分析)
- 示例: |
2025-11-14 10:30:00 [INFO] User login successful
2025-11-14 10:30:01 [ERROR] Database connection timeout
2025-11-14 10:30:02 [WARN] High memory usage: 85%
输出:
- stdout: 统计摘要、错误分析、建议
- 格式: 人类可读文本 + 颜色高亮
上次使用:
时间: 2025-11-14 11:00:00
用途: "分析auth-service崩溃日志找到连接池配置问题"
结果: "成功识别47次超时错误12次连接数过多错误定位到连接池不足问题"
满意度: 0.95
相关工具:
- 前置工具:
- 互补工具:
- toolkit/bash/system/check-service.sh服务健康检查
- toolkit/python/analysis/analyze_logs.py复杂日志解析
- 替代工具:
- grep + wc手动统计
维护记录:
2025-11-14:
- 初始创建
- 支持级别统计、模式匹配、错误模式识别
2025-11-15:
- 添加时间范围筛选功能(实验性)
- 优化颜色输出
TODO:
- 支持JSON日志格式解析
- 添加图表可视化ASCII
- 支持日志文件压缩格式(.gz

View File

@@ -0,0 +1,171 @@
#!/bin/bash
# 日志分析器 - 从日志文件中提取和分析信息
set -e
LOG_FILE="${1:-}"
PATTERN="${2:-}"
LEVEL="${3:-INFO}"
DATE_RANGE="${4:-}"
# 颜色输出
RED='\033[0;31m'
GREEN='\033[0;32m'
YELLOW='\033[1;33m'
BLUE='\033[0;34m'
NC='\033[0m' # No Color
# 帮助信息
usage() {
echo "📝 日志分析器"
echo ""
echo "使用: $0 <日志文件> [模式] [级别] [日期范围]"
echo ""
echo "参数:"
echo " 日志文件 日志文件路径 (必需)"
echo " 模式 要搜索的正则表达式 (可选)"
echo " 级别 日志级别: ERROR/WARN/INFO/DEBUG (默认: INFO)"
echo " 日期范围 日期范围, 如: 2025-11-01~2025-11-14 (可选)"
echo ""
echo "示例:"
echo " $0 /var/log/app.log"
echo " $0 /var/log/app.log 'timeout|error' ERROR"
echo " $0 /var/log/app.log 'database' WARN 2025-11-01~2025-11-07"
echo ""
}
# 检查参数
if [ -z "$LOG_FILE" ]; then
echo "❌ 错误: 请提供日志文件路径"
usage
exit 1
fi
if [ ! -f "$LOG_FILE" ]; then
echo "❌ 错误: 文件不存在: $LOG_FILE"
exit 1
fi
echo "📝 日志分析器"
echo "=========================================="
echo "文件: ${BLUE}$LOG_FILE${NC}"
echo "大小: $(du -h "$LOG_FILE" | cut -f1)"
echo "行数: $(wc -l < "$LOG_FILE")"
echo "=========================================="
# 按级别过滤
echo ""
echo "📊 按级别统计:"
echo "=========================================="
ERROR_COUNT=$(grep -c "ERROR" "$LOG_FILE" 2>/dev/null || echo "0")
WARN_COUNT=$(grep -c "WARN" "$LOG_FILE" 2>/dev/null || echo "0")
INFO_COUNT=$(grep -c "INFO" "$LOG_FILE" 2>/dev/null || echo "0")
DEBUG_COUNT=$(grep -c "DEBUG" "$LOG_FILE" 2>/dev/null || echo "0")
echo -e " ${RED}ERROR${NC}: $ERROR_COUNT"
echo -e " ${YELLOW}WARN${NC}: $WARN_COUNT"
echo -e " ${GREEN}INFO${NC}: $INFO_COUNT"
echo -e " ${BLUE}DEBUG${NC}: $DEBUG_COUNT"
# 展示特定级别的日志
echo ""
echo "=========================================="
echo "📋 ${LEVEL} 级别日志 (前10条):"
echo "=========================================="
grep "$LEVEL" "$LOG_FILE" | head -10
# 模式匹配
if [ -n "$PATTERN" ]; then
echo ""
echo "=========================================="
echo "🔍 匹配模式 '${PATTERN}':"
echo "=========================================="
MATCH_COUNT=$(grep -c "$PATTERN" "$LOG_FILE" 2>/dev/null || echo "0")
echo "匹配数量: $MATCH_COUNT"
echo ""
echo "示例:"
grep "$PATTERN" "$LOG_FILE" | head -5
fi
# 时间范围
check_date_range() {
if [ -n "$DATE_RANGE" ]; then
START_DATE=$(echo "$DATE_RANGE" | cut -d'~' -f1)
END_DATE=$(echo "$DATE_RANGE" | cut -d'~' -f2)
echo ""
echo "=========================================="
echo "📅 时间范围 $START_DATE ~ $END_DATE:"
echo "=========================================="
# 简单的日期过滤(假设日志包含日期)
awk -v start="$START_DATE" -v end="$END_DATE" '
$0 >= start && $0 <= end {
print $0
}' "$LOG_FILE" | head -10
fi
}
check_date_range
# 常见错误模式分析
echo ""
echo "=========================================="
echo "⚠️ 常见错误模式分析:"
echo "=========================================="
# 超时错误
TIMEOUT_COUNT=$(grep -c "timeout\|Timeout\|TIMEOUT" "$LOG_FILE" 2>/dev/null || echo "0")
if [ "$TIMEOUT_COUNT" -gt 0 ]; then
echo -e "⏱️ 超时错误: ${RED}$TIMEOUT_COUNT${NC}"
fi
# 连接错误
CONN_ERROR_COUNT=$(grep -c "connection refused\|Connection refused\|ECONNREFUSED" "$LOG_FILE" 2>/dev/null || echo "0")
if [ "$CONN_ERROR_COUNT" -gt 0 ]; then
echo -e "🔗 连接错误: ${RED}$CONN_ERROR_COUNT${NC}"
fi
# 内存错误
MEMORY_ERROR_COUNT=$(grep -c "OutOfMemory\|memory\|Memory" "$LOG_FILE" 2>/dev/null || echo "0")
if [ "$MEMORY_ERROR_COUNT" -gt 0 ]; then
echo -e "🧠 内存问题: ${RED}$MEMORY_ERROR_COUNT${NC}"
fi
# 总结
echo ""
echo "=========================================="
echo "📊 统计总结:"
echo "=========================================="
echo "总错误数: $((ERROR_COUNT + WARN_COUNT))"
echo "关键错误数: $ERROR_COUNT"
if [ -n "$PATTERN" ]; then
echo "模式'$PATTERN'匹配: $MATCH_COUNT"
fi
echo ""
echo "=========================================="
echo "💡 建议:"
echo "=========================================="
if [ "$ERROR_COUNT" -gt 10 ]; then
echo " - ⚠️ ERROR数量较多建议立即调查"
fi
if [ "$TIMEOUT_COUNT" -gt 5 ]; then
echo " - ⚠️ 频繁超时,检查网络或服务响应"
fi
if [ "$CONN_ERROR_COUNT" -gt 3 ]; then
echo " - ⚠️ 连接问题,验证服务状态和配置"
fi
if [ "$ERROR_COUNT" -le 5 ] && [ "$WARN_COUNT" -le 10 ]; then
echo " - ✅ 日志健康状况良好"
fi
echo ""
echo "=========================================="
echo "日志分析完成"
echo "=========================================="