shell监控网站并发邮件报警
目前网上关于网站存活监控的脚本很多,本站也放过几个,今天给大家再来个ping+curl监控网站并发邮件报警的脚本,我觉得这个脚本的思路很不错,大家有兴趣的可以下来看看.
脚本内容:
cat /root/soft_shell/check-www.sh
放入后台运行:
nohup sh /path/file.sh & #把脚本放到后台运行,程序自己会60秒检查一次网站.
开机自启动:
echo "nohup sh /root/soft_shell/check-www.sh & " >> /etc/rc.local
下面还有个类似的脚本,但他控制了发邮件的频率:
cat /root/soft_shell/check-web.sh
ps:
1.检查网站返回的http_code是否等于200,如不是200视为异常.
2.检查网站的访问时间,超过MAXLOADTIME(10秒)视为异常.
脚本内容:
cat /root/soft_shell/check-www.sh
#!/bin/bash
#Created by haiyun
#set -x
while true
do
list=(blog.slogra.com slogra.com)
mail=rocdk@163.com
date=$(date -d "today" +"%Y-%m-%d-%H:%M:%S")
i=0
id=${#list[*]}
while [ $i -lt $id ]
do
if ping -c1 ${list[$i]} >/dev/null
then
echo $date:服务器${list[$i]}能ping通.
else
if curl -m 10 ${list[$i]} > /dev/null
then
echo $date:服务器${list[$i]} ping不通,能打开网页.
else
echo "您好,据系统监测服务器${list[$i]}不能访问且ping不通,请及时处理!故障发生时间:$date"|mail -s "服务器${list[$i]}不能连接! 故障发生时间:$date" $mail
until
date=$(date -d "today" +"%Y-%m-%d-%H:%M:%S")
ping -c1 ${list[$i]} >/dev/null && echo "恭喜!服务器${list[$i]}已恢复正常,恢复时间:$date"|mail -s "服务器${list[$i]}已恢复正常! 恢复时间:$date" $mail
do
sleep 5
done
fi
fi
let i++
done
sleep 60
done放入后台运行:
nohup sh /path/file.sh & #把脚本放到后台运行,程序自己会60秒检查一次网站.
开机自启动:
echo "nohup sh /root/soft_shell/check-www.sh & " >> /etc/rc.local
下面还有个类似的脚本,但他控制了发邮件的频率:
cat /root/soft_shell/check-web.sh
#!/bin/bash
#Created by jbxue
SITES=("https://blog.slogra.com" "http://slogra.com") # 要监控的网站
NOTICE_EMAIL='me@example.com' # 管理员电邮
MAXLOADTIME=10 # 访问超时时间设置
REMARKFILE='/tmp/monitor_load.remark' # 记录时否发送过通知电邮,如发送过则一小时内不再发送
ISSEND=0 # 是否有发送电邮
EXPIRE=3600 # 每次发送电邮的间隔秒数
NOW=$(date +%s)
if [ -f "$REMARKFILE" ] && [ -s "$REMARKFILE" ]; then
REMARK=$(cat $REMARKFILE)
# 删除过期的电邮发送时间记录文件
if [ $(( $NOW - $REMARK )) -gt "$EXPIRE" ]; then
rm -f ${REMARKFILE}
REMARK=""
fi
else
REMARK=""
fi
# 循环判断每个site
for site in ${SITES[*]}; do
printf "start to load ${site}\n"
site_load_time=$(curl -o /dev/null -s -w "time_connect: %{time_connect}\ntime_starttransfer: %{time_starttransfer}\ntime_total: %{time_total}" "${site}")
site_access=$(curl -o /dev/null -s -w %{http_code} "${site}")
time_total=${site_load_time##*:}
printf "$(date '+%Y-%m-%d %H:%M:%S')\n"
printf "site load time\n${site_load_time}\n"
printf "site access:${site_access}\n\n"
# not send
if [ "$REMARK" = "" ]; then
# check access
if [ "$time_total" = "0.000" ] || [ "$site_access" != "200" ]; then
echo "Subject: ${site} can access $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL}
ISSEND=1
else
# check load time
if [ "${time_total%%.*}" -ge ${MAXLOADTIME} ]; then
echo "Subject: ${site} load time total:${time_total} $(date +%Y-%m-%d' '%H:%M:%S)" | sendmail ${NOTICE_EMAIL}
ISSEND=1
fi
fi
fi
done
# 发送电邮后记录发送时间
if [ "$ISSEND" = "1" ]; then
echo "$(date +%s)" > $REMARKFILE
fi
exit 0 ps:
1.检查网站返回的http_code是否等于200,如不是200视为异常.
2.检查网站的访问时间,超过MAXLOADTIME(10秒)视为异常.
3.发送通知邮件后,在/tmp/monitor_load.remark记录发送时间,在一小时内不重复发送,如一小时后则清空/tmp/monitor_load.remark.
脚本来源:
http://www.jbxue.com/article/15072.html
http://www.haiyun.me/archives/shell-check-server-mail.html


评论: