◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
linux下通过脚本实现自动重启程序的方法
Post by mrchen, 2010-11-11, Views:本文链接地址:http://www.guanwei.org/post/LINUXnotes/11/linux-core-dump.html
无论什么程序都不可能完美无缺,理论上,任何程序都有 Core Dump 的一天,正式运营的程序,尤其是服务器程序,一旦 Core Dump ,后果不堪设想,有过服务器开发经验的朋友,一定都经历过深夜美梦中,被电话惊醒的惨痛经历,手忙脚乱把服务器重新启动,第二天上班还要被老板一顿狠批。所以,程序发生错误时自动重启变得很重要。这里集中讨论 linux 实现自动重启程序的方法。
linux 下实现程序的自动重启有很多方法,这里我们介绍的是通过自己写脚本来实现。
自动重启脚本,假定需要实现重启的程序名为 test ,我们这里通过判断进程数目来判断程序是否正常。
ps -ef | grep "$1" | grep -v "grep" | wc –l 是获取 $1 (本例中为 test )的进程数,脚本根据进程数来决定下一步的操作。通过一个死循环,每隔 1 秒检查一次系统中的指定程序的进程数。
代码如下:
#!/bin/sh
#------------------------------------------------------------------------------
# 函数: CheckProcess
# 功能: 检查一个进程是否存在
# 参数: $1 --- 要检查的进程名称
# 返回: 如果存在返回0, 否则返回1.
#------------------------------------------------------------------------------
CheckProcess(){
# 检查输入的参数是否有效
if [ "$1" = "" ];
then
return 1
fi
#$PROCESS_NUM获取指定进程名的数目,为1返回0,表示正常,不为1返回1,表示有错误,需要重新启动
PROCESS_NUM=`ps -ef | grep "$1" | grep -v "grep" | wc -l`
if [ $PROCESS_NUM -eq 1 ];
then
return 0
else
return 1
fi
}
# 检查test实例是否已经存在
while [ 1 ] ; do
CheckProcess "CheckQQ_RET"
if [ $CheckQQ_RET != 4 ];
then
# 杀死所有test进程,可换任意你需要执行的操作
killall -9 test
exec ./test &
fi
sleep 1
done
脚本start:
加入limit coredumpsize 102400,设置core file的大小,一旦程序Core Dump,有迹可寻。在该脚本中后台执行check脚本,可以省去很多麻烦,
本文未看懂?联系冠威客服,享受手把手服务,远程、现场任您选。优惠期间,免费服务!
有更好的解决方案?联系冠威客服,加入冠威,成为冠威客。发表文章,赚取佣金!
冠威客服:E-mail:Service@GuanWei.Org QQ:1026092
或许你还对下面的文章感兴趣
- Linux系统利用Crontab命令实现定时重启 (2010-11-11 10:49:57)
- Linux系统下网卡网络配置详解 (2010-11-3 17:23:4)
- linux乱码问题:LANG变量的秘诀 (2010-11-3 16:7:20)
- 解决局域网共享的脚本下载+原理说明 (2010-10-13 22:51:19)
- Linux——samba服务器的架设案例 (2010-6-3 19:9:21)
- 一步一学Linux与Windows 共享文件Samba (v0.2b) (2010-6-3 18:23:51)
- Linux中安装perl的LWP模块方法 (2010-5-24 10:36:56)
- linux下perl模块(modules)的安装方法 (2010-5-24 10:12:31)
- Linux中各种语言的helloworld实现 (2010-5-24 9:26:8)
- Linux操作系统下安装Perl脚本语言的方法 (2010-5-23 17:50:49)
