Both nfs and nfslock scripts can fail under redhat in very rare situations.
[metze/ctdb/wip.git] / config / events.d / 60.nfs
1 #!/bin/sh
2 # script to manage nfs in a clustered environment
3
4 start_nfs() {
5         /bin/mkdir -p $CTDB_VARDIR/state/nfs
6         /bin/mkdir -p $CTDB_VARDIR/state/statd/ip
7         startstop_nfs stop
8         startstop_nfs start
9         echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle
10 }
11
12 . $CTDB_BASE/functions
13
14 service_name="nfs"
15 service_start="start_nfs"
16 service_stop="startstop_nfs stop"
17
18 loadconfig
19
20 ctdb_start_stop_service
21
22 case "$1" in 
23      init)
24         # read statd from persistent database
25         ;;
26      startup)
27         ctdb_service_start
28         mkdir -p $CTDB_VARDIR/state/statd
29         touch $CTDB_VARDIR/state/statd/update-trigger
30         ;;
31
32      shutdown)
33         ctdb_service_stop
34         ;;
35
36      takeip)
37         ctdb_service_set_reconfigure
38         ;;
39
40      releaseip)
41         ctdb_service_set_reconfigure
42         ;;
43
44       monitor)
45         if ctdb_service_needs_reconfigure ; then
46             ctdb_service_reconfigure
47             exit 0
48         fi
49
50         update_tickles 2049
51
52         # check that statd responds to rpc requests
53         # if statd is not running we try to restart it
54         rpcinfo -u localhost 100024 1 > /dev/null || {
55                 RPCSTATDOPTS=""
56                 [ -n "$STATD_HOSTNAME" ] && RPCSTATDOPTS="$RPCSTATDOPTS -n $STATD_HOSTNAME"
57                 [ -n "$STATD_PORT" ] && RPCSTATDOPTS="$RPCSTATDOPTS -p $STATD_PORT"
58                 [ -n "$STATD_OUTGOING_PORT" ] && RPCSTATDOPTS="$RPCSTATDOPTS -o $STATD_OUTGOING_PORT"
59                 rpc.statd $RPCSTATDOPTS 
60                 echo "ERROR: STATD is not responding. Trying to restart it. [rpc.statd $RPCSTATDOPTS]"
61         }
62
63
64         # check that NFS responds to rpc requests
65         [ "$CTDB_NFS_SKIP_KNFSD_ALIVE_CHECK" = "yes" ] || {
66             (ctdb_check_rpc "NFS" 100003 3)
67             [ $? = "0" ] || {
68                 echo "Trying to restart NFS service"
69                 startstop_nfs restart
70                 exit 1
71             }
72         }
73
74         # and that its directories are available
75         [ "$CTDB_NFS_SKIP_SHARE_CHECK" = "yes" ] || {
76             exportfs | grep -v '^#' | grep '^/' |
77             sed -e 's/[[:space:]]\+[^[:space:]]*$//' |
78             ctdb_check_directories
79         } || exit $?
80
81         # check that lockd responds to rpc requests
82         (ctdb_check_rpc "lockd" 100021 1)
83         [ $? = "0" ] || {
84                 echo "Trying to restart lock manager service"
85                 startstop_nfs restart
86                 startstop_nfslock restart
87                 exit 1
88         }
89
90         # mount needs special handling since it is sometimes not started
91         # correctly on RHEL5
92         rpcinfo -u localhost 100005 1 > /dev/null || {
93                 echo "ERROR: MOUNTD is not running. Trying to restart it."
94                 RPCMOUNTDOPTS=""
95                 [ -n "$MOUNTD_PORT" ] && RPCMOUNTDOPTS="$RPCMOUNTDOPTS -p $MOUNTD_PORT"
96                 killall -q -9 rpc.mountd
97                 rpc.mountd $RPCMOUNTDOPTS &
98                 exit 1
99         }
100         # rquotad needs special handling since it is sometimes not started
101         # correctly on RHEL5
102         # this is not a critical service so we dont flag the node as unhealthy
103         rpcinfo -u localhost 100011 1 > /dev/null || {
104                 echo "ERROR: RQUOTAD is not running. Trying to restart it."
105                 RPCRQUOTADOPTS=""
106                 [ -n "$RQUOTAD_PORT" ] && RPCRQUOTADOPTS="$RPCRQUOTADOPTS -p $RQUOTAD_PORT"
107                 killall -q -9 rpc.rquotad
108                 rpc.rquotad $RPCRQUOTADOPTS &
109         }
110
111         # once every 60 seconds, update the statd state database for which
112         # clients need notifications
113         LAST_UPDATE=`stat --printf="%Y" $CTDB_VARDIR/state/statd/update-trigger`
114         CURRENT_TIME=`date +"%s"`
115         expr "$CURRENT_TIME" ">" "(" "$LAST_UPDATE" "+" "60" ")" >/dev/null 2>/dev/null
116         [ $? = "0" ] && {
117             mkdir -p $CTDB_VARDIR/state/statd
118             touch $CTDB_VARDIR/state/statd/update-trigger
119             $CTDB_BASE/statd-callout updatelocal &
120             $CTDB_BASE/statd-callout updateremote &
121         }
122         ;;
123
124     ipreallocated)
125         # if the ips have been reallocated, we must restart the lockmanager
126         # across all nodes and ping all statd listeners
127         [ -x $CTDB_BASE/statd-callout ] && {
128                 $CTDB_BASE/statd-callout notify &
129         } >/dev/null 2>&1
130         ;;
131     *)
132         ctdb_standard_event_handler "$@"
133         ;;
134 esac
135
136 exit 0