Merge remote branch 'martins/ganesha'
[obnox/ctdb.git] / config / ctdb.init
1 #!/bin/sh
2 #
3 ##############################
4 # ctdb:                        Starts the clustered tdb daemon
5 #
6 # chkconfig:           - 90 01
7 #
8 # description:                 Starts and stops the clustered tdb daemon
9 # pidfile:             /var/run/ctdbd/ctdbd.pid
10 #
11
12 ### BEGIN INIT INFO
13 # Provides:            ctdb
14 # Required-Start:      $network
15 # Required-Stop:       $network
16 # Default-Stop:
17 # Default-Start:       3 5
18 # Short-Description:   start and stop ctdb service
19 # Description:         initscript for the ctdb service
20 ### END INIT INFO
21
22 # Source function library.
23 if [ -f /etc/init.d/functions ] ; then
24     . /etc/init.d/functions
25 elif [ -f /etc/rc.d/init.d/functions ] ; then
26     . /etc/rc.d/init.d/functions
27 fi
28
29 [ -f /etc/rc.status ] && {
30     . /etc/rc.status
31     rc_reset
32     LC_ALL=en_US.UTF-8
33 }
34
35 # Avoid using root's TMPDIR
36 unset TMPDIR
37
38 [ -z "$CTDB_BASE" ] && {
39     export CTDB_BASE="/etc/ctdb"
40 }
41
42 . $CTDB_BASE/functions
43 loadconfig network
44 loadconfig ctdb
45
46 # check networking is up (for redhat)
47 [ "$NETWORKING" = "no" ] && exit 0
48
49 detect_init_style
50 export CTDB_INIT_STYLE
51
52 ctdbd=${CTDBD:-/usr/sbin/ctdbd}
53
54 if [ "$CTDB_VALGRIND" = "yes" ]; then
55     init_style="valgrind"
56 else
57     init_style="$CTDB_INIT_STYLE"
58 fi
59
60 build_ctdb_options () {
61
62     maybe_set () {
63         # If the 2nd arg is null then return - don't set anything.
64         # Else if the 3rd arg is set and it doesn't match the 2nd arg
65         # then return
66         [ -z "$2" -o \( -n "$3" -a "$3" != "$2" \) ] && return
67
68         val="'$2'"
69         case "$1" in
70             --*) sep="=" ;;
71             -*)  sep=" " ;;
72         esac
73         # For these options we're only passing a value-less flag.
74         [ -n "$3" ] && {
75             val=""
76             sep=""
77         }
78
79         CTDB_OPTIONS="${CTDB_OPTIONS}${CTDB_OPTIONS:+ }${1}${sep}${val}"
80     }
81
82     [ -z "$CTDB_RECOVERY_LOCK" ] && {
83         echo "No recovery lock specified. Starting CTDB without split brain prevention"
84     }
85     maybe_set "--reclock"                "$CTDB_RECOVERY_LOCK"
86
87     # build up CTDB_OPTIONS variable from optional parameters
88     maybe_set "--logfile"                "$CTDB_LOGFILE"
89     maybe_set "--nlist"                  "$CTDB_NODES"
90     maybe_set "--socket"                 "$CTDB_SOCKET"
91     maybe_set "--public-addresses"       "$CTDB_PUBLIC_ADDRESSES"
92     maybe_set "--public-interface"       "$CTDB_PUBLIC_INTERFACE"
93     maybe_set "--dbdir"                  "$CTDB_DBDIR"
94     maybe_set "--dbdir-persistent"       "$CTDB_DBDIR_PERSISTENT"
95     maybe_set "--event-script-dir"       "$CTDB_EVENT_SCRIPT_DIR"
96     maybe_set "--transport"              "$CTDB_TRANSPORT"
97     maybe_set "-d"                       "$CTDB_DEBUGLEVEL"
98     maybe_set "--debug-hung-script"      "$CTDB_DEBUG_HUNG_SCRIPT"
99     maybe_set "--notification-script"    "$CTDB_NOTIFY_SCRIPT"
100     maybe_set "--start-as-disabled"      "$CTDB_START_AS_DISABLED"    "yes"
101     maybe_set "--start-as-stopped "      "$CTDB_START_AS_STOPPED"     "yes"
102     maybe_set "--no-recmaster"           "$CTDB_CAPABILITY_RECMASTER" "no"
103     maybe_set "--no-lmaster"             "$CTDB_CAPABILITY_LMASTER"   "no"
104     maybe_set "--lvs --single-public-ip" "$CTDB_LVS_PUBLIC_IP"
105     maybe_set "--script-log-level"       "$CTDB_SCRIPT_LOG_LEVEL"
106     maybe_set "--log-ringbuf-size"       "$CTDB_LOG_RINGBUF_SIZE"
107     maybe_set "--syslog"                 "$CTDB_SYSLOG"               "yes"
108     maybe_set "--max-persistent-check-errors" "$CTDB_MAX_PERSISTENT_CHECK_ERRORS"
109 }
110
111 # Log given message or stdin to either syslog or a CTDB log file
112 do_log ()
113 {
114     if [ "$CTDB_SYSLOG" = "yes" -o \
115         "${CTDB_OPTIONS#*--syslog}" != "$CTDB_OPTIONS" ] ; then
116
117         logger -t "ctdb.init" "$@"
118     else
119         _l="${CTDB_LOGFILE:-/var/log/log.ctdb}"
120         {
121             date
122             if [ -n "$*" ] ; then
123                 echo "$*"
124             else
125                 cat
126             fi
127         } >>"$_l"
128     fi
129 }
130
131 select_tdb_checker ()
132 {
133     # Find the best TDB consistency check available.
134     use_tdb_tool_check=false
135     if [ -x /usr/bin/tdbtool ] && \
136         echo "help" | /usr/bin/tdbtool | grep -q check ; then
137
138         use_tdb_tool_check=true
139     elif [ -x /usr/bin/tdbtool -a -x /usr/bin/tdbdump ] ; then
140             do_log <<EOF
141 WARNING: The installed 'tdbtool' does not offer the 'check' subcommand.
142  Using 'tdbdump' for database checks.
143  Consider updating 'tdbtool' for better checks!
144 EOF
145     elif [ -x /usr/bin/tdbdump ] ; then
146         do_log <<EOF
147 WARNING: 'tdbtool' is not available.
148  Using 'tdbdump' to check the databases.
149  Consider installing a recent 'tdbtool' for better checks!
150 EOF
151     else
152         do_log <<EOF
153 WARNING: Cannot check databases since neither
154  'tdbdump' nor 'tdbtool check' is available.
155  Consider installing tdbtool or at least tdbdump!
156 EOF
157         return 1
158     fi
159 }
160
161 check_tdb ()
162 {
163     _db="$1"
164
165     if $use_tdb_tool_check ; then
166         # tdbtool always exits with 0  :-(
167         if tdbtool "$_db" check 2>/dev/null |
168             grep -q "Database integrity is OK" ; then
169             return 0
170         else
171             return 1
172         fi
173     else
174         tdbdump "$_db" >/dev/null 2>/dev/null
175         return $?
176     fi
177 }
178
179 check_persistent_databases ()
180 {
181     _dir="${CTDB_DBDIR_PERSISTENT:-${CTDB_DBDIR:-/var/ctdb}/persistent}"
182     mkdir -p "$_dir" 2>/dev/null
183
184     [ "${CTDB_MAX_PERSISTENT_CHECK_ERRORS:-0}" = "0" ] || return 0
185
186     for _db in $(ls "$_dir/"*.tdb.*[0-9] 2>/dev/null) ; do
187         check_tdb $_db || {
188             do_log "Persistent database $_db is corrupted! CTDB will not start."
189             return 1
190         }
191     done
192 }
193
194 check_non_persistent_databases ()
195 {
196     _dir="${CTDB_DBDIR:-/var/ctdb}"
197     mkdir -p "$_dir" 2>/dev/null
198
199     for _db in $(ls "${_dir}/"*.tdb.*[0-9] 2>/dev/null) ; do
200         check_tdb $_db || {
201             _backup="${_db}.$(date +'%Y%m%d.%H%M%S.%N').corrupt"
202             do_log <<EOF
203 WARNING: database ${_db} is corrupted.
204  Moving to backup ${_backup} for later analysis.
205 EOF
206             mv "$_db" "$_backup"
207
208             # Now remove excess backups
209             ls -td "${_db}."*".corrupt" |
210             tail -n +$((${CTDB_MAX_CORRUPT_DB_BACKUPS:-10} + 1)) |
211             xargs rm -f
212             
213         }
214     done
215 }
216
217 set_ctdb_variables () {
218     # set any tunables from the config file
219     set | grep ^CTDB_SET_ | cut -d_ -f3- | 
220     while read v; do
221         varname=`echo $v | cut -d= -f1`
222         value=`echo $v | cut -d= -f2`
223         ctdb setvar $varname $value || RETVAL=1
224     done || exit 1
225 }
226
227 set_retval() {
228     return $1
229 }
230
231 wait_until_ready () {
232     _timeout="${1:-10}" # default is 10 seconds
233
234     _count=0
235     while ! ctdb ping >/dev/null 2>&1 ; do
236         if [ $_count -ge $_timeout ] ; then
237             return 1
238         fi
239         sleep 1
240         _count=$(($_count + 1))
241     done
242 }
243
244 ctdbd=${CTDBD:-/usr/sbin/ctdbd}
245
246 drop_all_public_ips() {
247     [ -z "$CTDB_PUBLIC_ADDRESSES" ] && {
248         return
249     }
250
251     cat $CTDB_PUBLIC_ADDRESSES | while read IP IFACE REST; do
252         ip addr del $IP dev $IFACE >/dev/null 2>/dev/null
253     done
254 }
255
256 start() {
257     echo -n $"Starting ctdbd service: "
258
259     ctdb ping >/dev/null 2>&1 && {
260         echo $"CTDB is already running"
261         return 0
262     }
263
264     build_ctdb_options
265
266     # make sure we drop any ips that might still be held if previous
267     # instance of ctdb got killed with -9 or similar
268     drop_all_public_ips
269
270     if select_tdb_checker ; then
271         check_persistent_databases || return $?
272         check_non_persistent_databases
273     fi
274
275     if [ "$CTDB_SUPPRESS_COREFILE" = "yes" ]; then
276         ulimit -c 0
277     else
278         ulimit -c unlimited
279     fi
280
281     case $init_style in
282         valgrind)
283             eval valgrind -q --log-file=/var/log/ctdb_valgrind \
284                 $ctdbd --valgrinding "$CTDB_OPTIONS"
285             RETVAL=$?
286             echo
287             ;;
288         suse)
289             eval startproc $ctdbd "$CTDB_OPTIONS"
290             RETVAL=$?
291             ;;
292         redhat)
293             eval $ctdbd "$CTDB_OPTIONS"
294             RETVAL=$?
295             [ $RETVAL -eq 0 ] && touch /var/lock/subsys/ctdb || RETVAL=1
296             ;;
297         debian)
298             eval start-stop-daemon --start --quiet --background \
299                 --exec $ctdbd -- "$CTDB_OPTIONS"
300             RETVAL=$?
301             ;;
302     esac
303
304     if [ $RETVAL -eq 0 ] ; then
305         if wait_until_ready ; then
306             set_ctdb_variables
307         else
308             RETVAL=1
309             pkill -9 -f $ctdbd >/dev/null 2>&1
310         fi
311     fi
312
313     case $init_style in
314         suse)
315             set_retval $RETVAL
316             rc_status -v
317             ;;
318         redhat)
319             [ $RETVAL -eq 0 ] && success || failure
320             echo
321             ;;
322     esac
323
324     return $RETVAL
325 }
326
327 stop() {
328     echo -n $"Shutting down ctdbd service: "
329     pkill -0 -f $ctdbd || {
330         echo -n "  Warning: ctdbd not running ! "
331         case $init_style in
332             suse)
333                 rc_status -v
334                 ;;
335             redhat)
336                 echo ""
337                 ;;
338         esac
339         return 0
340     }
341     ctdb shutdown >/dev/null 2>&1
342     RETVAL=$?
343     count=0
344     while pkill -0 -f $ctdbd ; do
345         sleep 1
346         count=$(($count + 1))
347         [ $count -gt 30 ] && {
348             echo -n $"killing ctdbd "
349             pkill -9 -f $ctdbd
350             pkill -9 -f $CTDB_BASE/events.d/
351         }
352     done
353     # make sure all ips are dropped, pfkill -9 might leave them hanging around
354     drop_all_public_ips
355
356     case $init_style in
357         suse)
358             # re-set the return code to the recorded RETVAL in order
359             # to print the correct status message
360             set_retval $RETVAL
361             rc_status -v
362             ;;
363         redhat)
364             [ $RETVAL -eq 0 ] && success || failure
365             [ $RETVAL -eq 0 ] && rm -f /var/lock/subsys/ctdb
366             echo ""
367             ;;
368     esac
369
370     return $RETVAL
371 }
372
373 restart() {
374     stop
375     start
376 }
377
378 status() {
379     echo -n $"Checking for ctdbd service: "
380     ctdb ping >/dev/null 2>&1 || {
381         RETVAL=$?
382         echo -n "  ctdbd not running. "
383         case $init_style in
384             suse)
385                 set_retval $RETVAL
386                 rc_status -v
387                 ;;
388             redhat)
389                 if [ -f /var/lock/subsys/ctdb ]; then
390                         echo $"ctdb dead but subsys locked"
391                         RETVAL=2
392                 else
393                         echo $"ctdb is stopped"
394                         RETVAL=3
395                 fi
396                 ;;
397         esac
398         return $RETVAL
399     }
400     echo ""
401     ctdb status
402 }
403
404
405 [ -f "$CTDB_BASE/rc.ctdb" ] && "$CTDB_BASE/rc.ctdb" $1
406
407 case "$1" in
408     start)
409         start
410         ;;
411     stop)
412         stop
413         ;;
414     restart|reload|force-reload)
415         restart
416         ;;
417     status)
418         status
419         ;;
420     condrestart|try-restart)
421         ctdb status > /dev/null && restart || :
422         ;;
423     cron)
424         # used from cron to auto-restart ctdb
425         ctdb status > /dev/null || restart
426         ;;
427     *)
428         echo $"Usage: $0 {start|stop|restart|reload|force-reload|status|cron|condrestart|try-restart}"
429         exit 1
430 esac
431
432 exit $?