ctdb-scripts: Fix a typo
[obnox/samba/samba-obnox.git] / ctdb / config / ctdbd_wrapper
1 #!/bin/sh
2
3 # ctdbd wrapper - start or stop CTDB
4
5 usage ()
6 {
7     echo "usage: ctdbd_wrapper <pidfile> { start | stop }"
8     exit 1
9 }
10
11 [ $# -eq 2 ] || usage
12
13 pidfile="$1"
14 action="$2"
15
16 ############################################################
17
18 [ -n "$CTDB_BASE" ] || export CTDB_BASE="/etc/ctdb"
19
20 . "${CTDB_BASE}/functions"
21 loadconfig "ctdb"
22
23 export CTDB_SOCKET
24
25 ctdbd="${CTDBD:-/usr/sbin/ctdbd}"
26
27 ############################################################
28
29 # ctdbd_is_running()
30
31 # 1. Check if ctdbd is running.
32 #    - If the PID file is being used then, if the PID file is present,
33 #      ctdbd is only considered to running if the PID in the file is
34 #      active.
35 #    - If the PID file is not being used (i.e. we're upgrading from a
36 #      version that doesn't support it) then the presence of any ctdbd
37 #      processes is enough proof.
38
39 # 2. Print a comma-separated list of PIDs that can be
40 #    used with "pkill -s".
41 #    - If the PID file is being used then this is just the PID in that
42 #      file.  This also happens to be the session ID, so can be used
43 #      to kill all CTDB processes.
44 #    - If the PID file is not being used (i.e. upgrading) then this is
45 #      just any ctdbd processes that are running.  Hopefully one of
46 #      them is the session ID so that it can be used to kill all CTDB
47 #      processes.
48
49 # Combining these 2 checks is an optimisation to avoid potentially
50 # running too many pgrep/pkill processes on an already loaded system.
51 # Trawling through /proc/ can be very expensive.
52
53 ctdbd_is_running ()
54 {
55     # If the directory for the PID file exists then respect the
56     # existence of a PID file.
57     _pidfile_dir=$(dirname "$pidfile")
58     if [ -d "$_pidfile_dir" ] ; then
59         if read _pid 2>/dev/null <"$pidfile" ; then
60             echo "$_pid"
61
62             # Return value of kill is used
63             kill -0 $_pid 2>/dev/null
64         else
65             # Missing/empty PID file
66             return 1
67         fi
68     else
69         if _pid=$(pgrep -f "${ctdbd}\>") ; then
70             echo $_pid | sed -e 's@ @,@g'
71             return 0
72         else
73             return 1
74         fi
75     fi
76 }
77
78 ############################################################
79
80 build_ctdb_options ()
81 {
82     ctdb_options=""
83
84     maybe_set ()
85     {
86         # If the given variable isn't set then do nothing
87         [ -n "$2" ] || return
88         # If a required value for the variable and it doesn't match,
89         # then do nothing
90         [ -z "$3" -o "$3" = "$2" ] || return
91
92         val="'$2'"
93         case "$1" in
94             --*) sep="=" ;;
95             -*)  sep=" " ;;
96         esac
97         # For these options we're only passing a value-less flag.
98         if [ -n "$3" ] ; then
99             val=""
100             sep=""
101         fi
102
103         ctdb_options="${ctdb_options}${ctdb_options:+ }${1}${sep}${val}"
104     }
105
106     if [ -z "$CTDB_RECOVERY_LOCK" ] ; then
107         echo "No recovery lock specified. Starting CTDB without split brain prevention."
108     fi
109     maybe_set "--reclock"                "$CTDB_RECOVERY_LOCK"
110
111     maybe_set "--pidfile"                "$pidfile"
112
113     # build up ctdb_options variable from optional parameters
114     maybe_set "--logfile"                "$CTDB_LOGFILE"
115     maybe_set "--nlist"                  "$CTDB_NODES"
116     maybe_set "--socket"                 "$CTDB_SOCKET"
117     maybe_set "--public-addresses"       "$CTDB_PUBLIC_ADDRESSES"
118     maybe_set "--public-interface"       "$CTDB_PUBLIC_INTERFACE"
119     maybe_set "--dbdir"                  "$CTDB_DBDIR"
120     maybe_set "--dbdir-persistent"       "$CTDB_DBDIR_PERSISTENT"
121     maybe_set "--dbdir-state"            "$CTDB_DBDIR_STATE"
122     maybe_set "--event-script-dir"       "$CTDB_EVENT_SCRIPT_DIR"
123     maybe_set "--transport"              "$CTDB_TRANSPORT"
124     maybe_set "-d"                       "$CTDB_DEBUGLEVEL"
125     maybe_set "--notification-script"    "$CTDB_NOTIFY_SCRIPT"
126     maybe_set "--start-as-disabled"      "$CTDB_START_AS_DISABLED"    "yes"
127     maybe_set "--start-as-stopped "      "$CTDB_START_AS_STOPPED"     "yes"
128     maybe_set "--no-recmaster"           "$CTDB_CAPABILITY_RECMASTER" "no"
129     maybe_set "--no-lmaster"             "$CTDB_CAPABILITY_LMASTER"   "no"
130     maybe_set "--lvs --single-public-ip" "$CTDB_LVS_PUBLIC_IP"
131     maybe_set "--script-log-level"       "$CTDB_SCRIPT_LOG_LEVEL"
132     maybe_set "--log-ringbuf-size"       "$CTDB_LOG_RINGBUF_SIZE"
133     maybe_set "--syslog"                 "$CTDB_SYSLOG"               "yes"
134     maybe_set "--max-persistent-check-errors" "$CTDB_MAX_PERSISTENT_CHECK_ERRORS"
135 }
136
137 export_debug_variables ()
138 {
139     export CTDB_DEBUG_HUNG_SCRIPT CTDB_EXTERNAL_TRACE CTDB_DEBUG_LOCKS
140 }
141
142 kill_ctdbd ()
143 {
144     _session="$1"
145
146     if [ -n "$_session" ] ; then
147         pkill -9 -s "$_session" 2>/dev/null
148     fi
149     rm -f "$pidfile"
150 }
151
152 ############################################################
153
154 start()
155 {
156     if _session=$(ctdbd_is_running) ; then
157         echo $"CTDB is already running"
158         return 0
159     fi
160
161     # About to start new $ctdbd.  The main daemon is not running but
162     # there may still be other processes around, so do some cleanup.
163     # Note that starting ctdbd below will destroy the Unix domain
164     # socket, so any processes that aren't yet completely useless soon
165     # will be, so this can really do no harm.
166     kill_ctdbd "$_session"
167
168     build_ctdb_options
169
170     export_debug_variables
171
172     if [ "$CTDB_SUPPRESS_COREFILE" = "yes" ]; then
173         ulimit -c 0
174     else
175         ulimit -c unlimited
176     fi
177
178     mkdir -p $(dirname "$pidfile")
179
180     if [ -n "$CTDB_VALGRIND" -a "$CTDB_VALGRIND" != "no" ] ; then
181         if [ "$CTDB_VALGRIND" = "yes" ] ; then
182             ctdbd="valgrind -q --log-file=/var/log/ctdb_valgrind ${ctdbd}"
183         else
184             ctdbd="${CTDB_VALGRIND} ${ctdbd}"
185         fi
186         ctdb_options="${ctdb_options} --valgrinding"
187     fi
188
189     if [ "$CTDB_SYSLOG" != "yes" ] ; then
190         logger -t ctdbd "CTDB is being run without syslog enabled.  Logs will be in ${CTDB_LOGFILE:-/var/log/log.ctdb}"
191     fi
192
193     eval "$ctdbd" "$ctdb_options" || return 1
194
195     # Wait until ctdbd has started and is ready to respond to clients.
196     _pid=""
197     _timeout="${CTDB_STARTUP_TIMEOUT:-10}"
198     _count=0
199     while [ $_count -lt $_timeout ] ; do
200         # If we don't have the PID then try to read it.
201         [ -n "$_pid" ] || read _pid 2>/dev/null <"$pidfile"
202
203         # If we got the PID but the PID file has gone or the process
204         # is no longer running then stop waiting... CTDB is dead.
205         if [ -n "$_pid" ] ; then
206             if [ ! -e "$pidfile" ] || ! kill -0 "$_pid" 2>/dev/null ; then
207                 echo "CTDB exited during initialisation - check logs."
208                 kill_ctdbd "$_pid"
209                 drop_all_public_ips >/dev/null 2>&1
210                 return 1
211             fi
212
213             if ctdb runstate first_recovery startup running >/dev/null 2>&1 ; then
214                 return 0
215             fi
216         fi
217
218         _count=$(($_count + 1))
219         sleep 1
220     done
221
222     echo "Timed out waiting for initialisation - check logs - killing CTDB"
223     kill_ctdbd "$_pid"
224     drop_all_public_ips >/dev/null 2>&1
225     return 1
226 }
227
228 stop()
229 {
230     if ! _session=$(ctdbd_is_running) ; then
231         echo "CTDB is not running"
232         return 0
233     fi
234
235     ctdb shutdown
236
237     # Wait for remaining CTDB processes to exit...
238     _timeout=${CTDB_SHUTDOWN_TIMEOUT:-30}
239     _count=0
240     while [ $_count -lt $_timeout ] ; do
241         pkill -0 -s "$_session" 2>/dev/null || return 0
242
243         _count=$(($_count + 1))
244         sleep 1
245     done
246
247     echo "Timed out waiting for CTDB to shutdown.  Killing CTDB processes."
248     kill_ctdbd "$_session"
249     drop_all_public_ips >/dev/null 2>&1
250
251     sleep 1
252
253     if pkill -0 -s "$_session" ; then
254         # If SIGKILL didn't work then things are bad...
255         echo "Failed to kill all CTDB processes.  Giving up."
256         return 1
257     fi
258
259     return 0
260 }
261
262 ############################################################
263
264 # Allow notifications for start/stop.
265 if [ -x "$CTDB_BASE/rc.ctdb" ] ; then
266     "$CTDB_BASE/rc.ctdb" "$action"
267 fi
268
269 case "$action" in
270     start) start ;;
271     stop)  stop  ;;
272     *)
273         echo "usage: $0 {start|stop}"
274         exit 1
275 esac