ctdb-logging: Add logging via UDP to 127.0.0.1:514 to syslog backend
[samba.git] / ctdb / config / ctdbd_wrapper
1 #!/bin/sh
2
3 # ctdbd wrapper - start or stop CTDB
4
5 usage ()
6 {
7     echo "usage: ctdbd_wrapper <pidfile> { start | stop }"
8     exit 1
9 }
10
11 [ $# -eq 2 ] || usage
12
13 pidfile="$1"
14 action="$2"
15
16 ############################################################
17
18 [ -n "$CTDB_BASE" ] || export CTDB_BASE="/etc/ctdb"
19
20 . "${CTDB_BASE}/functions"
21 loadconfig "ctdb"
22
23 [ -n "$CTDB_SOCKET" ] && export CTDB_SOCKET
24
25 ctdbd="${CTDBD:-/usr/sbin/ctdbd}"
26
27 ############################################################
28
29 # ctdbd_is_running()
30
31 # 1. Check if ctdbd is running.
32 #    - If the PID file is being used then, if the PID file is present,
33 #      ctdbd is only considered to running if the PID in the file is
34 #      active.
35 #    - If the PID file is not being used (i.e. we're upgrading from a
36 #      version that doesn't support it) then the presence of any ctdbd
37 #      processes is enough proof.
38
39 # 2. Print a comma-separated list of PIDs that can be
40 #    used with "pkill -s".
41 #    - If the PID file is being used then this is just the PID in that
42 #      file.  This also happens to be the session ID, so can be used
43 #      to kill all CTDB processes.
44 #    - If the PID file is not being used (i.e. upgrading) then this is
45 #      just any ctdbd processes that are running.  Hopefully one of
46 #      them is the session ID so that it can be used to kill all CTDB
47 #      processes.
48
49 # Combining these 2 checks is an optimisation to avoid potentially
50 # running too many pgrep/pkill processes on an already loaded system.
51 # Trawling through /proc/ can be very expensive.
52
53 ctdbd_is_running ()
54 {
55     # If the directory for the PID file exists then respect the
56     # existence of a PID file.
57     _pidfile_dir=$(dirname "$pidfile")
58     if [ -d "$_pidfile_dir" ] ; then
59         if read _pid 2>/dev/null <"$pidfile" ; then
60             echo "$_pid"
61
62             # Return value of kill is used
63             kill -0 $_pid 2>/dev/null
64         else
65             # Missing/empty PID file
66             return 1
67         fi
68     else
69         if _pid=$(pgrep -f "${ctdbd}\>") ; then
70             echo $_pid | sed -e 's@ @,@g'
71             return 0
72         else
73             return 1
74         fi
75     fi
76 }
77
78 ############################################################
79
80 build_ctdb_options ()
81 {
82     ctdb_options=""
83
84     maybe_set ()
85     {
86         # If the given variable isn't set then do nothing
87         [ -n "$2" ] || return
88         # If a required value for the variable and it doesn't match,
89         # then do nothing
90         [ -z "$3" -o "$3" = "$2" ] || return
91
92         val="'$2'"
93         case "$1" in
94             --*) sep="=" ;;
95             -*)  sep=" " ;;
96         esac
97         # For these options we're only passing a value-less flag.
98         if [ -n "$3" ] ; then
99             val=""
100             sep=""
101         fi
102
103         ctdb_options="${ctdb_options}${ctdb_options:+ }${1}${sep}${val}"
104     }
105
106     if [ -z "$CTDB_RECOVERY_LOCK" ] ; then
107         echo "No recovery lock specified. Starting CTDB without split brain prevention."
108     fi
109     maybe_set "--reclock"                "$CTDB_RECOVERY_LOCK"
110
111     maybe_set "--pidfile"                "$pidfile"
112
113     # build up ctdb_options variable from optional parameters
114     maybe_set "--logging"                "$CTDB_LOGGING"
115     maybe_set "--nlist"                  "$CTDB_NODES"
116     maybe_set "--socket"                 "$CTDB_SOCKET"
117     maybe_set "--public-addresses"       "$CTDB_PUBLIC_ADDRESSES"
118     maybe_set "--public-interface"       "$CTDB_PUBLIC_INTERFACE"
119     maybe_set "--dbdir"                  "$CTDB_DBDIR"
120     maybe_set "--dbdir-persistent"       "$CTDB_DBDIR_PERSISTENT"
121     maybe_set "--dbdir-state"            "$CTDB_DBDIR_STATE"
122     maybe_set "--event-script-dir"       "$CTDB_EVENT_SCRIPT_DIR"
123     maybe_set "--transport"              "$CTDB_TRANSPORT"
124     maybe_set "-d"                       "$CTDB_DEBUGLEVEL"
125     maybe_set "--notification-script"    "$CTDB_NOTIFY_SCRIPT"
126     maybe_set "--start-as-disabled"      "$CTDB_START_AS_DISABLED"    "yes"
127     maybe_set "--start-as-stopped "      "$CTDB_START_AS_STOPPED"     "yes"
128     maybe_set "--no-recmaster"           "$CTDB_CAPABILITY_RECMASTER" "no"
129     maybe_set "--no-lmaster"             "$CTDB_CAPABILITY_LMASTER"   "no"
130     maybe_set "--lvs --single-public-ip" "$CTDB_LVS_PUBLIC_IP"
131     maybe_set "--script-log-level"       "$CTDB_SCRIPT_LOG_LEVEL"
132     maybe_set "--max-persistent-check-errors" "$CTDB_MAX_PERSISTENT_CHECK_ERRORS"
133 }
134
135 export_debug_variables ()
136 {
137     [ -n "$CTDB_DEBUG_HUNG_SCRIPT" ] && export CTDB_DEBUG_HUNG_SCRIPT
138     [ -n "$CTDB_EXTERNAL_TRACE" ] && export CTDB_EXTERNAL_TRACE
139     [ -n "$CTDB_DEBUG_LOCKS" ] && export CTDB_DEBUG_LOCKS
140 }
141
142 kill_ctdbd ()
143 {
144     _session="$1"
145
146     if [ -n "$_session" ] ; then
147         pkill -9 -s "$_session" 2>/dev/null
148     fi
149     rm -f "$pidfile"
150 }
151
152 ############################################################
153
154 start()
155 {
156     if _session=$(ctdbd_is_running) ; then
157         echo $"CTDB is already running"
158         return 0
159     fi
160
161     # About to start new $ctdbd.  The main daemon is not running but
162     # there may still be other processes around, so do some cleanup.
163     # Note that starting ctdbd below will destroy the Unix domain
164     # socket, so any processes that aren't yet completely useless soon
165     # will be, so this can really do no harm.
166     kill_ctdbd "$_session"
167
168     build_ctdb_options
169
170     export_debug_variables
171
172     if [ "$CTDB_SUPPRESS_COREFILE" = "yes" ]; then
173         ulimit -c 0
174     else
175         ulimit -c unlimited
176     fi
177
178     mkdir -p $(dirname "$pidfile")
179
180     if [ -n "$CTDB_VALGRIND" -a "$CTDB_VALGRIND" != "no" ] ; then
181         if [ "$CTDB_VALGRIND" = "yes" ] ; then
182             ctdbd="valgrind -q --log-file=/var/log/ctdb_valgrind ${ctdbd}"
183         else
184             ctdbd="${CTDB_VALGRIND} ${ctdbd}"
185         fi
186         ctdb_options="${ctdb_options} --valgrinding"
187     fi
188
189     case "$CTDB_LOGGING" in
190         syslog:udp)
191             logger -t ctdbd "CTDB is being run with ${CTDB_LOGGING}.  If nothing is logged then check your syslogd configuration"
192             ;;
193         syslog|syslog:*) : ;;
194         file:*)
195             logger -t ctdbd "CTDB is being run without syslog enabled.  Logs will be in ${CTDB_LOGGING#file:}"
196             ;;
197         *)
198             logger -t ctdbd "CTDB is being run without syslog enabled.  Logs will be in log.ctdb"
199     esac
200
201     eval "$ctdbd" "$ctdb_options" || return 1
202
203     # Wait until ctdbd has started and is ready to respond to clients.
204     _pid=""
205     _timeout="${CTDB_STARTUP_TIMEOUT:-10}"
206     _count=0
207     while [ $_count -lt $_timeout ] ; do
208         # If we don't have the PID then try to read it.
209         [ -n "$_pid" ] || read _pid 2>/dev/null <"$pidfile"
210
211         # If we got the PID but the PID file has gone or the process
212         # is no longer running then stop waiting... CTDB is dead.
213         if [ -n "$_pid" ] ; then
214             if [ ! -e "$pidfile" ] || ! kill -0 "$_pid" 2>/dev/null ; then
215                 echo "CTDB exited during initialisation - check logs."
216                 kill_ctdbd "$_pid"
217                 drop_all_public_ips >/dev/null 2>&1
218                 return 1
219             fi
220
221             if ctdb runstate first_recovery startup running >/dev/null 2>&1 ; then
222                 return 0
223             fi
224         fi
225
226         _count=$(($_count + 1))
227         sleep 1
228     done
229
230     echo "Timed out waiting for initialisation - check logs - killing CTDB"
231     kill_ctdbd "$_pid"
232     drop_all_public_ips >/dev/null 2>&1
233     return 1
234 }
235
236 stop()
237 {
238     if ! _session=$(ctdbd_is_running) ; then
239         echo "CTDB is not running"
240         return 0
241     fi
242
243     ctdb shutdown
244
245     # Wait for remaining CTDB processes to exit...
246     _timeout=${CTDB_SHUTDOWN_TIMEOUT:-30}
247     _count=0
248     while [ $_count -lt $_timeout ] ; do
249         pkill -0 -s "$_session" 2>/dev/null || return 0
250
251         _count=$(($_count + 1))
252         sleep 1
253     done
254
255     echo "Timed out waiting for CTDB to shutdown.  Killing CTDB processes."
256     kill_ctdbd "$_session"
257     drop_all_public_ips >/dev/null 2>&1
258
259     sleep 1
260
261     if pkill -0 -s "$_session" ; then
262         # If SIGKILL didn't work then things are bad...
263         echo "Failed to kill all CTDB processes.  Giving up."
264         return 1
265     fi
266
267     return 0
268 }
269
270 ############################################################
271
272 # Allow notifications for start/stop.
273 if [ -x "$CTDB_BASE/rc.ctdb" ] ; then
274     "$CTDB_BASE/rc.ctdb" "$action"
275 fi
276
277 case "$action" in
278     start) start ;;
279     stop)  stop  ;;
280     *)
281         echo "usage: $0 {start|stop}"
282         exit 1
283 esac