7445200b3287014db9034b9a64f7ad94344324c7
[obnox/samba/samba-obnox.git] / ctdb / config / events.d / 10.interface
1 #!/bin/sh
2
3 #################################
4 # interface event script for ctdb
5 # this adds/removes IPs from your 
6 # public interface
7
8 [ -n "$CTDB_BASE" ] || \
9     export CTDB_BASE=$(cd -P $(dirname "$0") ; dirname "$PWD")
10
11 . $CTDB_BASE/functions
12 loadconfig
13
14 [ -z "$CTDB_PUBLIC_ADDRESSES" ] && {
15         CTDB_PUBLIC_ADDRESSES=$CTDB_BASE/public_addresses
16 }
17
18 [ ! -f "$CTDB_PUBLIC_ADDRESSES" ] && {
19         if [ "$1" = "init" ]; then
20                 echo "No public addresses file found. Nothing to do for 10.interfaces"
21         fi
22         exit 0
23 }
24
25 mark_up ()
26 {
27     up_interfaces_found=true
28     ctdb setifacelink $1 up >/dev/null 2>&1
29 }
30
31 mark_down ()
32 {
33     fail=true
34     ctdb setifacelink $1 down >/dev/null 2>&1
35 }
36
37 # This sets $all_interfaces as a side-effect.
38 get_all_interfaces ()
39 {
40     # Get all the interfaces listed in the public_addresses file
41     all_interfaces=$(sed -e "s/^[^\t ]*[\t ]*//" -e "s/,/ /g" -e "s/[\t ]*$//" $CTDB_PUBLIC_ADDRESSES)
42
43     # Add some special interfaces if they're defined
44     [ "$CTDB_PUBLIC_INTERFACE" ] && all_interfaces="$CTDB_PUBLIC_INTERFACE $all_interfaces"
45     [ "$CTDB_NATGW_PUBLIC_IFACE" ] && all_interfaces="$CTDB_NATGW_PUBLIC_IFACE $all_interfaces"
46
47     # Get the interfaces for which CTDB has public IPs configured.
48     # That is, for all but the 1st line, get the 1st field.
49     ctdb_ifaces=$(ctdb -X ifaces | sed -e '1d' -e 's@^|@@' -e 's@|.*@@')
50
51     # Add $ctdb_interfaces and uniquify
52     all_interfaces=$(echo $all_interfaces $ctdb_ifaces | tr ' ' '\n' | sort -u)
53 }
54
55 get_real_iface ()
56 {
57     # Output of "ip link show <iface>"
58     _iface_info="$1"
59
60     # Extract the full interface description to see if it is a VLAN
61     _t=$(echo "$_iface_info" |
62                 awk 'NR == 1 { iface = $2; sub(":$", "", iface) ; \
63                                print iface }')
64     case "$_t" in
65         *@*)
66             # VLAN: use the underlying interface, after the '@'
67             echo "${_t##*@}"
68             ;;
69         *)
70             # Not a regular VLAN.  For backward compatibility, assume
71             # there is some other sort of VLAN that doesn't have the
72             # '@' in the output and only use what is before a '.'.  If
73             # there is no '.' then this will be the whole interface
74             # name.
75             echo "${_t%%.*}"
76     esac
77 }
78
79 monitor_interfaces()
80 {
81         get_all_interfaces
82
83         fail=false
84         up_interfaces_found=false
85
86         # Note that this loop must not exit early.  It must process
87         # all interfaces so that the correct state for each interface
88         # is set in CTDB using mark_up/mark_down.  If there is a
89         # problem with an interface then set fail=true and continue.
90         for iface in $all_interfaces ; do
91
92             _iface_info=$(ip link show $iface 2>&1) || {
93                 echo "ERROR: Interface $iface does not exist but it is used by public addresses."
94                 mark_down $iface
95                 continue
96             }
97
98             # These interfaces are sometimes bond devices
99             # When we use VLANs for bond interfaces, there will only
100             # be an entry in /proc for the underlying real interface
101             realiface=$(get_real_iface "$_iface_info")
102             bi=$(get_proc "net/bonding/$realiface" 2>/dev/null) && {
103                 echo "$bi" | grep -q 'Currently Active Slave: None' && {
104                         echo "ERROR: No active slaves for bond device $realiface"
105                         mark_down $iface
106                         continue
107                 }
108                 echo "$bi" | grep -q '^MII Status: up' || {
109                         echo "ERROR: public network interface $realiface is down"
110                         mark_down $iface
111                         continue
112                 }
113                 echo "$bi" | grep -q '^Bonding Mode: IEEE 802.3ad Dynamic link aggregation' && {
114                         # This works around a bug in the driver where the
115                         # overall bond status can be up but none of the actual
116                         # physical interfaces have a link.
117                         echo "$bi" | grep 'MII Status:' | tail -n +2 | grep -q '^MII Status: up' || {
118                                 echo "ERROR: No active slaves for 802.ad bond device $realiface"
119                                 mark_down $iface
120                                 continue
121                         }
122                 }
123                 mark_up $iface
124                 continue
125             }
126
127             case $iface in
128             lo*)
129                 # loopback is always working
130                 mark_up $iface
131                 ;;
132             ib*)
133                 # we don't know how to test ib links
134                 mark_up $iface
135                 ;;
136             *)
137                 ethtool $iface | grep -q 'Link detected: yes' || {
138                     # On some systems, this is not successful when a
139                     # cable is plugged but the interface has not been
140                     # brought up previously. Bring the interface up
141                     # and try again...
142                     ip link set $iface up
143                     ethtool $iface | grep -q 'Link detected: yes' || {
144                         echo "ERROR: No link on the public network interface $iface"
145                         mark_down $iface
146                         continue
147                     }
148                 }
149                 mark_up $iface
150                 ;;
151             esac
152
153         done
154
155         $fail || return 0
156
157         $up_interfaces_found && \
158             [ "$CTDB_PARTIALLY_ONLINE_INTERFACES" = "yes" ] && \
159             return 0
160
161         return 1
162 }
163
164 # Sets: iface, ip, maskbits, family
165 get_iface_ip_maskbits_family ()
166 {
167     _iface_in="$1"
168     ip="$2"
169     _maskbits_in="$3"
170
171     set -- $(ip_maskbits_iface "$ip")
172     if [ -n "$1" ] ; then
173         maskbits="$1"
174         iface="$2"
175         family="$3"
176
177         if [ "$iface" != "$_iface_in" ] ; then
178             printf \
179                 'WARNING: Public IP %s hosted on interface %s but VNN says %s\n' \
180                 "$ip" "$iface" "$_iface_in"
181         fi
182         if [ "$maskbits" != "$_maskbits_in" ] ; then
183             printf \
184                 'WARNING: Public IP %s has %s bit netmask but VNN says %s\n' \
185                     "$ip" "$maskbits" "$_maskbits_in"
186         fi
187     else
188         die "ERROR: Unable to determine interface for IP ${ip}"
189     fi
190 }
191
192 ctdb_check_args "$@"
193
194 case "$1" in 
195      #############################
196      # called when ctdbd starts up
197      init)
198         # make sure that we only respond to ARP messages from the NIC where
199         # a particular ip address is associated.
200         get_proc sys/net/ipv4/conf/all/arp_filter >/dev/null 2>&1 && {
201             set_proc sys/net/ipv4/conf/all/arp_filter 1
202         }
203
204         _promote="sys/net/ipv4/conf/all/promote_secondaries"
205         get_proc "$_promote" >/dev/null 2>&1 || \
206             die "Public IPs only supported if promote_secondaries is available"
207
208         # make sure we drop any ips that might still be held if
209         # previous instance of ctdb got killed with -9 or similar
210         drop_all_public_ips
211         ;;
212
213      #############################
214      # called after ctdbd has done its initial recovery
215      # and we start the services to become healthy
216      startup)
217         monitor_interfaces
218         ;;
219
220
221      ################################################
222      # called when ctdbd wants to claim an IP address
223      takeip)
224         iface=$2
225         ip=$3
226         maskbits=$4
227
228         add_ip_to_iface $iface $ip $maskbits || {
229                 exit 1;
230         }
231
232         # cope with the script being killed while we have the interface blocked
233         case "$ip" in
234             *:*) family="inet6" ;;
235             *)   family="inet"  ;;
236         esac
237         iptables_wrapper $family -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
238
239         flush_route_cache
240         ;;
241
242
243      ##################################################
244      # called when ctdbd wants to release an IP address
245      releaseip)
246         # releasing an IP is a bit more complex than it seems. Once the IP
247         # is released, any open tcp connections to that IP on this host will end
248         # up being stuck. Some of them (such as NFS connections) will be unkillable
249         # so we need to use the killtcp ctdb function to kill them off. We also
250         # need to make sure that no new connections get established while we are 
251         # doing this! So what we do is this:
252         # 1) firewall this IP, so no new external packets arrive for it
253         # 2) use netstat -tn to find existing connections, and kill them 
254         # 3) remove the IP from the interface
255         # 4) remove the firewall rule
256         shift
257         get_iface_ip_maskbits_family "$@"
258
259         # we do an extra delete to cope with the script being killed
260         iptables_wrapper $family -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
261         iptables_wrapper $family -I INPUT -i $iface -d $ip -j DROP
262         kill_tcp_connections $ip
263
264         delete_ip_from_iface $iface $ip $maskbits || {
265             iptables_wrapper $family \
266                              -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
267                 exit 1
268         }
269
270         iptables_wrapper $family -D INPUT -i $iface -d $ip -j DROP 2> /dev/null
271
272         flush_route_cache
273         ;;
274
275      ##################################################
276      # called when ctdbd wants to update an IP address
277      updateip)
278         # moving an IP is a bit more complex than it seems.
279         # First we drop all traffic on the old interface.
280         # Then we try to add the ip to the new interface and before
281         # we finally remove it from the old interface.
282         #
283         # 1) firewall this IP, so no new external packets arrive for it
284         # 2) remove the IP from the old interface (and new interface, to be sure)
285         # 3) add the IP to the new interface
286         # 4) remove the firewall rule
287         # 5) use ctdb gratiousarp to propagate the new mac address
288         # 6) use netstat -tn to find existing connections, and tickle them
289         _oiface=$2
290         niface=$3
291         _ip=$4
292         _maskbits=$5
293
294         get_iface_ip_maskbits_family "$_oiface" "$_ip" "$_maskbits"
295         oiface="$iface"
296
297         # we do an extra delete to cope with the script being killed
298         iptables_wrapper $family -D INPUT -i $oiface -d $ip -j DROP 2> /dev/null
299         iptables_wrapper $family -I INPUT -i $oiface -d $ip -j DROP
300
301         delete_ip_from_iface $oiface $ip $maskbits 2>/dev/null
302         delete_ip_from_iface $niface $ip $maskbits 2>/dev/null
303
304         add_ip_to_iface $niface $ip $maskbits || {
305             iptables_wrapper $family \
306                              -D INPUT -i $oiface -d $ip -j DROP 2> /dev/null
307             exit 1
308         }
309
310         # cope with the script being killed while we have the interface blocked
311         iptables_wrapper $family -D INPUT -i $oiface -d $ip -j DROP 2> /dev/null
312
313         flush_route_cache
314
315         # propagate the new mac address
316         ctdb gratiousarp $ip $niface
317
318         # tickle all existing connections, so that dropped packets
319         # are retransmited and the tcp streams work
320
321         tickle_tcp_connections $ip
322
323         ;;
324
325      monitor)
326         monitor_interfaces || exit 1
327         ;;
328     *)
329         ctdb_standard_event_handler "$@"
330         ;;
331 esac
332
333 exit 0
334