Revert "ctdb-recoverd: Abort when daemon can take recovery lock during recovery"
authorMartin Schwenke <martin@meltin.net>
Mon, 4 May 2015 05:27:19 +0000 (15:27 +1000)
committerMartin Schwenke <martin@meltin.net>
Wed, 24 Feb 2016 10:44:27 +0000 (21:44 +1100)
commitbdb9fcebbee9995b5351f04297cdbc608b779338
tree2bd2ae6ff09366f3adf4c0aa896cd63ab79e74cb
parentb533cf2a868ddb7176042111dd88afab42c25d76
Revert "ctdb-recoverd: Abort when daemon can take recovery lock during recovery"

This reverts commit 39d2fd330a60ea590d76213f8cb406a42fa8d680.

An election can occur in the middle of a recovery.  During the
election the recovery master can change.  When a node loses a round of
the election and stops being the recovery master it releases the
recovery lock.  Then at the end of the ongoing recovery all nodes are
able to take the recovery lock so they will all abort.

The most likely cause for a change in recovery master is that several
(all?) nodes are starting up and the "connected-ness" of each node is
a primary factor in winning the election.  In this situation the
recovery master can bounce around the cluster.

The simplest solution is to revert this patch so that the recovery
will fail.  The new recovery master will then start a new recovery.

Signed-off-by: Martin Schwenke <martin@meltin.net>
Reviewed-by: Amitay Isaacs <amitay@gmail.com>
Autobuild-User(master): Amitay Isaacs <amitay@samba.org>
Autobuild-Date(master): Mon May  4 10:40:36 CEST 2015 on sn-devel-104

(Imported from commit 20a7945a2695d7ed811237adde5af6549e53c6e9)
server/ctdb_recover.c