delay loading the public ip address file until after we have started the transport...
[metze/ctdb/wip.git] / server / ctdbd.c
index d33a4092dd543cf8ac3e1ab20771f838ed508b84..b90dbcdf1e41683d3f61e30bdb9bf0bf26689a45 100644 (file)
@@ -18,7 +18,7 @@
 */
 
 #include "includes.h"
-#include "lib/events/events.h"
+#include "lib/tevent/tevent.h"
 #include "system/filesys.h"
 #include "popt.h"
 #include "system/time.h"
@@ -38,10 +38,11 @@ static struct {
        const char *recovery_lock_file;
        const char *db_dir;
        const char *db_dir_persistent;
+       const char *db_dir_state;
        const char *public_interface;
        const char *single_public_ip;
        const char *node_ip;
-       int         no_setsched;
+       int         valgrinding;
        int         use_syslog;
        int         start_as_disabled;
        int         start_as_stopped;
@@ -50,6 +51,7 @@ static struct {
        int         lvs;
        int         script_log_level;
        int         no_publicipcheck;
+       int         max_persistent_check_errors;
 } options = {
        .nlist = ETCDIR "/ctdb/nodes",
        .transport = "tcp",
@@ -57,10 +59,12 @@ static struct {
        .logfile = LOGDIR "/log.ctdb",
        .db_dir = VARDIR "/ctdb",
        .db_dir_persistent = VARDIR "/ctdb/persistent",
+       .db_dir_state = VARDIR "/ctdb/state",
        .script_log_level = DEBUG_ERR,
 };
 
 int script_log_level;
+bool fast_start;
 
 /*
   called by the transport layer when a packet comes in
@@ -69,7 +73,7 @@ static void ctdb_recv_pkt(struct ctdb_context *ctdb, uint8_t *data, uint32_t len
 {
        struct ctdb_req_header *hdr = (struct ctdb_req_header *)data;
 
-       ctdb->statistics.node_packets_recv++;
+       CTDB_INCREMENT_STAT(ctdb, node_packets_recv);
 
        /* up the counter for this source node, so we know its alive */
        if (ctdb_validate_pnn(ctdb, hdr->srcnode)) {
@@ -126,8 +130,9 @@ int main(int argc, const char *argv[])
                { "transport", 0, POPT_ARG_STRING, &options.transport, 0, "protocol transport", NULL },
                { "dbdir", 0, POPT_ARG_STRING, &options.db_dir, 0, "directory for the tdb files", NULL },
                { "dbdir-persistent", 0, POPT_ARG_STRING, &options.db_dir_persistent, 0, "directory for persistent tdb files", NULL },
+               { "dbdir-state", 0, POPT_ARG_STRING, &options.db_dir_state, 0, "directory for internal state tdb files", NULL },
                { "reclock", 0, POPT_ARG_STRING, &options.recovery_lock_file, 0, "location of recovery lock file", "filename" },
-               { "nosetsched", 0, POPT_ARG_NONE, &options.no_setsched, 0, "disable setscheduler SCHED_FIFO call", NULL },
+               { "valgrinding", 0, POPT_ARG_NONE, &options.valgrinding, 0, "make valgrind more effective", NULL },
                { "syslog", 0, POPT_ARG_NONE, &options.use_syslog, 0, "log messages to syslog", NULL },
                { "start-as-disabled", 0, POPT_ARG_NONE, &options.start_as_disabled, 0, "Node starts in disabled state", NULL },
                { "start-as-stopped", 0, POPT_ARG_NONE, &options.start_as_stopped, 0, "Node starts in stopped state", NULL },
@@ -135,7 +140,12 @@ int main(int argc, const char *argv[])
                { "no-recmaster", 0, POPT_ARG_NONE, &options.no_recmaster, 0, "disable recmaster role on this node", NULL },
                { "lvs", 0, POPT_ARG_NONE, &options.lvs, 0, "lvs is enabled on this node", NULL },
                { "script-log-level", 0, POPT_ARG_INT, &options.script_log_level, DEBUG_ERR, "log level of event script output", NULL },
-               { "nopublicipcheck", 0, POPT_ARG_NONE, &options.no_publicipcheck, 0, "dont check we have/dont have the correct public ip addresses", NULL },
+               { "nopublicipcheck", 0, POPT_ARG_NONE, &options.no_publicipcheck, 0, "don't check we have/don't have the correct public ip addresses", NULL },
+               { "max-persistent-check-errors", 0, POPT_ARG_INT,
+                 &options.max_persistent_check_errors, 0,
+                 "max allowed persistent check errors (default 0)", NULL },
+               { "log-ringbuf-size", 0, POPT_ARG_INT, &log_ringbuf_size, DEBUG_ERR, "Number of log messages we can store in the memory ringbuffer", NULL },
+               { "sloppy-start", 0, POPT_ARG_NONE, &fast_start, 0, "Do not perform full recovery on start", NULL },
                POPT_TABLEEND
        };
        int opt, ret;
@@ -165,18 +175,13 @@ int main(int argc, const char *argv[])
        talloc_enable_null_tracking();
 
        ctdb_block_signal(SIGPIPE);
+       fault_setup("ctdbd");
 
        ev = event_context_init(NULL);
+       tevent_loop_allow_nesting(ev);
 
        ctdb = ctdb_cmdline_init(ev);
 
-       if (options.use_syslog) {
-               if (start_syslog_daemon(ctdb)) {
-                       printf("Failed to start syslog daemon\n");
-                       exit(10);
-               }
-       }
-
        ctdb->start_as_disabled = options.start_as_disabled;
        ctdb->start_as_stopped  = options.start_as_stopped;
 
@@ -190,6 +195,7 @@ int main(int argc, const char *argv[])
        }
 
        DEBUG(DEBUG_NOTICE,("Starting CTDB daemon\n"));
+
        gettimeofday(&ctdb->ctdbd_start_time, NULL);
        gettimeofday(&ctdb->last_recovery_started, NULL);
        gettimeofday(&ctdb->last_recovery_finished, NULL);
@@ -201,6 +207,7 @@ int main(int argc, const char *argv[])
 
        ctdb_tunables_set_defaults(ctdb);
 
+       ctdb->tunable.disable_ip_failover = options.no_publicipcheck;
 
        ret = ctdb_set_recovery_lock_file(ctdb, options.recovery_lock_file);
        if (ret == -1) {
@@ -266,6 +273,13 @@ int main(int argc, const char *argv[])
                        exit(1);
                }
        }
+       if (options.db_dir_state) {
+               ret = ctdb_set_tdb_dir_state(ctdb, options.db_dir_state);
+               if (ret == -1) {
+                       DEBUG(DEBUG_ALERT,("ctdb_set_tdb_dir_state failed - %s\n", ctdb_errstr(ctdb)));
+                       exit(1);
+               }
+       }
 
        if (options.public_interface) {
                ctdb->default_public_interface = talloc_strdup(ctdb, options.public_interface);
@@ -273,37 +287,19 @@ int main(int argc, const char *argv[])
        }
 
        if (options.single_public_ip) {
-               struct ctdb_vnn *svnn;
-
                if (options.public_interface == NULL) {
                        DEBUG(DEBUG_ALERT,("--single_public_ip used but --public_interface is not specified. You must specify the public interface when using single public ip. Exiting\n"));
                        exit(10);
                }
 
-               svnn = talloc_zero(ctdb, struct ctdb_vnn);
-               CTDB_NO_MEMORY(ctdb, svnn);
-
-               ctdb->single_ip_vnn = svnn;
-               svnn->iface = talloc_strdup(svnn, options.public_interface);
-               CTDB_NO_MEMORY(ctdb, svnn->iface);
-
-               if (parse_ip(options.single_public_ip, 
-                               svnn->iface,
-                               0,
-                               &svnn->public_address) == 0) {
+               ret = ctdb_set_single_public_ip(ctdb, options.public_interface,
+                                               options.single_public_ip);
+               if (ret != 0) {
                        DEBUG(DEBUG_ALERT,("Invalid --single-public-ip argument : %s . This is not a valid ip address. Exiting.\n", options.single_public_ip));
                        exit(10);
                }
        }
 
-       if (options.public_address_list) {
-               ret = ctdb_set_public_addresses(ctdb, options.public_address_list);
-               if (ret == -1) {
-                       DEBUG(DEBUG_ALERT,("Unable to setup public address list\n"));
-                       exit(1);
-               }
-       }
-
        ret = ctdb_set_event_script_dir(ctdb, options.event_script_dir);
        if (ret == -1) {
                DEBUG(DEBUG_ALERT,("Unable to setup event script directory\n"));
@@ -318,9 +314,13 @@ int main(int argc, const char *argv[])
                }
        }
 
-       ctdb->do_setsched = !options.no_setsched;
+       ctdb->valgrinding = options.valgrinding;
 
-       ctdb->do_checkpublicip = !options.no_publicipcheck;
+       if (options.max_persistent_check_errors < 0) {
+               ctdb->max_persistent_check_errors = 0xFFFFFFFFFFFFFFFFLL;
+       } else {
+               ctdb->max_persistent_check_errors = (uint64_t)options.max_persistent_check_errors;
+       }
 
        if (getenv("CTDB_BASE") == NULL) {
                /* setup a environment variable for the event scripts to use
@@ -329,5 +329,5 @@ int main(int argc, const char *argv[])
        }
 
        /* start the protocol running (as a child) */
-       return ctdb_start_daemon(ctdb, interactive?False:True);
+       return ctdb_start_daemon(ctdb, interactive?False:True, options.use_syslog, options.public_address_list);
 }