ctdbd: Add nodes_file member to struct ctdb_context
[samba.git] / ctdb / server / ctdbd.c
1 /* 
2    standalone ctdb daemon
3
4    Copyright (C) Andrew Tridgell  2006
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 3 of the License, or
9    (at your option) any later version.
10    
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15    
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, see <http://www.gnu.org/licenses/>.
18 */
19
20 #include "includes.h"
21 #include "system/filesys.h"
22 #include "popt.h"
23 #include "system/time.h"
24 #include "system/wait.h"
25 #include "system/network.h"
26 #include "cmdline.h"
27 #include "../include/ctdb_private.h"
28
29 static struct {
30         const char *nlist;
31         const char *transport;
32         const char *myaddress;
33         const char *public_address_list;
34         const char *event_script_dir;
35         const char *notification_script;
36         const char *logfile;
37         const char *recovery_lock_file;
38         const char *db_dir;
39         const char *db_dir_persistent;
40         const char *db_dir_state;
41         const char *public_interface;
42         const char *single_public_ip;
43         int         valgrinding;
44         int         nosetsched;
45         int         use_syslog;
46         int         start_as_disabled;
47         int         start_as_stopped;
48         int         no_lmaster;
49         int         no_recmaster;
50         int         lvs;
51         int         script_log_level;
52         int         no_publicipcheck;
53         int         max_persistent_check_errors;
54 } options = {
55         .nlist = NULL,
56         .transport = "tcp",
57         .event_script_dir = ETCDIR "/ctdb/events.d",
58         .logfile = LOGDIR "/log.ctdb",
59         .db_dir = VARDIR "/ctdb",
60         .db_dir_persistent = VARDIR "/ctdb/persistent",
61         .db_dir_state = VARDIR "/ctdb/state",
62         .script_log_level = DEBUG_ERR,
63 };
64
65 int script_log_level;
66 bool fast_start;
67
68 /*
69   called by the transport layer when a packet comes in
70 */
71 static void ctdb_recv_pkt(struct ctdb_context *ctdb, uint8_t *data, uint32_t length)
72 {
73         struct ctdb_req_header *hdr = (struct ctdb_req_header *)data;
74
75         CTDB_INCREMENT_STAT(ctdb, node_packets_recv);
76
77         /* up the counter for this source node, so we know its alive */
78         if (ctdb_validate_pnn(ctdb, hdr->srcnode)) {
79                 /* as a special case, redirected calls don't increment the rx_cnt */
80                 if (hdr->operation != CTDB_REQ_CALL ||
81                     ((struct ctdb_req_call *)hdr)->hopcount == 0) {
82                         ctdb->nodes[hdr->srcnode]->rx_cnt++;
83                 }
84         }
85
86         ctdb_input_pkt(ctdb, hdr);
87 }
88
89 static const struct ctdb_upcalls ctdb_upcalls = {
90         .recv_pkt       = ctdb_recv_pkt,
91         .node_dead      = ctdb_node_dead,
92         .node_connected = ctdb_node_connected
93 };
94
95
96
97 /*
98   main program
99 */
100 int main(int argc, const char *argv[])
101 {
102         struct ctdb_context *ctdb;
103         int interactive = 0;
104
105         struct poptOption popt_options[] = {
106                 POPT_AUTOHELP
107                 POPT_CTDB_CMDLINE
108                 { "interactive", 'i', POPT_ARG_NONE, &interactive, 0, "don't fork", NULL },
109                 { "public-addresses", 0, POPT_ARG_STRING, &options.public_address_list, 0, "public address list file", "filename" },
110                 { "public-interface", 0, POPT_ARG_STRING, &options.public_interface, 0, "public interface", "interface"},
111                 { "single-public-ip", 0, POPT_ARG_STRING, &options.single_public_ip, 0, "single public ip", "ip-address"},
112                 { "event-script-dir", 0, POPT_ARG_STRING, &options.event_script_dir, 0, "event script directory", "dirname" },
113                 { "logfile", 0, POPT_ARG_STRING, &options.logfile, 0, "log file location", "filename" },
114                 { "nlist", 0, POPT_ARG_STRING, &options.nlist, 0, "node list file", "filename" },
115                 { "notification-script", 0, POPT_ARG_STRING, &options.notification_script, 0, "notification script", "filename" },
116                 { "listen", 0, POPT_ARG_STRING, &options.myaddress, 0, "address to listen on", "address" },
117                 { "transport", 0, POPT_ARG_STRING, &options.transport, 0, "protocol transport", NULL },
118                 { "dbdir", 0, POPT_ARG_STRING, &options.db_dir, 0, "directory for the tdb files", NULL },
119                 { "dbdir-persistent", 0, POPT_ARG_STRING, &options.db_dir_persistent, 0, "directory for persistent tdb files", NULL },
120                 { "dbdir-state", 0, POPT_ARG_STRING, &options.db_dir_state, 0, "directory for internal state tdb files", NULL },
121                 { "reclock", 0, POPT_ARG_STRING, &options.recovery_lock_file, 0, "location of recovery lock file", "filename" },
122                 { "pidfile", 0, POPT_ARG_STRING, &ctdbd_pidfile, 0, "location of PID file", "filename" },
123                 { "valgrinding", 0, POPT_ARG_NONE, &options.valgrinding, 0, "disable setscheduler SCHED_FIFO call, use mmap for tdbs", NULL },
124                 { "nosetsched", 0, POPT_ARG_NONE, &options.nosetsched, 0, "disable setscheduler SCHED_FIFO call, use mmap for tdbs", NULL },
125                 { "syslog", 0, POPT_ARG_NONE, &options.use_syslog, 0, "log messages to syslog", NULL },
126                 { "start-as-disabled", 0, POPT_ARG_NONE, &options.start_as_disabled, 0, "Node starts in disabled state", NULL },
127                 { "start-as-stopped", 0, POPT_ARG_NONE, &options.start_as_stopped, 0, "Node starts in stopped state", NULL },
128                 { "no-lmaster", 0, POPT_ARG_NONE, &options.no_lmaster, 0, "disable lmaster role on this node", NULL },
129                 { "no-recmaster", 0, POPT_ARG_NONE, &options.no_recmaster, 0, "disable recmaster role on this node", NULL },
130                 { "lvs", 0, POPT_ARG_NONE, &options.lvs, 0, "lvs is enabled on this node", NULL },
131                 { "script-log-level", 0, POPT_ARG_INT, &options.script_log_level, 0, "log level of event script output", NULL },
132                 { "nopublicipcheck", 0, POPT_ARG_NONE, &options.no_publicipcheck, 0, "don't check we have/don't have the correct public ip addresses", NULL },
133                 { "max-persistent-check-errors", 0, POPT_ARG_INT,
134                   &options.max_persistent_check_errors, 0,
135                   "max allowed persistent check errors (default 0)", NULL },
136                 { "log-ringbuf-size", 0, POPT_ARG_INT, &log_ringbuf_size, 0, "Number of log messages we can store in the memory ringbuffer", NULL },
137                 { "sloppy-start", 0, POPT_ARG_NONE, &fast_start, 0, "Do not perform full recovery on start", NULL },
138                 POPT_TABLEEND
139         };
140         int opt, ret;
141         const char **extra_argv;
142         int extra_argc = 0;
143         poptContext pc;
144         struct event_context *ev;
145
146         pc = poptGetContext(argv[0], argc, argv, popt_options, POPT_CONTEXT_KEEP_FIRST);
147
148         while ((opt = poptGetNextOpt(pc)) != -1) {
149                 switch (opt) {
150                 default:
151                         fprintf(stderr, "Invalid option %s: %s\n", 
152                                 poptBadOption(pc, 0), poptStrerror(opt));
153                         exit(1);
154                 }
155         }
156
157         /* setup the remaining options for the main program to use */
158         extra_argv = poptGetArgs(pc);
159         if (extra_argv) {
160                 extra_argv++;
161                 while (extra_argv[extra_argc]) extra_argc++;
162         }
163
164         talloc_enable_null_tracking();
165
166         ctdb_block_signal(SIGPIPE);
167         fault_setup("ctdbd");
168
169         ev = event_context_init(NULL);
170         tevent_loop_allow_nesting(ev);
171
172         ctdb = ctdb_cmdline_init(ev);
173
174         ctdb->start_as_disabled = options.start_as_disabled;
175         ctdb->start_as_stopped  = options.start_as_stopped;
176
177         script_log_level = options.script_log_level;
178
179         ret = ctdb_set_logfile(ctdb, options.logfile, options.use_syslog);
180         if (ret == -1) {
181                 printf("ctdb_set_logfile to %s failed - %s\n", 
182                        options.use_syslog?"syslog":options.logfile, ctdb_errstr(ctdb));
183                 exit(1);
184         }
185
186         DEBUG(DEBUG_NOTICE,("CTDB starting on node\n"));
187
188         gettimeofday(&ctdb->ctdbd_start_time, NULL);
189         gettimeofday(&ctdb->last_recovery_started, NULL);
190         gettimeofday(&ctdb->last_recovery_finished, NULL);
191         ctdb->recovery_mode    = CTDB_RECOVERY_NORMAL;
192         ctdb->recovery_master  = (uint32_t)-1;
193         ctdb->upcalls          = &ctdb_upcalls;
194         ctdb->idr              = idr_init(ctdb);
195         ctdb->recovery_lock_fd = -1;
196
197         ctdb_tunables_set_defaults(ctdb);
198
199         ret = ctdb_set_recovery_lock_file(ctdb, options.recovery_lock_file);
200         if (ret == -1) {
201                 DEBUG(DEBUG_ALERT,("ctdb_set_recovery_lock_file failed - %s\n", ctdb_errstr(ctdb)));
202                 exit(1);
203         }
204
205         ret = ctdb_set_transport(ctdb, options.transport);
206         if (ret == -1) {
207                 DEBUG(DEBUG_ALERT,("ctdb_set_transport failed - %s\n", ctdb_errstr(ctdb)));
208                 exit(1);
209         }
210
211         /* tell ctdb what address to listen on */
212         if (options.myaddress) {
213                 ret = ctdb_set_address(ctdb, options.myaddress);
214                 if (ret == -1) {
215                         DEBUG(DEBUG_ALERT,("ctdb_set_address failed - %s\n", ctdb_errstr(ctdb)));
216                         exit(1);
217                 }
218         }
219
220         /* set ctdbd capabilities */
221         ctdb->capabilities = 0;
222         if (options.no_lmaster == 0) {
223                 ctdb->capabilities |= CTDB_CAP_LMASTER;
224         }
225         if (options.no_recmaster == 0) {
226                 ctdb->capabilities |= CTDB_CAP_RECMASTER;
227         }
228         if (options.lvs != 0) {
229                 ctdb->capabilities |= CTDB_CAP_LVS;
230         }
231
232         /* Initialise this node's PNN to the unknown value.  This will
233          * be set to the correct value by either ctdb_add_node() as
234          * part of loading the nodes file or by
235          * ctdb_tcp_listen_automatic() when the transport is
236          * initialised.  At some point we should de-optimise this and
237          * pull it out into ctdb_start_daemon() so it is done clearly
238          * and only in one place.
239          */
240         ctdb->pnn = -1;
241
242         /* Default value for CTDB_BASE - don't override */
243         setenv("CTDB_BASE", ETCDIR "/ctdb", 0);
244
245         /* tell ctdb what nodes are available */
246         if (options.nlist != NULL) {
247                 ctdb->nodes_file = options.nlist;
248         } else {
249                 ctdb->nodes_file =
250                         talloc_asprintf(ctdb, "%s/nodes", getenv("CTDB_BASE"));
251                 if (ctdb->nodes_file == NULL) {
252                         DEBUG(DEBUG_ALERT,(__location__ " Out of memory\n"));
253                         exit(1);
254                 }
255         }
256         ctdb_load_nodes_file(ctdb);
257
258         if (options.db_dir) {
259                 ret = ctdb_set_tdb_dir(ctdb, options.db_dir);
260                 if (ret == -1) {
261                         DEBUG(DEBUG_ALERT,("ctdb_set_tdb_dir failed - %s\n", ctdb_errstr(ctdb)));
262                         exit(1);
263                 }
264         }
265         if (options.db_dir_persistent) {
266                 ret = ctdb_set_tdb_dir_persistent(ctdb, options.db_dir_persistent);
267                 if (ret == -1) {
268                         DEBUG(DEBUG_ALERT,("ctdb_set_tdb_dir_persistent failed - %s\n", ctdb_errstr(ctdb)));
269                         exit(1);
270                 }
271         }
272         if (options.db_dir_state) {
273                 ret = ctdb_set_tdb_dir_state(ctdb, options.db_dir_state);
274                 if (ret == -1) {
275                         DEBUG(DEBUG_ALERT,("ctdb_set_tdb_dir_state failed - %s\n", ctdb_errstr(ctdb)));
276                         exit(1);
277                 }
278         }
279
280         if (options.public_interface) {
281                 ctdb->default_public_interface = talloc_strdup(ctdb, options.public_interface);
282                 CTDB_NO_MEMORY(ctdb, ctdb->default_public_interface);
283         }
284
285         if (options.single_public_ip) {
286                 if (options.public_interface == NULL) {
287                         DEBUG(DEBUG_ALERT,("--single_public_ip used but --public_interface is not specified. You must specify the public interface when using single public ip. Exiting\n"));
288                         exit(10);
289                 }
290
291                 ret = ctdb_set_single_public_ip(ctdb, options.public_interface,
292                                                 options.single_public_ip);
293                 if (ret != 0) {
294                         DEBUG(DEBUG_ALERT,("Invalid --single-public-ip argument : %s . This is not a valid ip address. Exiting.\n", options.single_public_ip));
295                         exit(10);
296                 }
297         }
298
299         ret = ctdb_set_event_script_dir(ctdb, options.event_script_dir);
300         if (ret == -1) {
301                 DEBUG(DEBUG_ALERT,("Unable to setup event script directory\n"));
302                 exit(1);
303         }
304
305         if (options.notification_script != NULL) {
306                 ret = ctdb_set_notification_script(ctdb, options.notification_script);
307                 if (ret == -1) {
308                         DEBUG(DEBUG_ALERT,("Unable to setup notification script\n"));
309                         exit(1);
310                 }
311         }
312
313         ctdb->valgrinding = options.valgrinding;
314         if (options.valgrinding || options.nosetsched) {
315                 ctdb->do_setsched = 0;
316         } else {
317                 ctdb->do_setsched = 1;
318         }
319
320         ctdb->do_checkpublicip = !options.no_publicipcheck;
321
322         if (options.max_persistent_check_errors < 0) {
323                 ctdb->max_persistent_check_errors = 0xFFFFFFFFFFFFFFFFLL;
324         } else {
325                 ctdb->max_persistent_check_errors = (uint64_t)options.max_persistent_check_errors;
326         }
327
328         /* start the protocol running (as a child) */
329         return ctdb_start_daemon(ctdb, interactive?false:true, options.use_syslog, options.public_address_list);
330 }