ctdbd: Add an index db for message list for faster searches
[ctdb.git] / include / ctdb_private.h
1 /* 
2    ctdb database library
3
4    Copyright (C) Andrew Tridgell  2006
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 3 of the License, or
9    (at your option) any later version.
10    
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15    
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, see <http://www.gnu.org/licenses/>.
18 */
19
20 #ifndef _CTDB_PRIVATE_H
21 #define _CTDB_PRIVATE_H
22
23 #include "ctdb_client.h"
24 #include <sys/socket.h>
25
26 /*
27   recovery daemon memdump reply address
28  */
29 struct rd_memdump_reply {
30         uint32_t pnn;
31         uint64_t srvid;
32 };
33
34 /*
35   description for a TAKEOVER_RUN message reply address
36  */
37 struct takeover_run_reply {
38         uint32_t pnn;
39         uint64_t srvid;
40 };
41
42 /*
43  * pid of the ctdbd daemon
44  */
45 extern pid_t ctdbd_pid;
46
47 /*
48   a tcp connection description
49   also used by tcp_add and tcp_remove controls
50  */
51 struct ctdb_tcp_connection {
52         ctdb_sock_addr src_addr;
53         ctdb_sock_addr dst_addr;
54 };
55
56 /* the wire representation for a tcp tickle array */
57 struct ctdb_tcp_wire_array {
58         uint32_t num;
59         struct ctdb_tcp_connection connections[1];
60 };      
61
62 /* the list of tcp tickles used by get/set tcp tickle list */
63 struct ctdb_control_tcp_tickle_list {
64         ctdb_sock_addr addr;
65         struct ctdb_tcp_wire_array tickles;
66 };
67
68 /*
69   array of tcp connections
70  */
71 struct ctdb_tcp_array {
72         uint32_t num;
73         struct ctdb_tcp_connection *connections;
74 };      
75
76
77 /* all tunable variables go in here */
78 struct ctdb_tunable {
79         uint32_t max_redirect_count;
80         uint32_t seqnum_interval; /* unit is ms */
81         uint32_t control_timeout;
82         uint32_t traverse_timeout;
83         uint32_t keepalive_interval;
84         uint32_t keepalive_limit;
85         uint32_t recover_timeout;
86         uint32_t recover_interval;
87         uint32_t election_timeout;
88         uint32_t takeover_timeout;
89         uint32_t monitor_interval;
90         uint32_t tickle_update_interval;
91         uint32_t script_timeout;
92         uint32_t script_timeout_count; /* allow dodgy scripts to hang this many times in a row before we mark the node unhealthy */
93         uint32_t script_unhealthy_on_timeout; /* obsolete */
94         uint32_t recovery_grace_period;
95         uint32_t recovery_ban_period;
96         uint32_t database_hash_size;
97         uint32_t database_max_dead;
98         uint32_t rerecovery_timeout;
99         uint32_t enable_bans;
100         uint32_t deterministic_public_ips;
101         uint32_t reclock_ping_period;
102         uint32_t no_ip_failback;
103         uint32_t disable_ip_failover;
104         uint32_t verbose_memory_names;
105         uint32_t recd_ping_timeout;
106         uint32_t recd_ping_failcount;
107         uint32_t log_latency_ms;
108         uint32_t reclock_latency_ms;
109         uint32_t recovery_drop_all_ips;
110         uint32_t verify_recovery_lock;
111         uint32_t vacuum_interval;
112         uint32_t vacuum_default_interval;
113         uint32_t vacuum_max_run_time;
114         uint32_t repack_limit;
115         uint32_t vacuum_limit;
116         uint32_t vacuum_min_interval;
117         uint32_t vacuum_max_interval;
118         uint32_t max_queue_depth_drop_msg;
119         uint32_t use_status_events_for_monitoring;
120         uint32_t allow_unhealthy_db_read;
121         uint32_t stat_history_interval;
122         uint32_t deferred_attach_timeout;
123         uint32_t vacuum_fast_path_count;
124         uint32_t lcp2_public_ip_assignment;
125         uint32_t allow_client_db_attach;
126         uint32_t recover_pdb_by_seqnum;
127         uint32_t deferred_rebalance_on_node_add;
128         uint32_t fetch_collapse;
129         uint32_t max_lacount;
130         uint32_t hopcount_make_sticky;
131         uint32_t sticky_duration;
132         uint32_t sticky_pindown;
133         uint32_t no_ip_takeover;
134         uint32_t db_record_count_warn;
135         uint32_t db_record_size_warn;
136         uint32_t db_size_warn;
137         uint32_t pulldb_preallocation_size;
138         uint32_t no_ip_takeover_on_disabled;
139         uint32_t deadlock_timeout;
140         uint32_t samba3_hack;
141 };
142
143 /*
144   an installed ctdb remote call
145 */
146 struct ctdb_registered_call {
147         struct ctdb_registered_call *next, *prev;
148         uint32_t id;
149         ctdb_fn_t fn;
150 };
151
152 /*
153   this address structure might need to be generalised later for some
154   transports
155 */
156 struct ctdb_address {
157         const char *address;
158         int port;
159 };
160
161 /*
162   check that a pnn is valid
163  */
164 #define ctdb_validate_pnn(ctdb, pnn) (((uint32_t)(pnn)) < (ctdb)->num_nodes)
165
166
167 /* called from the queue code when a packet comes in. Called with data==NULL
168    on error */
169 typedef void (*ctdb_queue_cb_fn_t)(uint8_t *data, size_t length,
170                                    void *private_data);
171
172 /* used for callbacks in ctdb_control requests */
173 typedef void (*ctdb_control_callback_fn_t)(struct ctdb_context *,
174                                            int32_t status, TDB_DATA data, 
175                                            const char *errormsg,
176                                            void *private_data);
177 /*
178   structure describing a connected client in the daemon
179  */
180 struct ctdb_client {
181         struct ctdb_context *ctdb;
182         int fd;
183         struct ctdb_queue *queue;
184         uint32_t client_id;
185         pid_t pid;
186         struct ctdb_tcp_list *tcp_list;
187         uint32_t db_id;
188         uint32_t num_persistent_updates;
189         struct ctdb_client_notify_list *notify;
190 };
191
192 struct ctdb_iface;
193
194 /* state associated with a public ip address */
195 struct ctdb_vnn {
196         struct ctdb_vnn *prev, *next;
197
198         struct ctdb_iface *iface;
199         const char **ifaces;
200         ctdb_sock_addr public_address;
201         uint8_t public_netmask_bits;
202
203         /* the node number that is serving this public address, if any. 
204            If no node serves this ip it is set to -1 */
205         int32_t pnn;
206
207         /* List of clients to tickle for this public address */
208         struct ctdb_tcp_array *tcp_array;
209
210         /* whether we need to update the other nodes with changes to our list
211            of connected clients */
212         bool tcp_update_needed;
213
214         /* a context to hang sending gratious arp events off */
215         TALLOC_CTX *takeover_ctx;
216
217         struct ctdb_kill_tcp *killtcp;
218
219         /* Set to true any time an update to this VNN is in flight.
220            This helps to avoid races. */
221         bool update_in_flight;
222 };
223
224 /*
225   state associated with one node
226 */
227 struct ctdb_node {
228         struct ctdb_context *ctdb;
229         struct ctdb_address address;
230         const char *name; /* for debug messages */
231         void *private_data; /* private to transport */
232         uint32_t pnn;
233         uint32_t flags;
234
235         /* used by the dead node monitoring */
236         uint32_t dead_count;
237         uint32_t rx_cnt;
238         uint32_t tx_cnt;
239
240         /* used to track node capabilities, is only valid/tracked inside the
241            recovery daemon.
242         */
243         uint32_t capabilities;
244
245         /* a list of controls pending to this node, so we can time them out quickly
246            if the node becomes disconnected */
247         struct daemon_control_state *pending_controls;
248
249         /* used by the recovery daemon when distributing ip addresses 
250            across the nodes.  it needs to know which public ip's can be handled
251            by each node.
252         */
253         struct ctdb_all_public_ips *known_public_ips;
254         struct ctdb_all_public_ips *available_public_ips;
255         /* used by the recovery dameon to track when a node should be banned */
256         struct ctdb_banning_state *ban_state; 
257 };
258
259 /*
260   transport specific methods
261 */
262 struct ctdb_methods {
263         int (*initialise)(struct ctdb_context *); /* initialise transport structures */ 
264         int (*start)(struct ctdb_context *); /* start the transport */
265         int (*add_node)(struct ctdb_node *); /* setup a new node */     
266         int (*connect_node)(struct ctdb_node *); /* connect to node */
267         int (*queue_pkt)(struct ctdb_node *, uint8_t *data, uint32_t length);
268         void *(*allocate_pkt)(TALLOC_CTX *mem_ctx, size_t );
269         void (*shutdown)(struct ctdb_context *); /* shutdown transport */
270         void (*restart)(struct ctdb_node *); /* stop and restart the connection */
271 };
272
273 /*
274   transport calls up to the ctdb layer
275 */
276 struct ctdb_upcalls {
277         /* recv_pkt is called when a packet comes in */
278         void (*recv_pkt)(struct ctdb_context *, uint8_t *data, uint32_t length);
279
280         /* node_dead is called when an attempt to send to a node fails */
281         void (*node_dead)(struct ctdb_node *);
282
283         /* node_connected is called when a connection to a node is established */
284         void (*node_connected)(struct ctdb_node *);
285 };
286
287 /* list of message handlers - needs to be changed to a more efficient data
288    structure so we can find a message handler given a srvid quickly */
289 struct ctdb_message_list_header {
290         struct ctdb_message_list_header *next, *prev;
291         struct ctdb_context *ctdb;
292         uint64_t srvid;
293         struct ctdb_message_list *m;
294 };
295 struct ctdb_message_list {
296         struct ctdb_message_list *next, *prev;
297         struct ctdb_message_list_header *h;
298         ctdb_msg_fn_t message_handler;
299         void *message_private;
300 };
301
302 /* additional data required for the daemon mode */
303 struct ctdb_daemon_data {
304         int sd;
305         char *name;
306         struct ctdb_queue *queue;
307 };
308
309
310 #define CTDB_UPDATE_STAT(ctdb, counter, value) \
311         {                                                                               \
312                 if (value > ctdb->statistics.counter) {                                 \
313                         ctdb->statistics.counter = c->hopcount;                         \
314                 }                                                                       \
315                 if (value > ctdb->statistics_current.counter) {                         \
316                         ctdb->statistics_current.counter = c->hopcount;                 \
317                 }                                                                       \
318         }
319
320 #define CTDB_INCREMENT_STAT(ctdb, counter) \
321         {                                                                               \
322                 ctdb->statistics.counter++;                                             \
323                 ctdb->statistics_current.counter++;                                     \
324         }
325
326 #define CTDB_DECREMENT_STAT(ctdb, counter) \
327         {                                                                               \
328                 if (ctdb->statistics.counter > 0)                                       \
329                         ctdb->statistics.counter--;                                     \
330                 if (ctdb->statistics_current.counter > 0)                               \
331                         ctdb->statistics_current.counter--;                             \
332         }
333
334 #define CTDB_INCREMENT_DB_STAT(ctdb_db, counter) \
335         {                                                                               \
336                 ctdb_db->statistics.counter++;                                          \
337         }
338
339 #define CTDB_DECREMENT_DB_STAT(ctdb_db, counter) \
340         {                                                                               \
341                 if (ctdb_db->statistics.counter > 0)                                    \
342                         ctdb_db->statistics.counter--;                                  \
343         }
344
345 #define CTDB_UPDATE_RECLOCK_LATENCY(ctdb, name, counter, value) \
346         {                                                                               \
347                 if (value > ctdb->statistics.counter.max)                               \
348                         ctdb->statistics.counter.max = value;                           \
349                 if (value > ctdb->statistics_current.counter.max)                       \
350                         ctdb->statistics_current.counter.max = value;                   \
351                                                                                         \
352                 if (ctdb->statistics.counter.num == 0 ||                                \
353                     value < ctdb->statistics.counter.min)                               \
354                         ctdb->statistics.counter.min = value;                           \
355                 if (ctdb->statistics_current.counter.num == 0 ||                        \
356                     value < ctdb->statistics_current.counter.min)                       \
357                         ctdb->statistics_current.counter.min = value;                   \
358                                                                                         \
359                 ctdb->statistics.counter.total += value;                                \
360                 ctdb->statistics_current.counter.total += value;                        \
361                                                                                         \
362                 ctdb->statistics.counter.num++;                                         \
363                 ctdb->statistics_current.counter.num++;                                 \
364                                                                                         \
365                 if (ctdb->tunable.reclock_latency_ms != 0) {                            \
366                         if (value*1000 > ctdb->tunable.reclock_latency_ms) {            \
367                                 DEBUG(DEBUG_ERR,                                        \
368                                       ("High RECLOCK latency %fs for operation %s\n",   \
369                                        value, name));                                   \
370                         }                                                               \
371                 }                                                                       \
372         }
373
374 #define CTDB_UPDATE_DB_LATENCY(ctdb_db, operation, counter, value)                      \
375         {                                                                               \
376                 if (value > ctdb_db->statistics.counter.max)                            \
377                         ctdb_db->statistics.counter.max = value;                        \
378                 if (ctdb_db->statistics.counter.num == 0 ||                             \
379                     value < ctdb_db->statistics.counter.min)                            \
380                         ctdb_db->statistics.counter.min = value;                        \
381                                                                                         \
382                 ctdb_db->statistics.counter.total += value;                             \
383                 ctdb_db->statistics.counter.num++;                                      \
384                                                                                         \
385                 if (ctdb_db->ctdb->tunable.log_latency_ms != 0) {                       \
386                         if (value*1000 > ctdb_db->ctdb->tunable.log_latency_ms) {       \
387                                 DEBUG(DEBUG_ERR,                                        \
388                                       ("High latency %.6fs for operation %s on database %s\n",\
389                                        value, operation, ctdb_db->db_name));            \
390                         }                                                               \
391                 }                                                                       \
392         }
393
394 #define CTDB_UPDATE_LATENCY(ctdb, db, operation, counter, t) \
395         {                                                                               \
396                 double l = timeval_elapsed(&t);                                         \
397                                                                                         \
398                 if (l > ctdb->statistics.counter.max)                                   \
399                         ctdb->statistics.counter.max = l;                               \
400                 if (l > ctdb->statistics_current.counter.max)                           \
401                         ctdb->statistics_current.counter.max = l;                       \
402                                                                                         \
403                 if (ctdb->statistics.counter.num == 0 ||                                \
404                     l < ctdb->statistics.counter.min)                                   \
405                         ctdb->statistics.counter.min = l;                               \
406                 if (ctdb->statistics_current.counter.num == 0 ||                        \
407                     l < ctdb->statistics_current.counter.min)                           \
408                         ctdb->statistics_current.counter.min = l;                       \
409                                                                                         \
410                 ctdb->statistics.counter.total += l;                                    \
411                 ctdb->statistics_current.counter.total += l;                            \
412                                                                                         \
413                 ctdb->statistics.counter.num++;                                         \
414                 ctdb->statistics_current.counter.num++;                                 \
415                                                                                         \
416                 if (ctdb->tunable.log_latency_ms != 0) {                                \
417                         if (l*1000 > ctdb->tunable.log_latency_ms) {                    \
418                                 DEBUG(DEBUG_WARNING,                                    \
419                                       ("High latency %.6fs for operation %s on database %s\n",\
420                                        l, operation, db->db_name));                     \
421                         }                                                               \
422                 }                                                                       \
423         }
424
425
426
427 /* a structure that contains the elements required for the write record
428    control
429 */
430 struct ctdb_write_record {
431         uint32_t dbid;
432         uint32_t keylen;
433         uint32_t datalen;
434         unsigned char blob[1];
435 };
436
437 enum ctdb_freeze_mode {CTDB_FREEZE_NONE, CTDB_FREEZE_PENDING, CTDB_FREEZE_FROZEN};
438
439 #define CTDB_MONITORING_ACTIVE          0
440 #define CTDB_MONITORING_DISABLED        1
441
442 #define NUM_DB_PRIORITIES 3
443 /* main state of the ctdb daemon */
444 struct ctdb_context {
445         struct tevent_context *ev;
446         struct timeval ctdbd_start_time;
447         struct timeval last_recovery_started;
448         struct timeval last_recovery_finished;
449         uint32_t recovery_mode;
450         TALLOC_CTX *tickle_update_context;
451         TALLOC_CTX *keepalive_ctx;
452         TALLOC_CTX *check_public_ifaces_ctx;
453         struct ctdb_tunable tunable;
454         enum ctdb_freeze_mode freeze_mode[NUM_DB_PRIORITIES+1];
455         struct ctdb_freeze_handle *freeze_handles[NUM_DB_PRIORITIES+1];
456         bool freeze_transaction_started;
457         uint32_t freeze_transaction_id;
458         struct ctdb_address address;
459         const char *name;
460         const char *db_directory;
461         const char *db_directory_persistent;
462         const char *db_directory_state;
463         struct tdb_wrap *db_persistent_health;
464         uint32_t db_persistent_startup_generation;
465         uint64_t db_persistent_check_errors;
466         uint64_t max_persistent_check_errors;
467         const char *transport;
468         char *recovery_lock_file;
469         int recovery_lock_fd;
470         uint32_t pnn; /* our own pnn */
471         uint32_t num_nodes;
472         uint32_t num_connected;
473         unsigned flags;
474         uint32_t capabilities;
475         struct idr_context *idr;
476         int lastid;
477         struct ctdb_node **nodes; /* array of nodes in the cluster - indexed by vnn */
478         struct ctdb_vnn *vnn; /* list of public ip addresses and interfaces */
479         struct ctdb_vnn *single_ip_vnn; /* a structure for the single ip */
480         struct ctdb_iface *ifaces; /* list of local interfaces */
481         char *err_msg;
482         const struct ctdb_methods *methods; /* transport methods */
483         const struct ctdb_upcalls *upcalls; /* transport upcalls */
484         void *private_data; /* private to transport */
485         struct ctdb_db_context *db_list;
486         struct ctdb_message_list_header *message_list_header;
487         struct tdb_context *message_list_indexdb;
488         struct ctdb_daemon_data daemon;
489         struct ctdb_statistics statistics;
490         struct ctdb_statistics statistics_current;
491 #define MAX_STAT_HISTORY 100
492         struct ctdb_statistics statistics_history[MAX_STAT_HISTORY];
493         struct ctdb_vnn_map *vnn_map;
494         uint32_t num_clients;
495         uint32_t recovery_master;
496         struct ctdb_call_state *pending_calls;
497         struct ctdb_client_ip *client_ip_list;
498         bool do_checkpublicip;
499         struct trbt_tree *server_ids; 
500         bool do_setsched;
501         void *saved_scheduler_param;
502         const char *event_script_dir;
503         const char *notification_script;
504         const char *default_public_interface;
505         pid_t ctdbd_pid;
506         pid_t recoverd_pid;
507         pid_t syslogd_pid;
508         bool done_startup;
509         struct ctdb_monitor_state *monitor;
510         struct ctdb_log_state *log;
511         int start_as_disabled;
512         int start_as_stopped;
513         bool valgrinding;
514         uint32_t event_script_timeouts; /* counting how many consecutive times an eventscript has timedout */
515         uint32_t *recd_ping_count;
516         TALLOC_CTX *recd_ctx; /* a context used to track recoverd monitoring events */
517         TALLOC_CTX *release_ips_ctx; /* a context used to automatically drop all IPs if we fail to recover the node */
518
519         TALLOC_CTX *event_script_ctx;
520
521         struct ctdb_event_script_state *current_monitor;
522         struct ctdb_scripts_wire *last_status[CTDB_EVENT_MAX];
523
524         TALLOC_CTX *banning_ctx;
525
526         struct ctdb_vacuum_child_context *vacuumers;
527
528         /* mapping from pid to ctdb_client * */
529         struct ctdb_client_pid_list *client_pids;
530
531         /* used in the recovery daemon to remember the ip allocation */
532         struct trbt_tree *ip_tree;
533
534         /* Used to defer db attach requests while in recovery mode */
535         struct ctdb_deferred_attach_context *deferred_attach;
536
537         /* if we are a child process, do we have a domain socket to send controls on */
538         bool can_send_controls;
539
540         /* list of event script callback functions that are active */
541         struct event_script_callback *script_callbacks;
542
543         struct ctdb_reloadips_handle *reload_ips;
544
545         const char *public_addresses_file;
546         struct trbt_tree *child_processes; 
547
548         /* Used for locking record/db/alldb */
549         int lock_num_current;
550         int lock_num_pending;
551         struct lock_context *lock_current;
552         struct lock_context *lock_pending;
553 };
554
555 struct ctdb_db_context {
556         struct ctdb_db_context *next, *prev;
557         struct ctdb_context *ctdb;
558         uint32_t db_id;
559         uint32_t priority;
560         bool persistent;
561         bool readonly; /* Do we support read-only delegations ? */
562         bool sticky; /* Do we support sticky records ? */
563         const char *db_name;
564         const char *db_path;
565         struct tdb_wrap *ltdb;
566         struct tdb_context *rottdb; /* ReadOnly tracking TDB */
567         struct ctdb_registered_call *calls; /* list of registered calls */
568         uint32_t seqnum;
569         struct timed_event *seqnum_update;
570         struct ctdb_traverse_local_handle *traverse;
571         bool transaction_active;
572         struct ctdb_vacuum_handle *vacuum_handle;
573         char *unhealthy_reason;
574         int pending_requests;
575         struct revokechild_handle *revokechild_active;
576         struct ctdb_persistent_state *persistent_state;
577         struct trbt_tree *delete_queue;
578         struct trbt_tree *sticky_records; 
579         int (*ctdb_ltdb_store_fn)(struct ctdb_db_context *ctdb_db,
580                                   TDB_DATA key,
581                                   struct ctdb_ltdb_header *header,
582                                   TDB_DATA data);
583
584         /* used to track which records we are currently fetching
585            so we can avoid sending duplicate fetch requests
586         */
587         struct trbt_tree *deferred_fetch;
588
589         struct ctdb_db_statistics statistics;
590 };
591
592
593 #define CTDB_NO_MEMORY(ctdb, p) do { if (!(p)) { \
594           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
595           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
596           return -1; }} while (0)
597
598 #define CTDB_NO_MEMORY_VOID(ctdb, p) do { if (!(p)) { \
599           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
600           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
601           return; }} while (0)
602
603 #define CTDB_NO_MEMORY_NULL(ctdb, p) do { if (!(p)) { \
604           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
605           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
606           return NULL; }} while (0)
607
608 #define CTDB_NO_MEMORY_FATAL(ctdb, p) do { if (!(p)) { \
609           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
610           ctdb_fatal(ctdb, "Out of memory in " __location__ ); \
611           }} while (0)
612
613 /*
614   structure passed in set_call control
615  */
616 struct ctdb_control_set_call {
617         uint32_t db_id;
618         ctdb_fn_t fn;
619         uint32_t id;
620 };
621
622 /*
623   struct for kill_tcp control
624  */
625 struct ctdb_control_killtcp {
626         ctdb_sock_addr src_addr;
627         ctdb_sock_addr dst_addr;
628 };
629
630 /*
631   struct holding a ctdb_sock_addr and an interface name,
632   used to add/remove public addresses
633  */
634 struct ctdb_control_ip_iface {
635         ctdb_sock_addr addr;
636         uint32_t mask;
637         uint32_t len;
638         char iface[1];
639 };
640
641 /*
642   struct holding a ctdb_sock_addr and an interface name,
643   used for send_gratious_arp
644  */
645 struct ctdb_control_gratious_arp {
646         ctdb_sock_addr addr;
647         uint32_t mask;
648         uint32_t len;
649         char iface[1];
650 };
651
652 /*
653   persistent store control - update this record on all other nodes
654  */
655 struct ctdb_control_persistent_store {
656         uint32_t db_id;
657         uint32_t len;
658         uint8_t  data[1];
659 };
660
661 /*
662   structure used for CTDB_SRVID_NODE_FLAGS_CHANGED
663  */
664 struct ctdb_node_flag_change {
665         uint32_t pnn;
666         uint32_t new_flags;
667         uint32_t old_flags;
668 };
669
670 /*
671   struct for admin setting a ban
672  */
673 struct ctdb_ban_info {
674         uint32_t pnn;
675         uint32_t ban_time;
676 };
677
678 enum call_state {CTDB_CALL_WAIT, CTDB_CALL_DONE, CTDB_CALL_ERROR};
679
680 #define CTDB_LMASTER_ANY        0xffffffff
681
682 /*
683   state of a in-progress ctdb call
684 */
685 struct ctdb_call_state {
686         struct ctdb_call_state *next, *prev;
687         enum call_state state;
688         uint32_t reqid;
689         struct ctdb_req_call *c;
690         struct ctdb_db_context *ctdb_db;
691         const char *errmsg;
692         struct ctdb_call *call;
693         uint32_t generation;
694         struct {
695                 void (*fn)(struct ctdb_call_state *);
696                 void *private_data;
697         } async;
698 };
699
700
701 /* used for fetch_lock */
702 struct ctdb_fetch_handle {
703         struct ctdb_db_context *ctdb_db;
704         TDB_DATA key;
705         TDB_DATA *data;
706         struct ctdb_ltdb_header header;
707 };
708
709 /* internal prototypes */
710 void ctdb_set_error(struct ctdb_context *ctdb, const char *fmt, ...) PRINTF_ATTRIBUTE(2,3);
711 void ctdb_fatal(struct ctdb_context *ctdb, const char *msg);
712 void ctdb_external_trace(void);
713 bool ctdb_same_address(struct ctdb_address *a1, struct ctdb_address *a2);
714 int ctdb_parse_address(struct ctdb_context *ctdb,
715                        TALLOC_CTX *mem_ctx, const char *str,
716                        struct ctdb_address *address);
717 bool ctdb_same_ip(const ctdb_sock_addr *ip1, const ctdb_sock_addr *ip2);
718 bool ctdb_same_sockaddr(const ctdb_sock_addr *ip1, const ctdb_sock_addr *ip2);
719 uint32_t ctdb_hash(const TDB_DATA *key);
720 uint32_t ctdb_hash_string(const char *str);
721 void ctdb_request_call(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
722 void ctdb_request_dmaster(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
723 void ctdb_request_message(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
724 void ctdb_reply_dmaster(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
725 void ctdb_reply_call(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
726 void ctdb_reply_error(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
727
728 uint32_t ctdb_lmaster(struct ctdb_context *ctdb, const TDB_DATA *key);
729 int ctdb_ltdb_fetch(struct ctdb_db_context *ctdb_db, 
730                     TDB_DATA key, struct ctdb_ltdb_header *header, 
731                     TALLOC_CTX *mem_ctx, TDB_DATA *data);
732 int ctdb_ltdb_store(struct ctdb_db_context *ctdb_db, TDB_DATA key, 
733                     struct ctdb_ltdb_header *header, TDB_DATA data);
734 int ctdb_ltdb_delete(struct ctdb_db_context *ctdb_db, TDB_DATA key);
735 int ctdb_ltdb_fetch_with_header(struct ctdb_db_context *ctdb_db, 
736                     TDB_DATA key, struct ctdb_ltdb_header *header, 
737                     TALLOC_CTX *mem_ctx, TDB_DATA *data);
738 int32_t ctdb_control_start_persistent_update(struct ctdb_context *ctdb, 
739                         struct ctdb_req_control *c,
740                         TDB_DATA recdata);
741 int32_t ctdb_control_cancel_persistent_update(struct ctdb_context *ctdb, 
742                         struct ctdb_req_control *c,
743                         TDB_DATA recdata);
744 void ctdb_queue_packet(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
745 void ctdb_queue_packet_opcode(struct ctdb_context *ctdb, struct ctdb_req_header *hdr, unsigned opcode);
746 int ctdb_ltdb_lock_requeue(struct ctdb_db_context *ctdb_db, 
747                            TDB_DATA key, struct ctdb_req_header *hdr,
748                            void (*recv_pkt)(void *, struct ctdb_req_header *),
749                            void *recv_context, bool ignore_generation);
750 int ctdb_ltdb_lock_fetch_requeue(struct ctdb_db_context *ctdb_db, 
751                                  TDB_DATA key, struct ctdb_ltdb_header *header, 
752                                  struct ctdb_req_header *hdr, TDB_DATA *data,
753                                  void (*recv_pkt)(void *, struct ctdb_req_header *),
754                                  void *recv_context, bool ignore_generation);
755 void ctdb_input_pkt(struct ctdb_context *ctdb, struct ctdb_req_header *);
756
757 struct ctdb_call_state *ctdb_call_local_send(struct ctdb_db_context *ctdb_db, 
758                                              struct ctdb_call *call,
759                                              struct ctdb_ltdb_header *header,
760                                              TDB_DATA *data);
761
762
763 int ctdbd_start(struct ctdb_context *ctdb);
764 struct ctdb_call_state *ctdbd_call_send(struct ctdb_db_context *ctdb_db, struct ctdb_call *call);
765 int ctdbd_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
766
767 /*
768   queue a packet for sending
769 */
770 int ctdb_queue_send(struct ctdb_queue *queue, uint8_t *data, uint32_t length);
771
772 /*
773   setup the fd used by the queue
774  */
775 int ctdb_queue_set_fd(struct ctdb_queue *queue, int fd);
776
777 /*
778   setup a packet queue on a socket
779  */
780 struct ctdb_queue *ctdb_queue_setup(struct ctdb_context *ctdb,
781                                     TALLOC_CTX *mem_ctx, int fd, int alignment,
782                                     
783                                     ctdb_queue_cb_fn_t callback,
784                                     void *private_data, const char *fmt, ...)
785         PRINTF_ATTRIBUTE(7,8);
786
787 /*
788   allocate a packet for use in client<->daemon communication
789  */
790 struct ctdb_req_header *_ctdbd_allocate_pkt(struct ctdb_context *ctdb,
791                                             TALLOC_CTX *mem_ctx, 
792                                             enum ctdb_operation operation, 
793                                             size_t length, size_t slength,
794                                             const char *type);
795 #define ctdbd_allocate_pkt(ctdb, mem_ctx, operation, length, type) \
796         (type *)_ctdbd_allocate_pkt(ctdb, mem_ctx, operation, length, sizeof(type), #type)
797
798 struct ctdb_req_header *_ctdb_transport_allocate(struct ctdb_context *ctdb,
799                                                  TALLOC_CTX *mem_ctx, 
800                                                  enum ctdb_operation operation, 
801                                                  size_t length, size_t slength,
802                                                  const char *type);
803 #define ctdb_transport_allocate(ctdb, mem_ctx, operation, length, type) \
804         (type *)_ctdb_transport_allocate(ctdb, mem_ctx, operation, length, sizeof(type), #type)
805
806 int ctdb_queue_length(struct ctdb_queue *queue);
807
808 /*
809   lock a record in the ltdb, given a key
810  */
811 int ctdb_ltdb_lock(struct ctdb_db_context *ctdb_db, TDB_DATA key);
812
813 /*
814   unlock a record in the ltdb, given a key
815  */
816 int ctdb_ltdb_unlock(struct ctdb_db_context *ctdb_db, TDB_DATA key);
817
818
819 /*
820   make a ctdb call to the local daemon - async send. Called from client context.
821
822   This constructs a ctdb_call request and queues it for processing. 
823   This call never blocks.
824 */
825 struct ctdb_call_state *ctdb_client_call_send(struct ctdb_db_context *ctdb_db, 
826                                               struct ctdb_call *call);
827
828 /*
829   make a recv call to the local ctdb daemon - called from client context
830
831   This is called when the program wants to wait for a ctdb_call to complete and get the 
832   results. This call will block unless the call has already completed.
833 */
834 int ctdb_client_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
835
836 int ctdb_client_send_message(struct ctdb_context *ctdb, uint32_t vnn,
837                              uint64_t srvid, TDB_DATA data);
838
839 /*
840   send a ctdb message
841 */
842 int ctdb_daemon_send_message(struct ctdb_context *ctdb, uint32_t pnn,
843                              uint64_t srvid, TDB_DATA data);
844
845
846 struct ctdb_call_state *ctdb_daemon_call_send(struct ctdb_db_context *ctdb_db, 
847                                               struct ctdb_call *call);
848
849 int ctdb_daemon_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
850
851 struct ctdb_call_state *ctdb_daemon_call_send_remote(struct ctdb_db_context *ctdb_db, 
852                                                      struct ctdb_call *call, 
853                                                      struct ctdb_ltdb_header *header);
854
855 int ctdb_call_local(struct ctdb_db_context *ctdb_db, struct ctdb_call *call,
856                     struct ctdb_ltdb_header *header, TALLOC_CTX *mem_ctx,
857                     TDB_DATA *data, bool updatetdb, uint32_t caller);
858
859 #define ctdb_reqid_find(ctdb, reqid, type)      (type *)_ctdb_reqid_find(ctdb, reqid, #type, __location__)
860
861 void ctdb_recv_raw_pkt(void *p, uint8_t *data, uint32_t length);
862
863 int ctdb_socket_connect(struct ctdb_context *ctdb);
864 void ctdb_client_read_cb(uint8_t *data, size_t cnt, void *args);
865
866 #define CTDB_BAD_REQID ((uint32_t)-1)
867 uint32_t ctdb_reqid_new(struct ctdb_context *ctdb, void *state);
868 void *_ctdb_reqid_find(struct ctdb_context *ctdb, uint32_t reqid, const char *type, const char *location);
869 void ctdb_reqid_remove(struct ctdb_context *ctdb, uint32_t reqid);
870
871 void ctdb_request_control(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
872 void ctdb_reply_control(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
873
874 int ctdb_daemon_send_control(struct ctdb_context *ctdb, uint32_t destnode,
875                              uint64_t srvid, uint32_t opcode, uint32_t client_id, uint32_t flags,
876                              TDB_DATA data,
877                              ctdb_control_callback_fn_t callback,
878                              void *private_data);
879
880 int32_t ctdb_control_db_attach(struct ctdb_context *ctdb, TDB_DATA indata, 
881                                TDB_DATA *outdata, uint64_t tdb_flags,
882                                bool persistent, uint32_t client_id,
883                                struct ctdb_req_control *c,
884                                bool *async_reply);
885
886 int ctdb_daemon_set_call(struct ctdb_context *ctdb, uint32_t db_id,
887                          ctdb_fn_t fn, int id);
888
889 int ctdb_control(struct ctdb_context *ctdb, uint32_t destnode, uint64_t srvid, 
890                  uint32_t opcode, uint32_t flags, TDB_DATA data, 
891                  TALLOC_CTX *mem_ctx, TDB_DATA *outdata, int32_t *status,
892                  struct timeval *timeout, char **errormsg);
893 int ctdb_control_recv(struct ctdb_context *ctdb, 
894                 struct ctdb_client_control_state *state, 
895                 TALLOC_CTX *mem_ctx,
896                 TDB_DATA *outdata, int32_t *status, char **errormsg);
897
898 struct ctdb_client_control_state *
899 ctdb_control_send(struct ctdb_context *ctdb, 
900                 uint32_t destnode, uint64_t srvid, 
901                 uint32_t opcode, uint32_t flags, TDB_DATA data, 
902                 TALLOC_CTX *mem_ctx,
903                 struct timeval *timeout,
904                 char **errormsg);
905
906
907
908
909 #define CHECK_CONTROL_DATA_SIZE(size) do { \
910  if (indata.dsize != size) { \
911          DEBUG(0,(__location__ " Invalid data size in opcode %u. Got %u expected %u\n", \
912                   opcode, (unsigned)indata.dsize, (unsigned)size));     \
913          return -1; \
914  } \
915  } while (0)
916
917 #define CHECK_CONTROL_MIN_DATA_SIZE(size) do { \
918  if (indata.dsize < size) { \
919          DEBUG(0,(__location__ " Invalid data size in opcode %u. Got %u expected >= %u\n", \
920                   opcode, (unsigned)indata.dsize, (unsigned)size));     \
921          return -1; \
922  } \
923  } while (0)
924
925 int ctdb_control_getvnnmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
926 int ctdb_control_setvnnmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
927 int ctdb_control_getdbmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
928 int ctdb_control_getnodemapv4(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
929 int ctdb_control_getnodemap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
930 int ctdb_control_writerecord(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
931
932
933 /* structure used for pulldb control */
934 struct ctdb_control_pulldb {
935         uint32_t db_id;
936         uint32_t lmaster;
937 };
938
939 /* structure used for sending lists of records */
940 struct ctdb_marshall_buffer {
941         uint32_t db_id;
942         uint32_t count;
943         uint8_t data[1];
944 };
945
946 /* set dmaster control structure */
947 struct ctdb_control_set_dmaster {
948         uint32_t db_id;
949         uint32_t dmaster;
950 };
951
952 /*
953   structure for setting a tunable
954  */
955 struct ctdb_control_set_tunable {
956         uint32_t value;
957         uint32_t length;
958         uint8_t  name[1];
959 };
960
961 /*
962   structure for getting a tunable
963  */
964 struct ctdb_control_get_tunable {
965         uint32_t length;
966         uint8_t  name[1];
967 };
968
969 /*
970   structure for listing tunables
971  */
972 struct ctdb_control_list_tunable {
973         uint32_t length;
974         /* returns a : separated list of tunable names */
975         uint8_t  data[1];
976 };
977
978
979 struct ctdb_node_and_flagsv4 {
980         uint32_t pnn;
981         uint32_t flags;
982         struct sockaddr_in sin;
983 };
984
985 struct ctdb_node_mapv4 {
986         uint32_t num;
987         struct ctdb_node_and_flagsv4 nodes[1];
988 };
989
990 struct ctdb_control_wipe_database {
991         uint32_t db_id;
992         uint32_t transaction_id;
993 };
994
995 /*
996   state of a in-progress ctdb call in client
997 */
998 struct ctdb_client_call_state {
999         enum call_state state;
1000         uint32_t reqid;
1001         struct ctdb_db_context *ctdb_db;
1002         struct ctdb_call *call;
1003         struct {
1004                 void (*fn)(struct ctdb_client_call_state *);
1005                 void *private_data;
1006         } async;
1007 };
1008
1009
1010 int32_t ctdb_control_traverse_start_ext(struct ctdb_context *ctdb,
1011                                         TDB_DATA indata,
1012                                         TDB_DATA *outdata,
1013                                         uint32_t srcnode,
1014                                         uint32_t client_id);
1015 int32_t ctdb_control_traverse_start(struct ctdb_context *ctdb, TDB_DATA indata, 
1016                                     TDB_DATA *outdata, uint32_t srcnode, uint32_t client_id);
1017 int32_t ctdb_control_traverse_all(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1018 int32_t ctdb_control_traverse_data(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1019 int32_t ctdb_control_traverse_kill(struct ctdb_context *ctdb, TDB_DATA indata, 
1020                                     TDB_DATA *outdata, uint32_t srcnode);
1021
1022 int ctdb_dispatch_message(struct ctdb_context *ctdb, uint64_t srvid, TDB_DATA data);
1023 bool ctdb_check_message_handler(struct ctdb_context *ctdb, uint64_t srvid);
1024
1025 int daemon_register_message_handler(struct ctdb_context *ctdb, uint32_t client_id, uint64_t srvid);
1026 int ctdb_deregister_message_handler(struct ctdb_context *ctdb, uint64_t srvid, void *private_data);
1027 int daemon_deregister_message_handler(struct ctdb_context *ctdb, uint32_t client_id, uint64_t srvid);
1028 int daemon_check_srvids(struct ctdb_context *ctdb, TDB_DATA indata,
1029                         TDB_DATA *outdata);
1030
1031 int32_t ctdb_ltdb_enable_seqnum(struct ctdb_context *ctdb, uint32_t db_id);
1032 int32_t ctdb_ltdb_update_seqnum(struct ctdb_context *ctdb, uint32_t db_id, uint32_t srcnode);
1033
1034 struct ctdb_rec_data *ctdb_marshall_record(TALLOC_CTX *mem_ctx, uint32_t reqid, 
1035                                            TDB_DATA key, struct ctdb_ltdb_header *, TDB_DATA data);
1036
1037 struct ctdb_rec_data *ctdb_marshall_loop_next(struct ctdb_marshall_buffer *m, struct ctdb_rec_data *r,
1038                                               uint32_t *reqid,
1039                                               struct ctdb_ltdb_header *header,
1040                                               TDB_DATA *key, TDB_DATA *data);
1041
1042 int32_t ctdb_control_pull_db(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1043 int32_t ctdb_control_push_db(struct ctdb_context *ctdb, TDB_DATA indata);
1044 int32_t ctdb_control_set_dmaster(struct ctdb_context *ctdb, TDB_DATA indata);
1045
1046 int32_t ctdb_control_set_recmode(struct ctdb_context *ctdb, 
1047                                  struct ctdb_req_control *c,
1048                                  TDB_DATA indata, bool *async_reply,
1049                                  const char **errormsg);
1050 void ctdb_request_control_reply(struct ctdb_context *ctdb, struct ctdb_req_control *c,
1051                                 TDB_DATA *outdata, int32_t status, const char *errormsg);
1052
1053 int32_t ctdb_control_freeze(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1054 int32_t ctdb_control_thaw(struct ctdb_context *ctdb, uint32_t priority);
1055
1056 int ctdb_start_recoverd(struct ctdb_context *ctdb);
1057 void ctdb_stop_recoverd(struct ctdb_context *ctdb);
1058
1059 uint32_t ctdb_get_num_active_nodes(struct ctdb_context *ctdb);
1060
1061 void ctdb_disable_monitoring(struct ctdb_context *ctdb);
1062 void ctdb_enable_monitoring(struct ctdb_context *ctdb);
1063 void ctdb_stop_monitoring(struct ctdb_context *ctdb);
1064 void ctdb_start_monitoring(struct ctdb_context *ctdb);
1065 void ctdb_start_tcp_tickle_update(struct ctdb_context *ctdb);
1066 void ctdb_send_keepalive(struct ctdb_context *ctdb, uint32_t destnode);
1067 void ctdb_start_keepalive(struct ctdb_context *ctdb);
1068 void ctdb_stop_keepalive(struct ctdb_context *ctdb);
1069 int32_t ctdb_run_eventscripts(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA data, bool *async_reply);
1070
1071
1072 void ctdb_daemon_cancel_controls(struct ctdb_context *ctdb, struct ctdb_node *node);
1073 void ctdb_call_resend_all(struct ctdb_context *ctdb);
1074 void ctdb_node_dead(struct ctdb_node *node);
1075 void ctdb_node_connected(struct ctdb_node *node);
1076 bool ctdb_blocking_freeze(struct ctdb_context *ctdb);
1077 void ctdb_set_scheduler(struct ctdb_context *ctdb);
1078 void ctdb_restore_scheduler(struct ctdb_context *ctdb);
1079
1080 struct tevent_signal *ctdb_init_sigchld(struct ctdb_context *ctdb);
1081 pid_t ctdb_fork(struct ctdb_context *ctdb);
1082 pid_t ctdb_fork_no_free_ringbuffer(struct ctdb_context *ctdb);
1083 int ctdb_kill(struct ctdb_context *ctdb, pid_t pid, int signum);
1084
1085 int32_t ctdb_control_takeover_ip(struct ctdb_context *ctdb, 
1086                                  struct ctdb_req_control *c,
1087                                  TDB_DATA indata, 
1088                                  bool *async_reply);
1089 int32_t ctdb_control_takeover_ipv4(struct ctdb_context *ctdb, 
1090                                  struct ctdb_req_control *c,
1091                                  TDB_DATA indata, 
1092                                  bool *async_reply);
1093 int32_t ctdb_control_release_ip(struct ctdb_context *ctdb, 
1094                                  struct ctdb_req_control *c,
1095                                  TDB_DATA indata, 
1096                                  bool *async_reply);
1097 int32_t ctdb_control_release_ipv4(struct ctdb_context *ctdb, 
1098                                  struct ctdb_req_control *c,
1099                                  TDB_DATA indata, 
1100                                  bool *async_reply);
1101 int32_t ctdb_control_start_recovery(struct ctdb_context *ctdb, 
1102                                  struct ctdb_req_control *c,
1103                                  bool *async_reply);
1104 int32_t ctdb_control_end_recovery(struct ctdb_context *ctdb, 
1105                                  struct ctdb_req_control *c,
1106                                  bool *async_reply);
1107
1108 struct ctdb_public_ipv4 {
1109         uint32_t pnn;
1110         struct sockaddr_in sin;
1111 };
1112
1113 int ctdb_ctrl_takeover_ip(struct ctdb_context *ctdb, struct timeval timeout, 
1114                           uint32_t destnode, struct ctdb_public_ip *ip);
1115 int ctdb_ctrl_release_ip(struct ctdb_context *ctdb, struct timeval timeout, 
1116                          uint32_t destnode, struct ctdb_public_ip *ip);
1117
1118 struct ctdb_all_public_ipsv4 {
1119         uint32_t num;
1120         struct ctdb_public_ipv4 ips[1];
1121 };
1122
1123 int32_t ctdb_control_get_public_ipsv4(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA *outdata);
1124 int32_t ctdb_control_get_public_ips(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA *outdata);
1125 int ctdb_ctrl_get_public_ips(struct ctdb_context *ctdb, 
1126                              struct timeval timeout,
1127                              uint32_t destnode,
1128                              TALLOC_CTX *mem_ctx,
1129                              struct ctdb_all_public_ips **ips);
1130 #define CTDB_PUBLIC_IP_FLAGS_ONLY_AVAILABLE 0x00010000
1131 int ctdb_ctrl_get_public_ips_flags(struct ctdb_context *ctdb,
1132                                    struct timeval timeout, uint32_t destnode,
1133                                    TALLOC_CTX *mem_ctx,
1134                                    uint32_t flags,
1135                                    struct ctdb_all_public_ips **ips);
1136 int ctdb_ctrl_get_public_ipsv4(struct ctdb_context *ctdb, 
1137                         struct timeval timeout, uint32_t destnode, 
1138                         TALLOC_CTX *mem_ctx, struct ctdb_all_public_ips **ips);
1139
1140 struct ctdb_control_iface_info {
1141         char name[CTDB_IFACE_SIZE+2];
1142         uint16_t link_state;
1143         uint32_t references;
1144 };
1145
1146 struct ctdb_control_public_ip_info {
1147         struct ctdb_public_ip ip;
1148         uint32_t active_idx;
1149         uint32_t num;
1150         struct ctdb_control_iface_info ifaces[1];
1151 };
1152
1153 struct ctdb_control_get_ifaces {
1154         uint32_t num;
1155         struct ctdb_control_iface_info ifaces[1];
1156 };
1157
1158 int32_t ctdb_control_get_public_ip_info(struct ctdb_context *ctdb,
1159                                         struct ctdb_req_control *c,
1160                                         TDB_DATA indata,
1161                                         TDB_DATA *outdata);
1162 int32_t ctdb_control_get_ifaces(struct ctdb_context *ctdb,
1163                                 struct ctdb_req_control *c,
1164                                 TDB_DATA *outdata);
1165 int32_t ctdb_control_set_iface_link(struct ctdb_context *ctdb,
1166                                     struct ctdb_req_control *c,
1167                                     TDB_DATA indata);
1168 int ctdb_ctrl_get_public_ip_info(struct ctdb_context *ctdb,
1169                                  struct timeval timeout, uint32_t destnode,
1170                                  TALLOC_CTX *mem_ctx,
1171                                  const ctdb_sock_addr *addr,
1172                                  struct ctdb_control_public_ip_info **info);
1173 int ctdb_ctrl_get_ifaces(struct ctdb_context *ctdb,
1174                          struct timeval timeout, uint32_t destnode,
1175                          TALLOC_CTX *mem_ctx,
1176                          struct ctdb_control_get_ifaces **ifaces);
1177 int ctdb_ctrl_set_iface_link(struct ctdb_context *ctdb,
1178                              struct timeval timeout, uint32_t destnode,
1179                              TALLOC_CTX *mem_ctx,
1180                              const struct ctdb_control_iface_info *info);
1181
1182 /* from takeover/system.c */
1183 uint32_t uint16_checksum(uint16_t *data, size_t n);
1184 int ctdb_sys_send_arp(const ctdb_sock_addr *addr, const char *iface);
1185 bool ctdb_sys_have_ip(ctdb_sock_addr *addr);
1186 char *ctdb_sys_find_ifname(ctdb_sock_addr *addr);
1187 bool ctdb_sys_check_iface_exists(const char *iface);
1188 int ctdb_get_peer_pid(const int fd, pid_t *peer_pid);
1189 int ctdb_sys_send_tcp(const ctdb_sock_addr *dest, 
1190                       const ctdb_sock_addr *src,
1191                       uint32_t seq, uint32_t ack, int rst);
1192
1193 /* Details of a byte range lock */
1194 struct ctdb_lock_info {
1195         ino_t inode;
1196         off_t start, end;
1197         bool waiting;
1198         bool read_only;
1199 };
1200
1201 char *ctdb_get_process_name(pid_t pid);
1202 bool ctdb_get_lock_info(pid_t req_pid, struct ctdb_lock_info *lock_info);
1203 bool ctdb_get_blocker_pid(struct ctdb_lock_info *reqlock, pid_t *blocker_pid);
1204
1205 typedef void (*client_async_callback)(struct ctdb_context *ctdb, uint32_t node_pnn, int32_t res, TDB_DATA outdata, void *callback_data);
1206
1207 int ctdb_set_public_addresses(struct ctdb_context *ctdb, bool check_addresses);
1208 int ctdb_set_single_public_ip(struct ctdb_context *ctdb,
1209                               const char *iface,
1210                               const char *ip);
1211 int ctdb_set_event_script(struct ctdb_context *ctdb, const char *script);
1212 int ctdb_set_event_script_dir(struct ctdb_context *ctdb, const char *script_dir);
1213 int ctdb_set_notification_script(struct ctdb_context *ctdb, const char *script);
1214 void lcp2_forcerebalance(struct ctdb_context *ctdb, uint32_t pnn);
1215 int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap, client_async_callback fail_callback, void *callback_data);
1216
1217 int32_t ctdb_control_tcp_client(struct ctdb_context *ctdb, uint32_t client_id, 
1218                                 TDB_DATA indata);
1219 int32_t ctdb_control_tcp_add(struct ctdb_context *ctdb, TDB_DATA indata, bool tcp_update_needed);
1220 int32_t ctdb_control_tcp_remove(struct ctdb_context *ctdb, TDB_DATA indata);
1221 int32_t ctdb_control_startup(struct ctdb_context *ctdb, uint32_t vnn);
1222 int32_t ctdb_control_kill_tcp(struct ctdb_context *ctdb, TDB_DATA indata);
1223 int32_t ctdb_control_send_gratious_arp(struct ctdb_context *ctdb, TDB_DATA indata);
1224 int32_t ctdb_control_get_tcp_tickle_list(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1225 int32_t ctdb_control_set_tcp_tickle_list(struct ctdb_context *ctdb, TDB_DATA indata);
1226
1227 void ctdb_takeover_client_destructor_hook(struct ctdb_client *client);
1228 int ctdb_event_script(struct ctdb_context *ctdb, enum ctdb_eventscript_call call);
1229 int ctdb_event_script_args(struct ctdb_context *ctdb, enum ctdb_eventscript_call call,
1230                            const char *fmt, ...) PRINTF_ATTRIBUTE(3,4);
1231 int ctdb_event_script_callback(struct ctdb_context *ctdb, 
1232                                TALLOC_CTX *mem_ctx,
1233                                void (*callback)(struct ctdb_context *, int, void *),
1234                                void *private_data,
1235                                bool from_user,
1236                                enum ctdb_eventscript_call call,
1237                                const char *fmt, ...) PRINTF_ATTRIBUTE(7,8);
1238 void ctdb_release_all_ips(struct ctdb_context *ctdb);
1239
1240 void set_nonblocking(int fd);
1241 void set_close_on_exec(int fd);
1242
1243 bool ctdb_recovery_lock(struct ctdb_context *ctdb, bool keep);
1244
1245 int ctdb_set_recovery_lock_file(struct ctdb_context *ctdb, const char *file);
1246
1247 int32_t ctdb_control_get_tunable(struct ctdb_context *ctdb, TDB_DATA indata, 
1248                                  TDB_DATA *outdata);
1249 int32_t ctdb_control_set_tunable(struct ctdb_context *ctdb, TDB_DATA indata);
1250 int32_t ctdb_control_list_tunables(struct ctdb_context *ctdb, TDB_DATA *outdata);
1251 int32_t ctdb_control_try_delete_records(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1252 int32_t ctdb_control_add_public_address(struct ctdb_context *ctdb, TDB_DATA indata);
1253 int32_t ctdb_control_del_public_address(struct ctdb_context *ctdb, TDB_DATA indata);
1254
1255 void ctdb_tunables_set_defaults(struct ctdb_context *ctdb);
1256
1257 int32_t ctdb_control_modflags(struct ctdb_context *ctdb, TDB_DATA indata);
1258
1259 int ctdb_ctrl_get_all_tunables(struct ctdb_context *ctdb, 
1260                                struct timeval timeout, 
1261                                uint32_t destnode,
1262                                struct ctdb_tunable *tunables);
1263
1264 int ctdb_start_freeze(struct ctdb_context *ctdb, uint32_t priority);
1265
1266 bool parse_ip_mask(const char *s, const char *iface, ctdb_sock_addr *addr, unsigned *mask);
1267 bool parse_ip_port(const char *s, ctdb_sock_addr *addr);
1268 bool parse_ip(const char *s, const char *iface, unsigned port, ctdb_sock_addr *addr);
1269 bool parse_ipv4(const char *s, unsigned port, struct sockaddr_in *sin);
1270  
1271
1272 int ctdb_sys_open_capture_socket(const char *iface, void **private_data);
1273 int ctdb_sys_close_capture_socket(void *private_data);
1274 int ctdb_sys_read_tcp_packet(int s, void *private_data, ctdb_sock_addr *src, ctdb_sock_addr *dst, uint32_t *ack_seq, uint32_t *seq);
1275
1276 int ctdb_ctrl_killtcp(struct ctdb_context *ctdb, 
1277                       struct timeval timeout, 
1278                       uint32_t destnode,
1279                       struct ctdb_control_killtcp *killtcp);
1280
1281 int ctdb_ctrl_add_public_ip(struct ctdb_context *ctdb, 
1282                       struct timeval timeout, 
1283                       uint32_t destnode,
1284                       struct ctdb_control_ip_iface *pub);
1285
1286 int ctdb_ctrl_del_public_ip(struct ctdb_context *ctdb, 
1287                       struct timeval timeout, 
1288                       uint32_t destnode,
1289                       struct ctdb_control_ip_iface *pub);
1290
1291 int ctdb_ctrl_gratious_arp(struct ctdb_context *ctdb, 
1292                       struct timeval timeout, 
1293                       uint32_t destnode,
1294                       ctdb_sock_addr *addr,
1295                       const char *ifname);
1296
1297 int ctdb_ctrl_get_tcp_tickles(struct ctdb_context *ctdb, 
1298                       struct timeval timeout, 
1299                       uint32_t destnode,
1300                       TALLOC_CTX *mem_ctx,
1301                       ctdb_sock_addr *addr,
1302                       struct ctdb_control_tcp_tickle_list **list);
1303
1304
1305 int32_t ctdb_control_register_server_id(struct ctdb_context *ctdb, 
1306                       uint32_t client_id,
1307                       TDB_DATA indata);
1308 int32_t ctdb_control_check_server_id(struct ctdb_context *ctdb, 
1309                       TDB_DATA indata);
1310 int32_t ctdb_control_unregister_server_id(struct ctdb_context *ctdb, 
1311                       TDB_DATA indata);
1312 int32_t ctdb_control_get_server_id_list(struct ctdb_context *ctdb, 
1313                       TDB_DATA *outdata);
1314 int32_t ctdb_control_uptime(struct ctdb_context *ctdb, 
1315                       TDB_DATA *outdata);
1316
1317 int ctdb_attach_databases(struct ctdb_context *ctdb);
1318
1319 int32_t ctdb_control_persistent_store(struct ctdb_context *ctdb, 
1320                                       struct ctdb_req_control *c, 
1321                                       TDB_DATA recdata, bool *async_reply);
1322 int32_t ctdb_control_update_record(struct ctdb_context *ctdb, 
1323                                    struct ctdb_req_control *c, TDB_DATA recdata, 
1324                                    bool *async_reply);
1325 int32_t ctdb_control_trans2_commit(struct ctdb_context *ctdb, 
1326                                    struct ctdb_req_control *c, 
1327                                    TDB_DATA recdata, bool *async_reply);
1328
1329 int32_t ctdb_control_trans3_commit(struct ctdb_context *ctdb,
1330                                    struct ctdb_req_control *c,
1331                                    TDB_DATA recdata, bool *async_reply);
1332
1333 void ctdb_persistent_finish_trans3_commits(struct ctdb_context *ctdb);
1334
1335 int32_t ctdb_control_transaction_start(struct ctdb_context *ctdb, uint32_t id);
1336 int32_t ctdb_control_transaction_commit(struct ctdb_context *ctdb, uint32_t id);
1337 int32_t ctdb_control_transaction_cancel(struct ctdb_context *ctdb);
1338 int32_t ctdb_control_wipe_database(struct ctdb_context *ctdb, TDB_DATA indata);
1339 int32_t ctdb_control_db_set_healthy(struct ctdb_context *ctdb, TDB_DATA indata);
1340 int32_t ctdb_control_db_get_health(struct ctdb_context *ctdb,
1341                                    TDB_DATA indata,
1342                                    TDB_DATA *outdata);
1343
1344
1345 int ctdb_vacuum(struct ctdb_context *ctdb, int argc, const char **argv);
1346 int ctdb_repack(struct ctdb_context *ctdb, int argc, const char **argv);
1347
1348 void ctdb_block_signal(int signum);
1349 void ctdb_unblock_signal(int signum);
1350 int32_t ctdb_monitoring_mode(struct ctdb_context *ctdb);
1351 bool ctdb_stopped_monitoring(struct ctdb_context *ctdb);
1352 int ctdb_set_child_logging(struct ctdb_context *ctdb);
1353 void ctdb_lockdown_memory(struct ctdb_context *ctdb);
1354
1355 struct client_async_data {
1356         enum ctdb_controls opcode;
1357         bool dont_log_errors;
1358         uint32_t count;
1359         uint32_t fail_count;
1360         client_async_callback callback;
1361         client_async_callback fail_callback;
1362         void *callback_data;
1363 };
1364 void ctdb_client_async_add(struct client_async_data *data, struct ctdb_client_control_state *state);
1365 int ctdb_client_async_wait(struct ctdb_context *ctdb, struct client_async_data *data);
1366 int ctdb_client_async_control(struct ctdb_context *ctdb,
1367                                 enum ctdb_controls opcode,
1368                                 uint32_t *nodes,
1369                                 uint64_t srvid,
1370                                 struct timeval timeout,
1371                                 bool dont_log_errors,
1372                                 TDB_DATA data,
1373                                 client_async_callback client_callback,
1374                                 client_async_callback fail_callback,
1375                                 void *callback_data);
1376
1377 void ctdb_load_nodes_file(struct ctdb_context *ctdb);
1378
1379 int ctdb_control_reload_nodes_file(struct ctdb_context *ctdb, uint32_t opcode);
1380
1381 int32_t ctdb_dump_memory(struct ctdb_context *ctdb, TDB_DATA *outdata);
1382 int32_t ctdb_control_get_capabilities(struct ctdb_context *ctdb, TDB_DATA *outdata);
1383
1384 int32_t ctdb_control_trans2_finished(struct ctdb_context *ctdb, 
1385                                      struct ctdb_req_control *c);
1386 int32_t ctdb_control_trans2_error(struct ctdb_context *ctdb, 
1387                                   struct ctdb_req_control *c);
1388 int32_t ctdb_control_trans2_active(struct ctdb_context *ctdb,
1389                                    struct ctdb_req_control *c,
1390                                    uint32_t db_id);
1391
1392 char *ctdb_addr_to_str(ctdb_sock_addr *addr);
1393 unsigned ctdb_addr_to_port(ctdb_sock_addr *addr);
1394 void ctdb_canonicalize_ip(const ctdb_sock_addr *ip, ctdb_sock_addr *cip);
1395
1396 int32_t ctdb_control_recd_ping(struct ctdb_context *ctdb);
1397 int32_t ctdb_control_set_recmaster(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata);
1398
1399 extern int script_log_level;
1400 extern bool fast_start;
1401
1402 int32_t ctdb_control_get_event_script_status(struct ctdb_context *ctdb,
1403                                              uint32_t call_type,
1404                                              TDB_DATA *outdata);
1405
1406 int ctdb_log_event_script_output(struct ctdb_context *ctdb, char *str, uint16_t len);
1407 int ctdb_ctrl_report_recd_lock_latency(struct ctdb_context *ctdb, struct timeval timeout, double latency);
1408
1409 int32_t ctdb_control_stop_node(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1410 int32_t ctdb_control_continue_node(struct ctdb_context *ctdb);
1411
1412 void ctdb_stop_vacuuming(struct ctdb_context *ctdb);
1413 int ctdb_vacuum_init(struct ctdb_db_context *ctdb_db);
1414
1415 int32_t ctdb_control_enable_script(struct ctdb_context *ctdb, TDB_DATA indata);
1416 int32_t ctdb_control_disable_script(struct ctdb_context *ctdb, TDB_DATA indata);
1417
1418 int32_t ctdb_local_node_got_banned(struct ctdb_context *ctdb);
1419 int32_t ctdb_control_set_ban_state(struct ctdb_context *ctdb, TDB_DATA indata);
1420 int32_t ctdb_control_get_ban_state(struct ctdb_context *ctdb, TDB_DATA *outdata);
1421 int32_t ctdb_control_set_db_priority(struct ctdb_context *ctdb, TDB_DATA indata);
1422 void ctdb_ban_self(struct ctdb_context *ctdb);
1423
1424 int32_t ctdb_control_register_notify(struct ctdb_context *ctdb, uint32_t client_id, TDB_DATA indata);
1425
1426 int32_t ctdb_control_deregister_notify(struct ctdb_context *ctdb, uint32_t client_id, TDB_DATA indata);
1427
1428 int start_syslog_daemon(struct ctdb_context *ctdb);
1429
1430 /* Where to send the log messages back to */
1431 struct ctdb_get_log_addr {
1432         uint32_t pnn;
1433         uint64_t srvid;
1434         int32_t level;
1435 };
1436
1437 extern int log_ringbuf_size;
1438
1439 void ctdb_collect_log(struct ctdb_context *ctdb, struct ctdb_get_log_addr *log_addr);
1440 void ctdb_clear_log(struct ctdb_context *ctdb);
1441 int32_t ctdb_control_get_log(struct ctdb_context *ctdb, TDB_DATA addr);
1442 int32_t ctdb_control_clear_log(struct ctdb_context *ctdb);
1443 void ctdb_log_ringbuffer_free(void);
1444
1445 struct ctdb_log_state *ctdb_fork_with_logging(TALLOC_CTX *mem_ctx,
1446                                               struct ctdb_context *ctdb,
1447                                               const char *log_prefix,
1448                                               void (*logfn)(const char *, uint16_t, void *),
1449                                               void *logfn_private, pid_t *pid);
1450
1451 int32_t ctdb_control_process_exists(struct ctdb_context *ctdb, pid_t pid);
1452 struct ctdb_client *ctdb_find_client_by_pid(struct ctdb_context *ctdb, pid_t pid);
1453
1454 int32_t ctdb_control_get_db_seqnum(struct ctdb_context *ctdb,
1455                                    TDB_DATA indata,
1456                                    TDB_DATA *outdata);
1457
1458 int ctdb_load_persistent_health(struct ctdb_context *ctdb,
1459                                 struct ctdb_db_context *ctdb_db);
1460 int ctdb_update_persistent_health(struct ctdb_context *ctdb,
1461                                   struct ctdb_db_context *ctdb_db,
1462                                   const char *reason,/* NULL means healthy */
1463                                   int num_healthy_nodes);
1464 int ctdb_recheck_persistent_health(struct ctdb_context *ctdb);
1465
1466 void ctdb_run_notification_script(struct ctdb_context *ctdb, const char *event);
1467
1468 void ctdb_fault_setup(void);
1469
1470 int verify_remote_ip_allocation(struct ctdb_context *ctdb, 
1471                                 struct ctdb_all_public_ips *ips);
1472 int update_ip_assignment_tree(struct ctdb_context *ctdb,
1473                                 struct ctdb_public_ip *ip);
1474
1475 int ctdb_init_tevent_logging(struct ctdb_context *ctdb);
1476
1477 int ctdb_statistics_init(struct ctdb_context *ctdb);
1478
1479 int32_t ctdb_control_get_stat_history(struct ctdb_context *ctdb,
1480                                       struct ctdb_req_control *c,
1481                                       TDB_DATA *outdata);
1482
1483 int ctdb_deferred_drop_all_ips(struct ctdb_context *ctdb);
1484
1485 int ctdb_process_deferred_attach(struct ctdb_context *ctdb);
1486
1487 /**
1488  * structure to pass to a schedule_for_deletion_control
1489  */
1490 struct ctdb_control_schedule_for_deletion {
1491         uint32_t db_id;
1492         struct ctdb_ltdb_header hdr;
1493         uint32_t keylen;
1494         uint8_t key[1]; /* key[] */
1495 };
1496
1497 int32_t ctdb_control_schedule_for_deletion(struct ctdb_context *ctdb,
1498                                            TDB_DATA indata);
1499
1500
1501 int32_t ctdb_local_schedule_for_deletion(struct ctdb_db_context *ctdb_db,
1502                                          const struct ctdb_ltdb_header *hdr,
1503                                          TDB_DATA key);
1504
1505 void ctdb_local_remove_from_delete_queue(struct ctdb_db_context *ctdb_db,
1506                                          const struct ctdb_ltdb_header *hdr,
1507                                          const TDB_DATA key);
1508
1509 struct ctdb_ltdb_header *ctdb_header_from_record_handle(struct ctdb_record_handle *h);
1510
1511 /* For unit testing ctdb_transaction.c. */
1512 struct ctdb_public_ip_list {
1513         struct ctdb_public_ip_list *next;
1514         uint32_t pnn;
1515         ctdb_sock_addr addr;
1516 };
1517 int ctdb_trackingdb_add_pnn(struct ctdb_context *ctdb, TDB_DATA *data, uint32_t pnn);
1518
1519 typedef void (*ctdb_trackingdb_cb)(struct ctdb_context *ctdb, uint32_t pnn, void *private_data);
1520
1521 void ctdb_trackingdb_traverse(struct ctdb_context *ctdb, TDB_DATA data, ctdb_trackingdb_cb cb, void *private_data);
1522
1523 int ctdb_start_revoke_ro_record(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db, TDB_DATA key, struct ctdb_ltdb_header *header, TDB_DATA data);
1524
1525 typedef void (*deferred_requeue_fn)(void *call_context, struct ctdb_req_header *hdr);
1526
1527 int ctdb_add_revoke_deferred_call(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db, TDB_DATA key, struct ctdb_req_header *hdr, deferred_requeue_fn fn, void *call_context);
1528
1529 int ctdb_set_db_readonly(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db);
1530
1531 int ctdb_null_func(struct ctdb_call_info *call);
1532
1533 int ctdb_fetch_func(struct ctdb_call_info *call);
1534
1535 int ctdb_fetch_with_header_func(struct ctdb_call_info *call);
1536
1537 int32_t ctdb_control_get_db_statistics(struct ctdb_context *ctdb,
1538                                 uint32_t db_id,
1539                                 TDB_DATA *outdata);
1540
1541 int ctdb_set_db_sticky(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db);
1542
1543 /*
1544   description for a message to reload all ips via recovery master/daemon
1545  */
1546 struct reloadips_all_reply {
1547         uint32_t pnn;
1548         uint64_t srvid;
1549 };
1550
1551 int32_t ctdb_control_reload_public_ips(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1552
1553 int ctdb_start_monitoring_interfaces(struct ctdb_context *ctdb);
1554
1555 /* from server/ctdb_lock.c */
1556 struct lock_request;
1557
1558 int ctdb_lockall_prio(struct ctdb_context *ctdb, uint32_t priority);
1559 int ctdb_unlockall_prio(struct ctdb_context *ctdb, uint32_t priority);
1560 int ctdb_lockall_mark_prio(struct ctdb_context *ctdb, uint32_t priority);
1561 int ctdb_lockall_unmark_prio(struct ctdb_context *ctdb, uint32_t priority);
1562
1563 void ctdb_lock_free_request_context(struct lock_request *lock_req);
1564
1565 struct lock_request *ctdb_lock_record(struct ctdb_db_context *ctdb_db,
1566                                       TDB_DATA key,
1567                                       bool auto_mark,
1568                                       void (*callback)(void *, bool),
1569                                       void *private_data);
1570
1571 struct lock_request *ctdb_lock_db(struct ctdb_db_context *ctdb_db,
1572                                   bool auto_mark,
1573                                   void (*callback)(void *, bool),
1574                                   void *private_data);
1575
1576 struct lock_request *ctdb_lock_alldb_prio(struct ctdb_context *ctdb,
1577                                           uint32_t priority,
1578                                           bool auto_mark,
1579                                           void (*callback)(void *, bool),
1580                                           void *private_data);
1581
1582 struct lock_request *ctdb_lock_alldb(struct ctdb_context *ctdb,
1583                                      bool auto_mark,
1584                                      void (*callback)(void *, bool),
1585                                      void *private_data);
1586
1587 #endif