locking: Do not use RECLOCK for tracking DB locks and latencies
[ctdb.git] / include / ctdb_private.h
1 /* 
2    ctdb database library
3
4    Copyright (C) Andrew Tridgell  2006
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 3 of the License, or
9    (at your option) any later version.
10    
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15    
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, see <http://www.gnu.org/licenses/>.
18 */
19
20 #ifndef _CTDB_PRIVATE_H
21 #define _CTDB_PRIVATE_H
22
23 #include "ctdb_client.h"
24 #include <sys/socket.h>
25
26 /*
27   recovery daemon memdump reply address
28  */
29 struct rd_memdump_reply {
30         uint32_t pnn;
31         uint64_t srvid;
32 };
33
34 /*
35   description for a TAKEOVER_RUN message reply address
36  */
37 struct takeover_run_reply {
38         uint32_t pnn;
39         uint64_t srvid;
40 };
41
42 /*
43  * pid of the ctdbd daemon
44  */
45 extern pid_t ctdbd_pid;
46
47 /*
48   a tcp connection description
49   also used by tcp_add and tcp_remove controls
50  */
51 struct ctdb_tcp_connection {
52         ctdb_sock_addr src_addr;
53         ctdb_sock_addr dst_addr;
54 };
55
56 /* the wire representation for a tcp tickle array */
57 struct ctdb_tcp_wire_array {
58         uint32_t num;
59         struct ctdb_tcp_connection connections[1];
60 };      
61
62 /* the list of tcp tickles used by get/set tcp tickle list */
63 struct ctdb_control_tcp_tickle_list {
64         ctdb_sock_addr addr;
65         struct ctdb_tcp_wire_array tickles;
66 };
67
68 /*
69   array of tcp connections
70  */
71 struct ctdb_tcp_array {
72         uint32_t num;
73         struct ctdb_tcp_connection *connections;
74 };      
75
76
77 /* all tunable variables go in here */
78 struct ctdb_tunable {
79         uint32_t max_redirect_count;
80         uint32_t seqnum_interval; /* unit is ms */
81         uint32_t control_timeout;
82         uint32_t traverse_timeout;
83         uint32_t keepalive_interval;
84         uint32_t keepalive_limit;
85         uint32_t recover_timeout;
86         uint32_t recover_interval;
87         uint32_t election_timeout;
88         uint32_t takeover_timeout;
89         uint32_t monitor_interval;
90         uint32_t tickle_update_interval;
91         uint32_t script_timeout;
92         uint32_t script_timeout_count; /* allow dodgy scripts to hang this many times in a row before we mark the node unhealthy */
93         uint32_t script_unhealthy_on_timeout; /* obsolete */
94         uint32_t recovery_grace_period;
95         uint32_t recovery_ban_period;
96         uint32_t database_hash_size;
97         uint32_t database_max_dead;
98         uint32_t rerecovery_timeout;
99         uint32_t enable_bans;
100         uint32_t deterministic_public_ips;
101         uint32_t reclock_ping_period;
102         uint32_t no_ip_failback;
103         uint32_t disable_ip_failover;
104         uint32_t verbose_memory_names;
105         uint32_t recd_ping_timeout;
106         uint32_t recd_ping_failcount;
107         uint32_t log_latency_ms;
108         uint32_t reclock_latency_ms;
109         uint32_t recovery_drop_all_ips;
110         uint32_t verify_recovery_lock;
111         uint32_t vacuum_interval;
112         uint32_t vacuum_default_interval;
113         uint32_t vacuum_max_run_time;
114         uint32_t repack_limit;
115         uint32_t vacuum_limit;
116         uint32_t vacuum_min_interval;
117         uint32_t vacuum_max_interval;
118         uint32_t max_queue_depth_drop_msg;
119         uint32_t use_status_events_for_monitoring;
120         uint32_t allow_unhealthy_db_read;
121         uint32_t stat_history_interval;
122         uint32_t deferred_attach_timeout;
123         uint32_t vacuum_fast_path_count;
124         uint32_t lcp2_public_ip_assignment;
125         uint32_t allow_client_db_attach;
126         uint32_t recover_pdb_by_seqnum;
127         uint32_t deferred_rebalance_on_node_add;
128         uint32_t fetch_collapse;
129         uint32_t max_lacount;
130         uint32_t hopcount_make_sticky;
131         uint32_t sticky_duration;
132         uint32_t sticky_pindown;
133         uint32_t no_ip_takeover;
134         uint32_t db_record_count_warn;
135         uint32_t db_record_size_warn;
136         uint32_t db_size_warn;
137         uint32_t pulldb_preallocation_size;
138         uint32_t no_ip_takeover_on_disabled;
139         uint32_t deadlock_timeout;
140 };
141
142 /*
143   an installed ctdb remote call
144 */
145 struct ctdb_registered_call {
146         struct ctdb_registered_call *next, *prev;
147         uint32_t id;
148         ctdb_fn_t fn;
149 };
150
151 /*
152   this address structure might need to be generalised later for some
153   transports
154 */
155 struct ctdb_address {
156         const char *address;
157         int port;
158 };
159
160 /*
161   check that a pnn is valid
162  */
163 #define ctdb_validate_pnn(ctdb, pnn) (((uint32_t)(pnn)) < (ctdb)->num_nodes)
164
165
166 /* called from the queue code when a packet comes in. Called with data==NULL
167    on error */
168 typedef void (*ctdb_queue_cb_fn_t)(uint8_t *data, size_t length,
169                                    void *private_data);
170
171 /* used for callbacks in ctdb_control requests */
172 typedef void (*ctdb_control_callback_fn_t)(struct ctdb_context *,
173                                            int32_t status, TDB_DATA data, 
174                                            const char *errormsg,
175                                            void *private_data);
176 /*
177   structure describing a connected client in the daemon
178  */
179 struct ctdb_client {
180         struct ctdb_context *ctdb;
181         int fd;
182         struct ctdb_queue *queue;
183         uint32_t client_id;
184         pid_t pid;
185         struct ctdb_tcp_list *tcp_list;
186         uint32_t db_id;
187         uint32_t num_persistent_updates;
188         struct ctdb_client_notify_list *notify;
189 };
190
191 struct ctdb_iface;
192
193 /* state associated with a public ip address */
194 struct ctdb_vnn {
195         struct ctdb_vnn *prev, *next;
196
197         struct ctdb_iface *iface;
198         const char **ifaces;
199         ctdb_sock_addr public_address;
200         uint8_t public_netmask_bits;
201
202         /* the node number that is serving this public address, if any. 
203            If no node serves this ip it is set to -1 */
204         int32_t pnn;
205
206         /* List of clients to tickle for this public address */
207         struct ctdb_tcp_array *tcp_array;
208
209         /* whether we need to update the other nodes with changes to our list
210            of connected clients */
211         bool tcp_update_needed;
212
213         /* a context to hang sending gratious arp events off */
214         TALLOC_CTX *takeover_ctx;
215
216         struct ctdb_kill_tcp *killtcp;
217
218         /* Set to true any time an update to this VNN is in flight.
219            This helps to avoid races. */
220         bool update_in_flight;
221 };
222
223 /*
224   state associated with one node
225 */
226 struct ctdb_node {
227         struct ctdb_context *ctdb;
228         struct ctdb_address address;
229         const char *name; /* for debug messages */
230         void *private_data; /* private to transport */
231         uint32_t pnn;
232         uint32_t flags;
233
234         /* used by the dead node monitoring */
235         uint32_t dead_count;
236         uint32_t rx_cnt;
237         uint32_t tx_cnt;
238
239         /* used to track node capabilities, is only valid/tracked inside the
240            recovery daemon.
241         */
242         uint32_t capabilities;
243
244         /* a list of controls pending to this node, so we can time them out quickly
245            if the node becomes disconnected */
246         struct daemon_control_state *pending_controls;
247
248         /* used by the recovery daemon when distributing ip addresses 
249            across the nodes.  it needs to know which public ip's can be handled
250            by each node.
251         */
252         struct ctdb_all_public_ips *known_public_ips;
253         struct ctdb_all_public_ips *available_public_ips;
254         /* used by the recovery dameon to track when a node should be banned */
255         struct ctdb_banning_state *ban_state; 
256 };
257
258 /*
259   transport specific methods
260 */
261 struct ctdb_methods {
262         int (*initialise)(struct ctdb_context *); /* initialise transport structures */ 
263         int (*start)(struct ctdb_context *); /* start the transport */
264         int (*add_node)(struct ctdb_node *); /* setup a new node */     
265         int (*connect_node)(struct ctdb_node *); /* connect to node */
266         int (*queue_pkt)(struct ctdb_node *, uint8_t *data, uint32_t length);
267         void *(*allocate_pkt)(TALLOC_CTX *mem_ctx, size_t );
268         void (*shutdown)(struct ctdb_context *); /* shutdown transport */
269         void (*restart)(struct ctdb_node *); /* stop and restart the connection */
270 };
271
272 /*
273   transport calls up to the ctdb layer
274 */
275 struct ctdb_upcalls {
276         /* recv_pkt is called when a packet comes in */
277         void (*recv_pkt)(struct ctdb_context *, uint8_t *data, uint32_t length);
278
279         /* node_dead is called when an attempt to send to a node fails */
280         void (*node_dead)(struct ctdb_node *);
281
282         /* node_connected is called when a connection to a node is established */
283         void (*node_connected)(struct ctdb_node *);
284 };
285
286 /* list of message handlers - needs to be changed to a more efficient data
287    structure so we can find a message handler given a srvid quickly */
288 struct ctdb_message_list {
289         struct ctdb_context *ctdb;
290         struct ctdb_message_list *next, *prev;
291         uint64_t srvid;
292         ctdb_msg_fn_t message_handler;
293         void *message_private;
294 };
295
296 /* additional data required for the daemon mode */
297 struct ctdb_daemon_data {
298         int sd;
299         char *name;
300         struct ctdb_queue *queue;
301 };
302
303
304 #define CTDB_UPDATE_STAT(ctdb, counter, value) \
305         {                                                                               \
306                 if (value > ctdb->statistics.counter) {                                 \
307                         ctdb->statistics.counter = c->hopcount;                         \
308                 }                                                                       \
309                 if (value > ctdb->statistics_current.counter) {                         \
310                         ctdb->statistics_current.counter = c->hopcount;                 \
311                 }                                                                       \
312         }
313
314 #define CTDB_INCREMENT_STAT(ctdb, counter) \
315         {                                                                               \
316                 ctdb->statistics.counter++;                                             \
317                 ctdb->statistics_current.counter++;                                     \
318         }
319
320 #define CTDB_DECREMENT_STAT(ctdb, counter) \
321         {                                                                               \
322                 if (ctdb->statistics.counter > 0)                                       \
323                         ctdb->statistics.counter--;                                     \
324                 if (ctdb->statistics_current.counter > 0)                               \
325                         ctdb->statistics_current.counter--;                             \
326         }
327
328 #define CTDB_INCREMENT_DB_STAT(ctdb_db, counter) \
329         {                                                                               \
330                 ctdb_db->statistics.counter++;                                          \
331         }
332
333 #define CTDB_DECREMENT_DB_STAT(ctdb_db, counter) \
334         {                                                                               \
335                 if (ctdb_db->statistics.counter > 0)                                    \
336                         ctdb_db->statistics.counter--;                                  \
337         }
338
339 #define CTDB_UPDATE_RECLOCK_LATENCY(ctdb, name, counter, value) \
340         {                                                                               \
341                 if (value > ctdb->statistics.counter.max)                               \
342                         ctdb->statistics.counter.max = value;                           \
343                 if (value > ctdb->statistics_current.counter.max)                       \
344                         ctdb->statistics_current.counter.max = value;                   \
345                                                                                         \
346                 if (ctdb->statistics.counter.num == 0 ||                                \
347                     value < ctdb->statistics.counter.min)                               \
348                         ctdb->statistics.counter.min = value;                           \
349                 if (ctdb->statistics_current.counter.num == 0 ||                        \
350                     value < ctdb->statistics_current.counter.min)                       \
351                         ctdb->statistics_current.counter.min = value;                   \
352                                                                                         \
353                 ctdb->statistics.counter.total += value;                                \
354                 ctdb->statistics_current.counter.total += value;                        \
355                                                                                         \
356                 ctdb->statistics.counter.num++;                                         \
357                 ctdb->statistics_current.counter.num++;                                 \
358                                                                                         \
359                 if (ctdb->tunable.reclock_latency_ms != 0) {                            \
360                         if (value*1000 > ctdb->tunable.reclock_latency_ms) {            \
361                                 DEBUG(DEBUG_ERR,                                        \
362                                       ("High RECLOCK latency %fs for operation %s\n",   \
363                                        value, name));                                   \
364                         }                                                               \
365                 }                                                                       \
366         }
367
368 #define CTDB_UPDATE_DB_LATENCY(ctdb_db, operation, counter, value)                      \
369         {                                                                               \
370                 if (value > ctdb_db->statistics.counter.max)                            \
371                         ctdb_db->statistics.counter.max = value;                        \
372                 if (ctdb_db->statistics.counter.num == 0 ||                             \
373                     value < ctdb_db->statistics.counter.min)                            \
374                         ctdb_db->statistics.counter.min = value;                        \
375                                                                                         \
376                 ctdb_db->statistics.counter.total += value;                             \
377                 ctdb_db->statistics.counter.num++;                                      \
378                                                                                         \
379                 if (ctdb_db->ctdb->tunable.reclock_latency_ms != 0) {                   \
380                         if (value*1000 > ctdb_db->ctdb->tunable.log_latency_ms) {       \
381                                 DEBUG(DEBUG_ERR,                                        \
382                                       ("High latency %.6fs for operation %s on database %s\n",\
383                                        value, operation, ctdb_db->db_name));            \
384                         }                                                               \
385                 }                                                                       \
386         }
387
388 #define CTDB_UPDATE_LATENCY(ctdb, db, operation, counter, t) \
389         {                                                                               \
390                 double l = timeval_elapsed(&t);                                         \
391                                                                                         \
392                 if (l > ctdb->statistics.counter.max)                                   \
393                         ctdb->statistics.counter.max = l;                               \
394                 if (l > ctdb->statistics_current.counter.max)                           \
395                         ctdb->statistics_current.counter.max = l;                       \
396                                                                                         \
397                 if (ctdb->statistics.counter.num == 0 ||                                \
398                     l < ctdb->statistics.counter.min)                                   \
399                         ctdb->statistics.counter.min = l;                               \
400                 if (ctdb->statistics_current.counter.num == 0 ||                        \
401                     l < ctdb->statistics_current.counter.min)                           \
402                         ctdb->statistics_current.counter.min = l;                       \
403                                                                                         \
404                 ctdb->statistics.counter.total += l;                                    \
405                 ctdb->statistics_current.counter.total += l;                            \
406                                                                                         \
407                 ctdb->statistics.counter.num++;                                         \
408                 ctdb->statistics_current.counter.num++;                                 \
409                                                                                         \
410                 if (ctdb->tunable.log_latency_ms != 0) {                                \
411                         if (l*1000 > ctdb->tunable.log_latency_ms) {                    \
412                                 DEBUG(DEBUG_WARNING,                                    \
413                                       ("High latency %.6fs for operation %s on database %s\n",\
414                                        l, operation, db->db_name));                     \
415                         }                                                               \
416                 }                                                                       \
417         }
418
419
420
421 /* a structure that contains the elements required for the write record
422    control
423 */
424 struct ctdb_write_record {
425         uint32_t dbid;
426         uint32_t keylen;
427         uint32_t datalen;
428         unsigned char blob[1];
429 };
430
431 enum ctdb_freeze_mode {CTDB_FREEZE_NONE, CTDB_FREEZE_PENDING, CTDB_FREEZE_FROZEN};
432
433 #define CTDB_MONITORING_ACTIVE          0
434 #define CTDB_MONITORING_DISABLED        1
435
436 #define NUM_DB_PRIORITIES 3
437 /* main state of the ctdb daemon */
438 struct ctdb_context {
439         struct tevent_context *ev;
440         struct timeval ctdbd_start_time;
441         struct timeval last_recovery_started;
442         struct timeval last_recovery_finished;
443         uint32_t recovery_mode;
444         TALLOC_CTX *tickle_update_context;
445         TALLOC_CTX *keepalive_ctx;
446         TALLOC_CTX *check_public_ifaces_ctx;
447         struct ctdb_tunable tunable;
448         enum ctdb_freeze_mode freeze_mode[NUM_DB_PRIORITIES+1];
449         struct ctdb_freeze_handle *freeze_handles[NUM_DB_PRIORITIES+1];
450         bool freeze_transaction_started;
451         uint32_t freeze_transaction_id;
452         struct ctdb_address address;
453         const char *name;
454         const char *db_directory;
455         const char *db_directory_persistent;
456         const char *db_directory_state;
457         struct tdb_wrap *db_persistent_health;
458         uint32_t db_persistent_startup_generation;
459         uint64_t db_persistent_check_errors;
460         uint64_t max_persistent_check_errors;
461         const char *transport;
462         char *recovery_lock_file;
463         int recovery_lock_fd;
464         uint32_t pnn; /* our own pnn */
465         uint32_t num_nodes;
466         uint32_t num_connected;
467         unsigned flags;
468         uint32_t capabilities;
469         struct idr_context *idr;
470         int lastid;
471         struct ctdb_node **nodes; /* array of nodes in the cluster - indexed by vnn */
472         struct ctdb_vnn *vnn; /* list of public ip addresses and interfaces */
473         struct ctdb_vnn *single_ip_vnn; /* a structure for the single ip */
474         struct ctdb_iface *ifaces; /* list of local interfaces */
475         char *err_msg;
476         const struct ctdb_methods *methods; /* transport methods */
477         const struct ctdb_upcalls *upcalls; /* transport upcalls */
478         void *private_data; /* private to transport */
479         struct ctdb_db_context *db_list;
480         struct ctdb_message_list *message_list;
481         struct ctdb_daemon_data daemon;
482         struct ctdb_statistics statistics;
483         struct ctdb_statistics statistics_current;
484 #define MAX_STAT_HISTORY 100
485         struct ctdb_statistics statistics_history[MAX_STAT_HISTORY];
486         struct ctdb_vnn_map *vnn_map;
487         uint32_t num_clients;
488         uint32_t recovery_master;
489         struct ctdb_call_state *pending_calls;
490         struct ctdb_client_ip *client_ip_list;
491         bool do_checkpublicip;
492         struct trbt_tree *server_ids; 
493         bool do_setsched;
494         void *saved_scheduler_param;
495         const char *event_script_dir;
496         const char *debug_hung_script;
497         const char *notification_script;
498         const char *default_public_interface;
499         pid_t ctdbd_pid;
500         pid_t recoverd_pid;
501         pid_t syslogd_pid;
502         bool done_startup;
503         const char *node_ip;
504         struct ctdb_monitor_state *monitor;
505         struct ctdb_log_state *log;
506         int start_as_disabled;
507         int start_as_stopped;
508         bool valgrinding;
509         uint32_t event_script_timeouts; /* counting how many consecutive times an eventscript has timedout */
510         uint32_t *recd_ping_count;
511         TALLOC_CTX *release_ips_ctx; /* a context used to automatically drop all IPs if we fail to recover the node */
512
513         TALLOC_CTX *event_script_ctx;
514
515         struct ctdb_event_script_state *current_monitor;
516         struct ctdb_scripts_wire *last_status[CTDB_EVENT_MAX];
517
518         TALLOC_CTX *banning_ctx;
519
520         struct ctdb_vacuum_child_context *vacuumers;
521
522         /* mapping from pid to ctdb_client * */
523         struct ctdb_client_pid_list *client_pids;
524
525         /* used in the recovery daemon to remember the ip allocation */
526         struct trbt_tree *ip_tree;
527
528         /* Used to defer db attach requests while in recovery mode */
529         struct ctdb_deferred_attach_context *deferred_attach;
530
531         /* if we are a child process, do we have a domain socket to send controls on */
532         bool can_send_controls;
533
534         /* list of event script callback functions that are active */
535         struct event_script_callback *script_callbacks;
536
537         struct ctdb_reloadips_handle *reload_ips;
538
539         const char *public_addresses_file;
540         struct trbt_tree *child_processes; 
541         TALLOC_CTX *debug_hung_script_ctx;
542
543         /* Used for locking record/db/alldb */
544         int lock_num_current;
545         int lock_num_pending;
546         struct lock_context *lock_current;
547         struct lock_context *lock_pending;
548 };
549
550 struct ctdb_db_context {
551         struct ctdb_db_context *next, *prev;
552         struct ctdb_context *ctdb;
553         uint32_t db_id;
554         uint32_t priority;
555         bool persistent;
556         bool readonly; /* Do we support read-only delegations ? */
557         bool sticky; /* Do we support sticky records ? */
558         const char *db_name;
559         const char *db_path;
560         struct tdb_wrap *ltdb;
561         struct tdb_context *rottdb; /* ReadOnly tracking TDB */
562         struct ctdb_registered_call *calls; /* list of registered calls */
563         uint32_t seqnum;
564         struct timed_event *seqnum_update;
565         struct ctdb_traverse_local_handle *traverse;
566         bool transaction_active;
567         struct ctdb_vacuum_handle *vacuum_handle;
568         char *unhealthy_reason;
569         int pending_requests;
570         struct revokechild_handle *revokechild_active;
571         struct ctdb_persistent_state *persistent_state;
572         struct trbt_tree *delete_queue;
573         struct trbt_tree *sticky_records; 
574         int (*ctdb_ltdb_store_fn)(struct ctdb_db_context *ctdb_db,
575                                   TDB_DATA key,
576                                   struct ctdb_ltdb_header *header,
577                                   TDB_DATA data);
578
579         /* used to track which records we are currently fetching
580            so we can avoid sending duplicate fetch requests
581         */
582         struct trbt_tree *deferred_fetch;
583
584         struct ctdb_db_statistics statistics;
585 };
586
587
588 #define CTDB_NO_MEMORY(ctdb, p) do { if (!(p)) { \
589           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
590           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
591           return -1; }} while (0)
592
593 #define CTDB_NO_MEMORY_VOID(ctdb, p) do { if (!(p)) { \
594           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
595           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
596           return; }} while (0)
597
598 #define CTDB_NO_MEMORY_NULL(ctdb, p) do { if (!(p)) { \
599           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
600           ctdb_set_error(ctdb, "Out of memory at %s:%d", __FILE__, __LINE__); \
601           return NULL; }} while (0)
602
603 #define CTDB_NO_MEMORY_FATAL(ctdb, p) do { if (!(p)) { \
604           DEBUG(0,("Out of memory for %s at %s\n", #p, __location__)); \
605           ctdb_fatal(ctdb, "Out of memory in " __location__ ); \
606           }} while (0)
607
608 /*
609   structure passed in set_call control
610  */
611 struct ctdb_control_set_call {
612         uint32_t db_id;
613         ctdb_fn_t fn;
614         uint32_t id;
615 };
616
617 /*
618   struct for kill_tcp control
619  */
620 struct ctdb_control_killtcp {
621         ctdb_sock_addr src_addr;
622         ctdb_sock_addr dst_addr;
623 };
624
625 /*
626   struct holding a ctdb_sock_addr and an interface name,
627   used to add/remove public addresses
628  */
629 struct ctdb_control_ip_iface {
630         ctdb_sock_addr addr;
631         uint32_t mask;
632         uint32_t len;
633         char iface[1];
634 };
635
636 /*
637   struct holding a ctdb_sock_addr and an interface name,
638   used for send_gratious_arp
639  */
640 struct ctdb_control_gratious_arp {
641         ctdb_sock_addr addr;
642         uint32_t mask;
643         uint32_t len;
644         char iface[1];
645 };
646
647 /*
648   persistent store control - update this record on all other nodes
649  */
650 struct ctdb_control_persistent_store {
651         uint32_t db_id;
652         uint32_t len;
653         uint8_t  data[1];
654 };
655
656 /*
657   structure used for CTDB_SRVID_NODE_FLAGS_CHANGED
658  */
659 struct ctdb_node_flag_change {
660         uint32_t pnn;
661         uint32_t new_flags;
662         uint32_t old_flags;
663 };
664
665 /*
666   struct for admin setting a ban
667  */
668 struct ctdb_ban_info {
669         uint32_t pnn;
670         uint32_t ban_time;
671 };
672
673 enum call_state {CTDB_CALL_WAIT, CTDB_CALL_DONE, CTDB_CALL_ERROR};
674
675 #define CTDB_LMASTER_ANY        0xffffffff
676
677 /*
678   state of a in-progress ctdb call
679 */
680 struct ctdb_call_state {
681         struct ctdb_call_state *next, *prev;
682         enum call_state state;
683         uint32_t reqid;
684         struct ctdb_req_call *c;
685         struct ctdb_db_context *ctdb_db;
686         const char *errmsg;
687         struct ctdb_call *call;
688         uint32_t generation;
689         struct {
690                 void (*fn)(struct ctdb_call_state *);
691                 void *private_data;
692         } async;
693 };
694
695
696 /* used for fetch_lock */
697 struct ctdb_fetch_handle {
698         struct ctdb_db_context *ctdb_db;
699         TDB_DATA key;
700         TDB_DATA *data;
701         struct ctdb_ltdb_header header;
702 };
703
704 /* internal prototypes */
705 void ctdb_set_error(struct ctdb_context *ctdb, const char *fmt, ...) PRINTF_ATTRIBUTE(2,3);
706 void ctdb_fatal(struct ctdb_context *ctdb, const char *msg);
707 void ctdb_external_trace(void);
708 bool ctdb_same_address(struct ctdb_address *a1, struct ctdb_address *a2);
709 int ctdb_parse_address(struct ctdb_context *ctdb,
710                        TALLOC_CTX *mem_ctx, const char *str,
711                        struct ctdb_address *address);
712 bool ctdb_same_ip(const ctdb_sock_addr *ip1, const ctdb_sock_addr *ip2);
713 bool ctdb_same_sockaddr(const ctdb_sock_addr *ip1, const ctdb_sock_addr *ip2);
714 uint32_t ctdb_hash(const TDB_DATA *key);
715 uint32_t ctdb_hash_string(const char *str);
716 void ctdb_request_call(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
717 void ctdb_request_dmaster(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
718 void ctdb_request_message(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
719 void ctdb_reply_dmaster(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
720 void ctdb_reply_call(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
721 void ctdb_reply_error(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
722
723 uint32_t ctdb_lmaster(struct ctdb_context *ctdb, const TDB_DATA *key);
724 int ctdb_ltdb_fetch(struct ctdb_db_context *ctdb_db, 
725                     TDB_DATA key, struct ctdb_ltdb_header *header, 
726                     TALLOC_CTX *mem_ctx, TDB_DATA *data);
727 int ctdb_ltdb_store(struct ctdb_db_context *ctdb_db, TDB_DATA key, 
728                     struct ctdb_ltdb_header *header, TDB_DATA data);
729 int ctdb_ltdb_delete(struct ctdb_db_context *ctdb_db, TDB_DATA key);
730 int ctdb_ltdb_fetch_with_header(struct ctdb_db_context *ctdb_db, 
731                     TDB_DATA key, struct ctdb_ltdb_header *header, 
732                     TALLOC_CTX *mem_ctx, TDB_DATA *data);
733 int32_t ctdb_control_start_persistent_update(struct ctdb_context *ctdb, 
734                         struct ctdb_req_control *c,
735                         TDB_DATA recdata);
736 int32_t ctdb_control_cancel_persistent_update(struct ctdb_context *ctdb, 
737                         struct ctdb_req_control *c,
738                         TDB_DATA recdata);
739 void ctdb_queue_packet(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
740 void ctdb_queue_packet_opcode(struct ctdb_context *ctdb, struct ctdb_req_header *hdr, unsigned opcode);
741 int ctdb_ltdb_lock_requeue(struct ctdb_db_context *ctdb_db, 
742                            TDB_DATA key, struct ctdb_req_header *hdr,
743                            void (*recv_pkt)(void *, struct ctdb_req_header *),
744                            void *recv_context, bool ignore_generation);
745 int ctdb_ltdb_lock_fetch_requeue(struct ctdb_db_context *ctdb_db, 
746                                  TDB_DATA key, struct ctdb_ltdb_header *header, 
747                                  struct ctdb_req_header *hdr, TDB_DATA *data,
748                                  void (*recv_pkt)(void *, struct ctdb_req_header *),
749                                  void *recv_context, bool ignore_generation);
750 void ctdb_input_pkt(struct ctdb_context *ctdb, struct ctdb_req_header *);
751
752 struct ctdb_call_state *ctdb_call_local_send(struct ctdb_db_context *ctdb_db, 
753                                              struct ctdb_call *call,
754                                              struct ctdb_ltdb_header *header,
755                                              TDB_DATA *data);
756
757
758 int ctdbd_start(struct ctdb_context *ctdb);
759 struct ctdb_call_state *ctdbd_call_send(struct ctdb_db_context *ctdb_db, struct ctdb_call *call);
760 int ctdbd_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
761
762 /*
763   queue a packet for sending
764 */
765 int ctdb_queue_send(struct ctdb_queue *queue, uint8_t *data, uint32_t length);
766
767 /*
768   setup the fd used by the queue
769  */
770 int ctdb_queue_set_fd(struct ctdb_queue *queue, int fd);
771
772 /*
773   setup a packet queue on a socket
774  */
775 struct ctdb_queue *ctdb_queue_setup(struct ctdb_context *ctdb,
776                                     TALLOC_CTX *mem_ctx, int fd, int alignment,
777                                     
778                                     ctdb_queue_cb_fn_t callback,
779                                     void *private_data, const char *fmt, ...)
780         PRINTF_ATTRIBUTE(7,8);
781
782 /*
783   allocate a packet for use in client<->daemon communication
784  */
785 struct ctdb_req_header *_ctdbd_allocate_pkt(struct ctdb_context *ctdb,
786                                             TALLOC_CTX *mem_ctx, 
787                                             enum ctdb_operation operation, 
788                                             size_t length, size_t slength,
789                                             const char *type);
790 #define ctdbd_allocate_pkt(ctdb, mem_ctx, operation, length, type) \
791         (type *)_ctdbd_allocate_pkt(ctdb, mem_ctx, operation, length, sizeof(type), #type)
792
793 struct ctdb_req_header *_ctdb_transport_allocate(struct ctdb_context *ctdb,
794                                                  TALLOC_CTX *mem_ctx, 
795                                                  enum ctdb_operation operation, 
796                                                  size_t length, size_t slength,
797                                                  const char *type);
798 #define ctdb_transport_allocate(ctdb, mem_ctx, operation, length, type) \
799         (type *)_ctdb_transport_allocate(ctdb, mem_ctx, operation, length, sizeof(type), #type)
800
801 int ctdb_queue_length(struct ctdb_queue *queue);
802
803 /*
804   lock a record in the ltdb, given a key
805  */
806 int ctdb_ltdb_lock(struct ctdb_db_context *ctdb_db, TDB_DATA key);
807
808 /*
809   unlock a record in the ltdb, given a key
810  */
811 int ctdb_ltdb_unlock(struct ctdb_db_context *ctdb_db, TDB_DATA key);
812
813
814 /*
815   make a ctdb call to the local daemon - async send. Called from client context.
816
817   This constructs a ctdb_call request and queues it for processing. 
818   This call never blocks.
819 */
820 struct ctdb_call_state *ctdb_client_call_send(struct ctdb_db_context *ctdb_db, 
821                                               struct ctdb_call *call);
822
823 /*
824   make a recv call to the local ctdb daemon - called from client context
825
826   This is called when the program wants to wait for a ctdb_call to complete and get the 
827   results. This call will block unless the call has already completed.
828 */
829 int ctdb_client_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
830
831 int ctdb_client_send_message(struct ctdb_context *ctdb, uint32_t vnn,
832                              uint64_t srvid, TDB_DATA data);
833
834 /*
835   send a ctdb message
836 */
837 int ctdb_daemon_send_message(struct ctdb_context *ctdb, uint32_t pnn,
838                              uint64_t srvid, TDB_DATA data);
839
840
841 struct ctdb_call_state *ctdb_daemon_call_send(struct ctdb_db_context *ctdb_db, 
842                                               struct ctdb_call *call);
843
844 int ctdb_daemon_call_recv(struct ctdb_call_state *state, struct ctdb_call *call);
845
846 struct ctdb_call_state *ctdb_daemon_call_send_remote(struct ctdb_db_context *ctdb_db, 
847                                                      struct ctdb_call *call, 
848                                                      struct ctdb_ltdb_header *header);
849
850 int ctdb_call_local(struct ctdb_db_context *ctdb_db, struct ctdb_call *call,
851                     struct ctdb_ltdb_header *header, TALLOC_CTX *mem_ctx,
852                     TDB_DATA *data, bool updatetdb, uint32_t caller);
853
854 #define ctdb_reqid_find(ctdb, reqid, type)      (type *)_ctdb_reqid_find(ctdb, reqid, #type, __location__)
855
856 void ctdb_recv_raw_pkt(void *p, uint8_t *data, uint32_t length);
857
858 int ctdb_socket_connect(struct ctdb_context *ctdb);
859 void ctdb_client_read_cb(uint8_t *data, size_t cnt, void *args);
860
861 #define CTDB_BAD_REQID ((uint32_t)-1)
862 uint32_t ctdb_reqid_new(struct ctdb_context *ctdb, void *state);
863 void *_ctdb_reqid_find(struct ctdb_context *ctdb, uint32_t reqid, const char *type, const char *location);
864 void ctdb_reqid_remove(struct ctdb_context *ctdb, uint32_t reqid);
865
866 void ctdb_request_control(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
867 void ctdb_reply_control(struct ctdb_context *ctdb, struct ctdb_req_header *hdr);
868
869 int ctdb_daemon_send_control(struct ctdb_context *ctdb, uint32_t destnode,
870                              uint64_t srvid, uint32_t opcode, uint32_t client_id, uint32_t flags,
871                              TDB_DATA data,
872                              ctdb_control_callback_fn_t callback,
873                              void *private_data);
874
875 int32_t ctdb_control_db_attach(struct ctdb_context *ctdb, TDB_DATA indata, 
876                                TDB_DATA *outdata, uint64_t tdb_flags,
877                                bool persistent, uint32_t client_id,
878                                struct ctdb_req_control *c,
879                                bool *async_reply);
880
881 int ctdb_daemon_set_call(struct ctdb_context *ctdb, uint32_t db_id,
882                          ctdb_fn_t fn, int id);
883
884 int ctdb_control(struct ctdb_context *ctdb, uint32_t destnode, uint64_t srvid, 
885                  uint32_t opcode, uint32_t flags, TDB_DATA data, 
886                  TALLOC_CTX *mem_ctx, TDB_DATA *outdata, int32_t *status,
887                  struct timeval *timeout, char **errormsg);
888 int ctdb_control_recv(struct ctdb_context *ctdb, 
889                 struct ctdb_client_control_state *state, 
890                 TALLOC_CTX *mem_ctx,
891                 TDB_DATA *outdata, int32_t *status, char **errormsg);
892
893 struct ctdb_client_control_state *
894 ctdb_control_send(struct ctdb_context *ctdb, 
895                 uint32_t destnode, uint64_t srvid, 
896                 uint32_t opcode, uint32_t flags, TDB_DATA data, 
897                 TALLOC_CTX *mem_ctx,
898                 struct timeval *timeout,
899                 char **errormsg);
900
901
902
903
904 #define CHECK_CONTROL_DATA_SIZE(size) do { \
905  if (indata.dsize != size) { \
906          DEBUG(0,(__location__ " Invalid data size in opcode %u. Got %u expected %u\n", \
907                   opcode, (unsigned)indata.dsize, (unsigned)size));     \
908          return -1; \
909  } \
910  } while (0)
911
912 #define CHECK_CONTROL_MIN_DATA_SIZE(size) do { \
913  if (indata.dsize < size) { \
914          DEBUG(0,(__location__ " Invalid data size in opcode %u. Got %u expected >= %u\n", \
915                   opcode, (unsigned)indata.dsize, (unsigned)size));     \
916          return -1; \
917  } \
918  } while (0)
919
920 int ctdb_control_getvnnmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
921 int ctdb_control_setvnnmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
922 int ctdb_control_getdbmap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
923 int ctdb_control_getnodemapv4(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
924 int ctdb_control_getnodemap(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
925 int ctdb_control_writerecord(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata, TDB_DATA *outdata);
926
927
928 /* structure used for pulldb control */
929 struct ctdb_control_pulldb {
930         uint32_t db_id;
931         uint32_t lmaster;
932 };
933
934 /* structure used for sending lists of records */
935 struct ctdb_marshall_buffer {
936         uint32_t db_id;
937         uint32_t count;
938         uint8_t data[1];
939 };
940
941 /* set dmaster control structure */
942 struct ctdb_control_set_dmaster {
943         uint32_t db_id;
944         uint32_t dmaster;
945 };
946
947 /*
948   structure for setting a tunable
949  */
950 struct ctdb_control_set_tunable {
951         uint32_t value;
952         uint32_t length;
953         uint8_t  name[1];
954 };
955
956 /*
957   structure for getting a tunable
958  */
959 struct ctdb_control_get_tunable {
960         uint32_t length;
961         uint8_t  name[1];
962 };
963
964 /*
965   structure for listing tunables
966  */
967 struct ctdb_control_list_tunable {
968         uint32_t length;
969         /* returns a : separated list of tunable names */
970         uint8_t  data[1];
971 };
972
973
974 struct ctdb_node_and_flagsv4 {
975         uint32_t pnn;
976         uint32_t flags;
977         struct sockaddr_in sin;
978 };
979
980 struct ctdb_node_mapv4 {
981         uint32_t num;
982         struct ctdb_node_and_flagsv4 nodes[1];
983 };
984
985 struct ctdb_control_wipe_database {
986         uint32_t db_id;
987         uint32_t transaction_id;
988 };
989
990 /*
991   state of a in-progress ctdb call in client
992 */
993 struct ctdb_client_call_state {
994         enum call_state state;
995         uint32_t reqid;
996         struct ctdb_db_context *ctdb_db;
997         struct ctdb_call *call;
998         struct {
999                 void (*fn)(struct ctdb_client_call_state *);
1000                 void *private_data;
1001         } async;
1002 };
1003
1004
1005 int32_t ctdb_control_traverse_start_ext(struct ctdb_context *ctdb,
1006                                         TDB_DATA indata,
1007                                         TDB_DATA *outdata,
1008                                         uint32_t srcnode,
1009                                         uint32_t client_id);
1010 int32_t ctdb_control_traverse_start(struct ctdb_context *ctdb, TDB_DATA indata, 
1011                                     TDB_DATA *outdata, uint32_t srcnode, uint32_t client_id);
1012 int32_t ctdb_control_traverse_all(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1013 int32_t ctdb_control_traverse_data(struct ctdb_context *ctdb, TDB_DATA data, TDB_DATA *outdata);
1014 int32_t ctdb_control_traverse_kill(struct ctdb_context *ctdb, TDB_DATA indata, 
1015                                     TDB_DATA *outdata, uint32_t srcnode);
1016
1017 int ctdb_dispatch_message(struct ctdb_context *ctdb, uint64_t srvid, TDB_DATA data);
1018
1019 int daemon_register_message_handler(struct ctdb_context *ctdb, uint32_t client_id, uint64_t srvid);
1020 int ctdb_deregister_message_handler(struct ctdb_context *ctdb, uint64_t srvid, void *private_data);
1021 int daemon_deregister_message_handler(struct ctdb_context *ctdb, uint32_t client_id, uint64_t srvid);
1022 int daemon_check_srvids(struct ctdb_context *ctdb, TDB_DATA indata,
1023                         TDB_DATA *outdata);
1024
1025 int32_t ctdb_ltdb_enable_seqnum(struct ctdb_context *ctdb, uint32_t db_id);
1026 int32_t ctdb_ltdb_update_seqnum(struct ctdb_context *ctdb, uint32_t db_id, uint32_t srcnode);
1027
1028 struct ctdb_rec_data *ctdb_marshall_record(TALLOC_CTX *mem_ctx, uint32_t reqid, 
1029                                            TDB_DATA key, struct ctdb_ltdb_header *, TDB_DATA data);
1030
1031 struct ctdb_rec_data *ctdb_marshall_loop_next(struct ctdb_marshall_buffer *m, struct ctdb_rec_data *r,
1032                                               uint32_t *reqid,
1033                                               struct ctdb_ltdb_header *header,
1034                                               TDB_DATA *key, TDB_DATA *data);
1035
1036 int32_t ctdb_control_pull_db(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1037 int32_t ctdb_control_push_db(struct ctdb_context *ctdb, TDB_DATA indata);
1038 int32_t ctdb_control_set_dmaster(struct ctdb_context *ctdb, TDB_DATA indata);
1039
1040 int32_t ctdb_control_set_recmode(struct ctdb_context *ctdb, 
1041                                  struct ctdb_req_control *c,
1042                                  TDB_DATA indata, bool *async_reply,
1043                                  const char **errormsg);
1044 void ctdb_request_control_reply(struct ctdb_context *ctdb, struct ctdb_req_control *c,
1045                                 TDB_DATA *outdata, int32_t status, const char *errormsg);
1046
1047 int32_t ctdb_control_freeze(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1048 int32_t ctdb_control_thaw(struct ctdb_context *ctdb, uint32_t priority);
1049
1050 int ctdb_start_recoverd(struct ctdb_context *ctdb);
1051 void ctdb_stop_recoverd(struct ctdb_context *ctdb);
1052
1053 uint32_t ctdb_get_num_active_nodes(struct ctdb_context *ctdb);
1054
1055 void ctdb_disable_monitoring(struct ctdb_context *ctdb);
1056 void ctdb_enable_monitoring(struct ctdb_context *ctdb);
1057 void ctdb_stop_monitoring(struct ctdb_context *ctdb);
1058 void ctdb_start_monitoring(struct ctdb_context *ctdb);
1059 void ctdb_start_tcp_tickle_update(struct ctdb_context *ctdb);
1060 void ctdb_send_keepalive(struct ctdb_context *ctdb, uint32_t destnode);
1061 void ctdb_start_keepalive(struct ctdb_context *ctdb);
1062 void ctdb_stop_keepalive(struct ctdb_context *ctdb);
1063 int32_t ctdb_run_eventscripts(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA data, bool *async_reply);
1064
1065
1066 void ctdb_daemon_cancel_controls(struct ctdb_context *ctdb, struct ctdb_node *node);
1067 void ctdb_call_resend_all(struct ctdb_context *ctdb);
1068 void ctdb_node_dead(struct ctdb_node *node);
1069 void ctdb_node_connected(struct ctdb_node *node);
1070 bool ctdb_blocking_freeze(struct ctdb_context *ctdb);
1071 void ctdb_set_scheduler(struct ctdb_context *ctdb);
1072 void ctdb_restore_scheduler(struct ctdb_context *ctdb);
1073
1074 struct tevent_signal *ctdb_init_sigchld(struct ctdb_context *ctdb);
1075 pid_t ctdb_fork(struct ctdb_context *ctdb);
1076 int ctdb_kill(struct ctdb_context *ctdb, pid_t pid, int signum);
1077
1078 int32_t ctdb_control_takeover_ip(struct ctdb_context *ctdb, 
1079                                  struct ctdb_req_control *c,
1080                                  TDB_DATA indata, 
1081                                  bool *async_reply);
1082 int32_t ctdb_control_takeover_ipv4(struct ctdb_context *ctdb, 
1083                                  struct ctdb_req_control *c,
1084                                  TDB_DATA indata, 
1085                                  bool *async_reply);
1086 int32_t ctdb_control_release_ip(struct ctdb_context *ctdb, 
1087                                  struct ctdb_req_control *c,
1088                                  TDB_DATA indata, 
1089                                  bool *async_reply);
1090 int32_t ctdb_control_release_ipv4(struct ctdb_context *ctdb, 
1091                                  struct ctdb_req_control *c,
1092                                  TDB_DATA indata, 
1093                                  bool *async_reply);
1094 int32_t ctdb_control_start_recovery(struct ctdb_context *ctdb, 
1095                                  struct ctdb_req_control *c,
1096                                  bool *async_reply);
1097 int32_t ctdb_control_end_recovery(struct ctdb_context *ctdb, 
1098                                  struct ctdb_req_control *c,
1099                                  bool *async_reply);
1100
1101 struct ctdb_public_ipv4 {
1102         uint32_t pnn;
1103         struct sockaddr_in sin;
1104 };
1105
1106 int ctdb_ctrl_takeover_ip(struct ctdb_context *ctdb, struct timeval timeout, 
1107                           uint32_t destnode, struct ctdb_public_ip *ip);
1108 int ctdb_ctrl_release_ip(struct ctdb_context *ctdb, struct timeval timeout, 
1109                          uint32_t destnode, struct ctdb_public_ip *ip);
1110
1111 struct ctdb_all_public_ipsv4 {
1112         uint32_t num;
1113         struct ctdb_public_ipv4 ips[1];
1114 };
1115
1116 int32_t ctdb_control_get_public_ipsv4(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA *outdata);
1117 int32_t ctdb_control_get_public_ips(struct ctdb_context *ctdb, struct ctdb_req_control *c, TDB_DATA *outdata);
1118 int ctdb_ctrl_get_public_ips(struct ctdb_context *ctdb, 
1119                              struct timeval timeout,
1120                              uint32_t destnode,
1121                              TALLOC_CTX *mem_ctx,
1122                              struct ctdb_all_public_ips **ips);
1123 #define CTDB_PUBLIC_IP_FLAGS_ONLY_AVAILABLE 0x00010000
1124 int ctdb_ctrl_get_public_ips_flags(struct ctdb_context *ctdb,
1125                                    struct timeval timeout, uint32_t destnode,
1126                                    TALLOC_CTX *mem_ctx,
1127                                    uint32_t flags,
1128                                    struct ctdb_all_public_ips **ips);
1129 int ctdb_ctrl_get_public_ipsv4(struct ctdb_context *ctdb, 
1130                         struct timeval timeout, uint32_t destnode, 
1131                         TALLOC_CTX *mem_ctx, struct ctdb_all_public_ips **ips);
1132
1133 struct ctdb_control_iface_info {
1134         char name[CTDB_IFACE_SIZE+2];
1135         uint16_t link_state;
1136         uint32_t references;
1137 };
1138
1139 struct ctdb_control_public_ip_info {
1140         struct ctdb_public_ip ip;
1141         uint32_t active_idx;
1142         uint32_t num;
1143         struct ctdb_control_iface_info ifaces[1];
1144 };
1145
1146 struct ctdb_control_get_ifaces {
1147         uint32_t num;
1148         struct ctdb_control_iface_info ifaces[1];
1149 };
1150
1151 int32_t ctdb_control_get_public_ip_info(struct ctdb_context *ctdb,
1152                                         struct ctdb_req_control *c,
1153                                         TDB_DATA indata,
1154                                         TDB_DATA *outdata);
1155 int32_t ctdb_control_get_ifaces(struct ctdb_context *ctdb,
1156                                 struct ctdb_req_control *c,
1157                                 TDB_DATA *outdata);
1158 int32_t ctdb_control_set_iface_link(struct ctdb_context *ctdb,
1159                                     struct ctdb_req_control *c,
1160                                     TDB_DATA indata);
1161 int ctdb_ctrl_get_public_ip_info(struct ctdb_context *ctdb,
1162                                  struct timeval timeout, uint32_t destnode,
1163                                  TALLOC_CTX *mem_ctx,
1164                                  const ctdb_sock_addr *addr,
1165                                  struct ctdb_control_public_ip_info **info);
1166 int ctdb_ctrl_get_ifaces(struct ctdb_context *ctdb,
1167                          struct timeval timeout, uint32_t destnode,
1168                          TALLOC_CTX *mem_ctx,
1169                          struct ctdb_control_get_ifaces **ifaces);
1170 int ctdb_ctrl_set_iface_link(struct ctdb_context *ctdb,
1171                              struct timeval timeout, uint32_t destnode,
1172                              TALLOC_CTX *mem_ctx,
1173                              const struct ctdb_control_iface_info *info);
1174
1175 /* from takeover/system.c */
1176 uint32_t uint16_checksum(uint16_t *data, size_t n);
1177 int ctdb_sys_send_arp(const ctdb_sock_addr *addr, const char *iface);
1178 bool ctdb_sys_have_ip(ctdb_sock_addr *addr);
1179 char *ctdb_sys_find_ifname(ctdb_sock_addr *addr);
1180 bool ctdb_sys_check_iface_exists(const char *iface);
1181 int ctdb_get_peer_pid(const int fd, pid_t *peer_pid);
1182 int ctdb_sys_send_tcp(const ctdb_sock_addr *dest, 
1183                       const ctdb_sock_addr *src,
1184                       uint32_t seq, uint32_t ack, int rst);
1185
1186 /* Details of a byte range lock */
1187 struct ctdb_lock_info {
1188         ino_t inode;
1189         off_t start, end;
1190         bool waiting;
1191         bool read_only;
1192 };
1193
1194 char *ctdb_get_process_name(pid_t pid);
1195 bool ctdb_get_lock_info(pid_t req_pid, struct ctdb_lock_info *lock_info);
1196 bool ctdb_get_blocker_pid(struct ctdb_lock_info *reqlock, pid_t *blocker_pid);
1197
1198 typedef void (*client_async_callback)(struct ctdb_context *ctdb, uint32_t node_pnn, int32_t res, TDB_DATA outdata, void *callback_data);
1199
1200 int ctdb_set_public_addresses(struct ctdb_context *ctdb, bool check_addresses);
1201 int ctdb_set_single_public_ip(struct ctdb_context *ctdb,
1202                               const char *iface,
1203                               const char *ip);
1204 int ctdb_set_event_script(struct ctdb_context *ctdb, const char *script);
1205 int ctdb_set_event_script_dir(struct ctdb_context *ctdb, const char *script_dir);
1206 int ctdb_set_debug_hung_script(struct ctdb_context *ctdb, const char *script);
1207 int ctdb_set_notification_script(struct ctdb_context *ctdb, const char *script);
1208 void lcp2_forcerebalance(struct ctdb_context *ctdb, uint32_t pnn);
1209 int ctdb_takeover_run(struct ctdb_context *ctdb, struct ctdb_node_map *nodemap, client_async_callback fail_callback, void *callback_data);
1210
1211 int32_t ctdb_control_tcp_client(struct ctdb_context *ctdb, uint32_t client_id, 
1212                                 TDB_DATA indata);
1213 int32_t ctdb_control_tcp_add(struct ctdb_context *ctdb, TDB_DATA indata, bool tcp_update_needed);
1214 int32_t ctdb_control_tcp_remove(struct ctdb_context *ctdb, TDB_DATA indata);
1215 int32_t ctdb_control_startup(struct ctdb_context *ctdb, uint32_t vnn);
1216 int32_t ctdb_control_kill_tcp(struct ctdb_context *ctdb, TDB_DATA indata);
1217 int32_t ctdb_control_send_gratious_arp(struct ctdb_context *ctdb, TDB_DATA indata);
1218 int32_t ctdb_control_get_tcp_tickle_list(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1219 int32_t ctdb_control_set_tcp_tickle_list(struct ctdb_context *ctdb, TDB_DATA indata);
1220
1221 void ctdb_takeover_client_destructor_hook(struct ctdb_client *client);
1222 int ctdb_event_script(struct ctdb_context *ctdb, enum ctdb_eventscript_call call);
1223 int ctdb_event_script_args(struct ctdb_context *ctdb, enum ctdb_eventscript_call call,
1224                            const char *fmt, ...) PRINTF_ATTRIBUTE(3,4);
1225 int ctdb_event_script_callback(struct ctdb_context *ctdb, 
1226                                TALLOC_CTX *mem_ctx,
1227                                void (*callback)(struct ctdb_context *, int, void *),
1228                                void *private_data,
1229                                bool from_user,
1230                                enum ctdb_eventscript_call call,
1231                                const char *fmt, ...) PRINTF_ATTRIBUTE(7,8);
1232 void ctdb_release_all_ips(struct ctdb_context *ctdb);
1233
1234 void set_nonblocking(int fd);
1235 void set_close_on_exec(int fd);
1236
1237 bool ctdb_recovery_lock(struct ctdb_context *ctdb, bool keep);
1238
1239 int ctdb_set_recovery_lock_file(struct ctdb_context *ctdb, const char *file);
1240
1241 int32_t ctdb_control_get_tunable(struct ctdb_context *ctdb, TDB_DATA indata, 
1242                                  TDB_DATA *outdata);
1243 int32_t ctdb_control_set_tunable(struct ctdb_context *ctdb, TDB_DATA indata);
1244 int32_t ctdb_control_list_tunables(struct ctdb_context *ctdb, TDB_DATA *outdata);
1245 int32_t ctdb_control_try_delete_records(struct ctdb_context *ctdb, TDB_DATA indata, TDB_DATA *outdata);
1246 int32_t ctdb_control_add_public_address(struct ctdb_context *ctdb, TDB_DATA indata);
1247 int32_t ctdb_control_del_public_address(struct ctdb_context *ctdb, TDB_DATA indata);
1248
1249 void ctdb_tunables_set_defaults(struct ctdb_context *ctdb);
1250
1251 int32_t ctdb_control_modflags(struct ctdb_context *ctdb, TDB_DATA indata);
1252
1253 int ctdb_ctrl_get_all_tunables(struct ctdb_context *ctdb, 
1254                                struct timeval timeout, 
1255                                uint32_t destnode,
1256                                struct ctdb_tunable *tunables);
1257
1258 int ctdb_start_freeze(struct ctdb_context *ctdb, uint32_t priority);
1259
1260 bool parse_ip_mask(const char *s, const char *iface, ctdb_sock_addr *addr, unsigned *mask);
1261 bool parse_ip_port(const char *s, ctdb_sock_addr *addr);
1262 bool parse_ip(const char *s, const char *iface, unsigned port, ctdb_sock_addr *addr);
1263 bool parse_ipv4(const char *s, unsigned port, struct sockaddr_in *sin);
1264  
1265
1266 int ctdb_sys_open_capture_socket(const char *iface, void **private_data);
1267 int ctdb_sys_close_capture_socket(void *private_data);
1268 int ctdb_sys_read_tcp_packet(int s, void *private_data, ctdb_sock_addr *src, ctdb_sock_addr *dst, uint32_t *ack_seq, uint32_t *seq);
1269
1270 int ctdb_ctrl_killtcp(struct ctdb_context *ctdb, 
1271                       struct timeval timeout, 
1272                       uint32_t destnode,
1273                       struct ctdb_control_killtcp *killtcp);
1274
1275 int ctdb_ctrl_add_public_ip(struct ctdb_context *ctdb, 
1276                       struct timeval timeout, 
1277                       uint32_t destnode,
1278                       struct ctdb_control_ip_iface *pub);
1279
1280 int ctdb_ctrl_del_public_ip(struct ctdb_context *ctdb, 
1281                       struct timeval timeout, 
1282                       uint32_t destnode,
1283                       struct ctdb_control_ip_iface *pub);
1284
1285 int ctdb_ctrl_gratious_arp(struct ctdb_context *ctdb, 
1286                       struct timeval timeout, 
1287                       uint32_t destnode,
1288                       ctdb_sock_addr *addr,
1289                       const char *ifname);
1290
1291 int ctdb_ctrl_get_tcp_tickles(struct ctdb_context *ctdb, 
1292                       struct timeval timeout, 
1293                       uint32_t destnode,
1294                       TALLOC_CTX *mem_ctx,
1295                       ctdb_sock_addr *addr,
1296                       struct ctdb_control_tcp_tickle_list **list);
1297
1298
1299 int32_t ctdb_control_register_server_id(struct ctdb_context *ctdb, 
1300                       uint32_t client_id,
1301                       TDB_DATA indata);
1302 int32_t ctdb_control_check_server_id(struct ctdb_context *ctdb, 
1303                       TDB_DATA indata);
1304 int32_t ctdb_control_unregister_server_id(struct ctdb_context *ctdb, 
1305                       TDB_DATA indata);
1306 int32_t ctdb_control_get_server_id_list(struct ctdb_context *ctdb, 
1307                       TDB_DATA *outdata);
1308 int32_t ctdb_control_uptime(struct ctdb_context *ctdb, 
1309                       TDB_DATA *outdata);
1310
1311 int ctdb_attach_databases(struct ctdb_context *ctdb);
1312
1313 int32_t ctdb_control_persistent_store(struct ctdb_context *ctdb, 
1314                                       struct ctdb_req_control *c, 
1315                                       TDB_DATA recdata, bool *async_reply);
1316 int32_t ctdb_control_update_record(struct ctdb_context *ctdb, 
1317                                    struct ctdb_req_control *c, TDB_DATA recdata, 
1318                                    bool *async_reply);
1319 int32_t ctdb_control_trans2_commit(struct ctdb_context *ctdb, 
1320                                    struct ctdb_req_control *c, 
1321                                    TDB_DATA recdata, bool *async_reply);
1322
1323 int32_t ctdb_control_trans3_commit(struct ctdb_context *ctdb,
1324                                    struct ctdb_req_control *c,
1325                                    TDB_DATA recdata, bool *async_reply);
1326
1327 void ctdb_persistent_finish_trans3_commits(struct ctdb_context *ctdb);
1328
1329 int32_t ctdb_control_transaction_start(struct ctdb_context *ctdb, uint32_t id);
1330 int32_t ctdb_control_transaction_commit(struct ctdb_context *ctdb, uint32_t id);
1331 int32_t ctdb_control_transaction_cancel(struct ctdb_context *ctdb);
1332 int32_t ctdb_control_wipe_database(struct ctdb_context *ctdb, TDB_DATA indata);
1333 int32_t ctdb_control_db_set_healthy(struct ctdb_context *ctdb, TDB_DATA indata);
1334 int32_t ctdb_control_db_get_health(struct ctdb_context *ctdb,
1335                                    TDB_DATA indata,
1336                                    TDB_DATA *outdata);
1337
1338
1339 int ctdb_vacuum(struct ctdb_context *ctdb, int argc, const char **argv);
1340 int ctdb_repack(struct ctdb_context *ctdb, int argc, const char **argv);
1341
1342 void ctdb_block_signal(int signum);
1343 void ctdb_unblock_signal(int signum);
1344 int32_t ctdb_monitoring_mode(struct ctdb_context *ctdb);
1345 int ctdb_set_child_logging(struct ctdb_context *ctdb);
1346 void ctdb_lockdown_memory(struct ctdb_context *ctdb);
1347
1348 struct client_async_data {
1349         enum ctdb_controls opcode;
1350         bool dont_log_errors;
1351         uint32_t count;
1352         uint32_t fail_count;
1353         client_async_callback callback;
1354         client_async_callback fail_callback;
1355         void *callback_data;
1356 };
1357 void ctdb_client_async_add(struct client_async_data *data, struct ctdb_client_control_state *state);
1358 int ctdb_client_async_wait(struct ctdb_context *ctdb, struct client_async_data *data);
1359 int ctdb_client_async_control(struct ctdb_context *ctdb,
1360                                 enum ctdb_controls opcode,
1361                                 uint32_t *nodes,
1362                                 uint64_t srvid,
1363                                 struct timeval timeout,
1364                                 bool dont_log_errors,
1365                                 TDB_DATA data,
1366                                 client_async_callback client_callback,
1367                                 client_async_callback fail_callback,
1368                                 void *callback_data);
1369
1370 void ctdb_load_nodes_file(struct ctdb_context *ctdb);
1371
1372 int ctdb_control_reload_nodes_file(struct ctdb_context *ctdb, uint32_t opcode);
1373
1374 int32_t ctdb_dump_memory(struct ctdb_context *ctdb, TDB_DATA *outdata);
1375 int32_t ctdb_control_get_capabilities(struct ctdb_context *ctdb, TDB_DATA *outdata);
1376
1377 int32_t ctdb_control_trans2_finished(struct ctdb_context *ctdb, 
1378                                      struct ctdb_req_control *c);
1379 int32_t ctdb_control_trans2_error(struct ctdb_context *ctdb, 
1380                                   struct ctdb_req_control *c);
1381 int32_t ctdb_control_trans2_active(struct ctdb_context *ctdb,
1382                                    struct ctdb_req_control *c,
1383                                    uint32_t db_id);
1384
1385 char *ctdb_addr_to_str(ctdb_sock_addr *addr);
1386 unsigned ctdb_addr_to_port(ctdb_sock_addr *addr);
1387 void ctdb_canonicalize_ip(const ctdb_sock_addr *ip, ctdb_sock_addr *cip);
1388
1389 int32_t ctdb_control_recd_ping(struct ctdb_context *ctdb);
1390 int32_t ctdb_control_set_recmaster(struct ctdb_context *ctdb, uint32_t opcode, TDB_DATA indata);
1391
1392 extern int script_log_level;
1393 extern bool fast_start;
1394
1395 int32_t ctdb_control_get_event_script_status(struct ctdb_context *ctdb,
1396                                              uint32_t call_type,
1397                                              TDB_DATA *outdata);
1398
1399 int ctdb_log_event_script_output(struct ctdb_context *ctdb, char *str, uint16_t len);
1400 int ctdb_ctrl_report_recd_lock_latency(struct ctdb_context *ctdb, struct timeval timeout, double latency);
1401
1402 int32_t ctdb_control_stop_node(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1403 int32_t ctdb_control_continue_node(struct ctdb_context *ctdb);
1404
1405 void ctdb_stop_vacuuming(struct ctdb_context *ctdb);
1406 int ctdb_vacuum_init(struct ctdb_db_context *ctdb_db);
1407
1408 int32_t ctdb_control_enable_script(struct ctdb_context *ctdb, TDB_DATA indata);
1409 int32_t ctdb_control_disable_script(struct ctdb_context *ctdb, TDB_DATA indata);
1410
1411 int32_t ctdb_local_node_got_banned(struct ctdb_context *ctdb);
1412 int32_t ctdb_control_set_ban_state(struct ctdb_context *ctdb, TDB_DATA indata);
1413 int32_t ctdb_control_get_ban_state(struct ctdb_context *ctdb, TDB_DATA *outdata);
1414 int32_t ctdb_control_set_db_priority(struct ctdb_context *ctdb, TDB_DATA indata);
1415 void ctdb_ban_self(struct ctdb_context *ctdb);
1416
1417 int32_t ctdb_control_register_notify(struct ctdb_context *ctdb, uint32_t client_id, TDB_DATA indata);
1418
1419 int32_t ctdb_control_deregister_notify(struct ctdb_context *ctdb, uint32_t client_id, TDB_DATA indata);
1420
1421 int start_syslog_daemon(struct ctdb_context *ctdb);
1422
1423 /* Where to send the log messages back to */
1424 struct ctdb_get_log_addr {
1425         uint32_t pnn;
1426         uint64_t srvid;
1427         int32_t level;
1428 };
1429
1430 extern int log_ringbuf_size;
1431
1432 void ctdb_collect_log(struct ctdb_context *ctdb, struct ctdb_get_log_addr *log_addr);
1433 void ctdb_clear_log(struct ctdb_context *ctdb);
1434 int32_t ctdb_control_get_log(struct ctdb_context *ctdb, TDB_DATA addr);
1435 int32_t ctdb_control_clear_log(struct ctdb_context *ctdb);
1436
1437
1438 struct ctdb_log_state *ctdb_fork_with_logging(TALLOC_CTX *mem_ctx,
1439                                               struct ctdb_context *ctdb,
1440                                               const char *log_prefix,
1441                                               void (*logfn)(const char *, uint16_t, void *),
1442                                               void *logfn_private, pid_t *pid);
1443
1444 int32_t ctdb_control_process_exists(struct ctdb_context *ctdb, pid_t pid);
1445 struct ctdb_client *ctdb_find_client_by_pid(struct ctdb_context *ctdb, pid_t pid);
1446
1447 int32_t ctdb_control_get_db_seqnum(struct ctdb_context *ctdb,
1448                                    TDB_DATA indata,
1449                                    TDB_DATA *outdata);
1450
1451 int ctdb_load_persistent_health(struct ctdb_context *ctdb,
1452                                 struct ctdb_db_context *ctdb_db);
1453 int ctdb_update_persistent_health(struct ctdb_context *ctdb,
1454                                   struct ctdb_db_context *ctdb_db,
1455                                   const char *reason,/* NULL means healthy */
1456                                   int num_healthy_nodes);
1457 int ctdb_recheck_persistent_health(struct ctdb_context *ctdb);
1458
1459 void ctdb_run_notification_script(struct ctdb_context *ctdb, const char *event);
1460
1461 void ctdb_fault_setup(void);
1462
1463 int verify_remote_ip_allocation(struct ctdb_context *ctdb, 
1464                                 struct ctdb_all_public_ips *ips);
1465 int update_ip_assignment_tree(struct ctdb_context *ctdb,
1466                                 struct ctdb_public_ip *ip);
1467
1468 int ctdb_init_tevent_logging(struct ctdb_context *ctdb);
1469
1470 int ctdb_statistics_init(struct ctdb_context *ctdb);
1471
1472 int32_t ctdb_control_get_stat_history(struct ctdb_context *ctdb,
1473                                       struct ctdb_req_control *c,
1474                                       TDB_DATA *outdata);
1475
1476 int ctdb_deferred_drop_all_ips(struct ctdb_context *ctdb);
1477
1478 int ctdb_process_deferred_attach(struct ctdb_context *ctdb);
1479
1480 /**
1481  * structure to pass to a schedule_for_deletion_control
1482  */
1483 struct ctdb_control_schedule_for_deletion {
1484         uint32_t db_id;
1485         struct ctdb_ltdb_header hdr;
1486         uint32_t keylen;
1487         uint8_t key[1]; /* key[] */
1488 };
1489
1490 int32_t ctdb_control_schedule_for_deletion(struct ctdb_context *ctdb,
1491                                            TDB_DATA indata);
1492
1493
1494 int32_t ctdb_local_schedule_for_deletion(struct ctdb_db_context *ctdb_db,
1495                                          const struct ctdb_ltdb_header *hdr,
1496                                          TDB_DATA key);
1497
1498 void ctdb_local_remove_from_delete_queue(struct ctdb_db_context *ctdb_db,
1499                                          const struct ctdb_ltdb_header *hdr,
1500                                          const TDB_DATA key);
1501
1502 struct ctdb_ltdb_header *ctdb_header_from_record_handle(struct ctdb_record_handle *h);
1503
1504 /* For unit testing ctdb_transaction.c. */
1505 struct ctdb_public_ip_list {
1506         struct ctdb_public_ip_list *next;
1507         uint32_t pnn;
1508         ctdb_sock_addr addr;
1509 };
1510 int ctdb_trackingdb_add_pnn(struct ctdb_context *ctdb, TDB_DATA *data, uint32_t pnn);
1511
1512 typedef void (*ctdb_trackingdb_cb)(struct ctdb_context *ctdb, uint32_t pnn, void *private_data);
1513
1514 void ctdb_trackingdb_traverse(struct ctdb_context *ctdb, TDB_DATA data, ctdb_trackingdb_cb cb, void *private_data);
1515
1516 int ctdb_start_revoke_ro_record(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db, TDB_DATA key, struct ctdb_ltdb_header *header, TDB_DATA data);
1517
1518 typedef void (*deferred_requeue_fn)(void *call_context, struct ctdb_req_header *hdr);
1519
1520 int ctdb_add_revoke_deferred_call(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db, TDB_DATA key, struct ctdb_req_header *hdr, deferred_requeue_fn fn, void *call_context);
1521
1522 int ctdb_set_db_readonly(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db);
1523
1524 int ctdb_null_func(struct ctdb_call_info *call);
1525
1526 int ctdb_fetch_func(struct ctdb_call_info *call);
1527
1528 int ctdb_fetch_with_header_func(struct ctdb_call_info *call);
1529
1530 int32_t ctdb_control_get_db_statistics(struct ctdb_context *ctdb,
1531                                 uint32_t db_id,
1532                                 TDB_DATA *outdata);
1533
1534 int ctdb_set_db_sticky(struct ctdb_context *ctdb, struct ctdb_db_context *ctdb_db);
1535
1536 /*
1537   description for a message to reload all ips via recovery master/daemon
1538  */
1539 struct reloadips_all_reply {
1540         uint32_t pnn;
1541         uint64_t srvid;
1542 };
1543
1544 int32_t ctdb_control_reload_public_ips(struct ctdb_context *ctdb, struct ctdb_req_control *c, bool *async_reply);
1545
1546 int ctdb_start_monitoring_interfaces(struct ctdb_context *ctdb);
1547
1548 /* from server/ctdb_lock.c */
1549 struct lock_request;
1550
1551 int ctdb_lockall_prio(struct ctdb_context *ctdb, uint32_t priority);
1552 int ctdb_unlockall_prio(struct ctdb_context *ctdb, uint32_t priority);
1553 int ctdb_lockall_mark_prio(struct ctdb_context *ctdb, uint32_t priority);
1554 int ctdb_lockall_unmark_prio(struct ctdb_context *ctdb, uint32_t priority);
1555
1556 void ctdb_lock_free_request_context(struct lock_request *lock_req);
1557
1558 struct lock_request *ctdb_lock_record(struct ctdb_db_context *ctdb_db,
1559                                       TDB_DATA key,
1560                                       bool auto_mark,
1561                                       void (*callback)(void *, bool),
1562                                       void *private_data);
1563
1564 struct lock_request *ctdb_lock_db(struct ctdb_db_context *ctdb_db,
1565                                   bool auto_mark,
1566                                   void (*callback)(void *, bool),
1567                                   void *private_data);
1568
1569 struct lock_request *ctdb_lock_alldb_prio(struct ctdb_context *ctdb,
1570                                           uint32_t priority,
1571                                           bool auto_mark,
1572                                           void (*callback)(void *, bool),
1573                                           void *private_data);
1574
1575 struct lock_request *ctdb_lock_alldb(struct ctdb_context *ctdb,
1576                                      bool auto_mark,
1577                                      void (*callback)(void *, bool),
1578                                      void *private_data);
1579
1580 #endif