ctdb: Make TDB_SEQNUM work synchronously with ctdb
[samba.git] / ctdb / common / ctdb_ltdb.c
index 7dc28ddf9930ca9b0b9bc022d674e8456b94f34f..1fc9ce28c1b436e259ab4a1b53ad258d45922923 100644 (file)
@@ -2,6 +2,7 @@
    ctdb ltdb code
 
    Copyright (C) Andrew Tridgell  2006
+   Copyright (C) Ronnie sahlberg  2011
 
    This program is free software; you can redistribute it and/or modify
    it under the terms of the GNU General Public License as published by
    along with this program; if not, see <http://www.gnu.org/licenses/>.
 */
 
-#include "includes.h"
-#include "lib/tevent/tevent.h"
-#include "lib/tdb/include/tdb.h"
+#include "replace.h"
 #include "system/network.h"
 #include "system/filesys.h"
-#include "../include/ctdb_private.h"
-#include "db_wrap.h"
+
+#include <tdb.h>
+
+#include "lib/tdb_wrap/tdb_wrap.h"
 #include "lib/util/dlinklist.h"
+#include "lib/util/debug.h"
+
+#include "ctdb_private.h"
+
+#include "common/common.h"
+#include "common/logging.h"
+
+
+/*
+ * Calculate tdb flags based on databse type
+ */
+int ctdb_db_tdb_flags(uint8_t db_flags, bool with_valgrind, bool with_mutex)
+{
+       int tdb_flags = 0;
+
+       if (db_flags & CTDB_DB_FLAGS_PERSISTENT) {
+               tdb_flags = TDB_DEFAULT;
+
+       } else if (db_flags & CTDB_DB_FLAGS_REPLICATED) {
+               tdb_flags = TDB_NOSYNC |
+                           TDB_CLEAR_IF_FIRST |
+                           TDB_INCOMPATIBLE_HASH;
+
+       } else {
+               tdb_flags = TDB_NOSYNC |
+                           TDB_CLEAR_IF_FIRST |
+                           TDB_INCOMPATIBLE_HASH;
+
+#ifdef TDB_MUTEX_LOCKING
+               if (with_mutex && tdb_runtime_check_for_robust_mutexes()) {
+                       tdb_flags |= TDB_MUTEX_LOCKING;
+               }
+#endif
+
+       }
+
+       tdb_flags |= TDB_DISALLOW_NESTING;
+       if (with_valgrind) {
+               tdb_flags |= TDB_NOMMAP;
+       }
+
+       return tdb_flags;
+}
 
 /*
   find an attached ctdb_db handle given a name
@@ -40,6 +84,61 @@ struct ctdb_db_context *ctdb_db_handle(struct ctdb_context *ctdb, const char *na
        return NULL;
 }
 
+bool ctdb_db_persistent(struct ctdb_db_context *ctdb_db)
+{
+       if (ctdb_db->db_flags & CTDB_DB_FLAGS_PERSISTENT) {
+               return true;
+       }
+       return false;
+}
+
+bool ctdb_db_replicated(struct ctdb_db_context *ctdb_db)
+{
+       if (ctdb_db->db_flags & CTDB_DB_FLAGS_REPLICATED) {
+               return true;
+       }
+       return false;
+}
+
+bool ctdb_db_volatile(struct ctdb_db_context *ctdb_db)
+{
+       if ((ctdb_db->db_flags & CTDB_DB_FLAGS_PERSISTENT) ||
+           (ctdb_db->db_flags & CTDB_DB_FLAGS_REPLICATED)) {
+               return false;
+       }
+       return true;
+}
+
+bool ctdb_db_readonly(struct ctdb_db_context *ctdb_db)
+{
+       if (ctdb_db->db_flags & CTDB_DB_FLAGS_READONLY) {
+               return true;
+       }
+       return false;
+}
+
+void ctdb_db_set_readonly(struct ctdb_db_context *ctdb_db)
+{
+       ctdb_db->db_flags |= CTDB_DB_FLAGS_READONLY;
+}
+
+void ctdb_db_reset_readonly(struct ctdb_db_context *ctdb_db)
+{
+       ctdb_db->db_flags &= ~CTDB_DB_FLAGS_READONLY;
+}
+
+bool ctdb_db_sticky(struct ctdb_db_context *ctdb_db)
+{
+       if (ctdb_db->db_flags & CTDB_DB_FLAGS_STICKY) {
+               return true;
+       }
+       return false;
+}
+
+void ctdb_db_set_sticky(struct ctdb_db_context *ctdb_db)
+{
+       ctdb_db->db_flags |= CTDB_DB_FLAGS_STICKY;
+}
 
 /*
   return the lmaster given a key
@@ -65,7 +164,7 @@ static void ltdb_initial_header(struct ctdb_db_context *ctdb_db,
        ZERO_STRUCTP(header);
        /* initial dmaster is the lmaster */
        header->dmaster = ctdb_lmaster(ctdb_db->ctdb, &key);
-       header->laccessor = header->dmaster;
+       header->flags = CTDB_REC_FLAG_AUTOMATIC;
 }
 
 
@@ -83,7 +182,6 @@ int ctdb_ltdb_fetch(struct ctdb_db_context *ctdb_db,
 
        rec = tdb_fetch(ctdb_db->ltdb->tdb, key);
        if (rec.dsize < sizeof(*header)) {
-               TDB_DATA d2;
                /* return an initial header */
                if (rec.dptr) free(rec.dptr);
                if (ctdb->vnn_map == NULL) {
@@ -93,11 +191,16 @@ int ctdb_ltdb_fetch(struct ctdb_db_context *ctdb_db,
                        return -1;
                }
                ltdb_initial_header(ctdb_db, key, header);
-               ZERO_STRUCT(d2);
                if (data) {
-                       *data = d2;
+                       *data = tdb_null;
+               }
+               if (ctdb_db_persistent(ctdb_db) ||
+                   header->dmaster == ctdb_db->ctdb->pnn) {
+                       if (ctdb_ltdb_store(ctdb_db, key, header, tdb_null) != 0) {
+                               DEBUG(DEBUG_NOTICE,
+                                     (__location__ "failed to store initial header\n"));
+                       }
                }
-               ctdb_ltdb_store(ctdb_db, key, header, d2);
                return 0;
        }
 
@@ -118,7 +221,6 @@ int ctdb_ltdb_fetch(struct ctdb_db_context *ctdb_db,
        return 0;
 }
 
-
 /*
   write a record to a normal database
 */
@@ -126,52 +228,41 @@ int ctdb_ltdb_store(struct ctdb_db_context *ctdb_db, TDB_DATA key,
                    struct ctdb_ltdb_header *header, TDB_DATA data)
 {
        struct ctdb_context *ctdb = ctdb_db->ctdb;
-       TDB_DATA rec;
+       TDB_DATA rec[2];
+       uint32_t hsize = sizeof(struct ctdb_ltdb_header);
        int ret;
-       bool seqnum_suppressed = false;
+
+       if (ctdb_db->ctdb_ltdb_store_fn) {
+               return ctdb_db->ctdb_ltdb_store_fn(ctdb_db, key, header, data);
+       }
 
        if (ctdb->flags & CTDB_FLAG_TORTURE) {
+               TDB_DATA old;
                struct ctdb_ltdb_header *h2;
-               rec = tdb_fetch(ctdb_db->ltdb->tdb, key);
-               h2 = (struct ctdb_ltdb_header *)rec.dptr;
-               if (rec.dptr && rec.dsize >= sizeof(h2) && h2->rsn > header->rsn) {
-                       DEBUG(DEBUG_CRIT,("RSN regression! %llu %llu\n",
-                                (unsigned long long)h2->rsn, (unsigned long long)header->rsn));
+
+               old = tdb_fetch(ctdb_db->ltdb->tdb, key);
+               h2 = (struct ctdb_ltdb_header *)old.dptr;
+               if (old.dptr != NULL && old.dsize >= hsize &&
+                   h2->rsn > header->rsn) {
+                       DEBUG(DEBUG_ERR,
+                             ("RSN regression! %"PRIu64" %"PRIu64"\n",
+                              h2->rsn, header->rsn));
+               }
+               if (old.dptr != NULL) {
+                       free(old.dptr);
                }
-               if (rec.dptr) free(rec.dptr);
        }
 
-       rec.dsize = sizeof(*header) + data.dsize;
-       rec.dptr = talloc_size(ctdb, rec.dsize);
-       CTDB_NO_MEMORY(ctdb, rec.dptr);
+       rec[0].dsize = hsize;
+       rec[0].dptr = (uint8_t *)header;
 
-       memcpy(rec.dptr, header, sizeof(*header));
-       memcpy(rec.dptr + sizeof(*header), data.dptr, data.dsize);
+       rec[1].dsize = data.dsize;
+       rec[1].dptr = data.dptr;
 
-       /* Databases with seqnum updates enabled only get their seqnum
-          changes when/if we modify the data */
-       if (ctdb_db->seqnum_update != NULL) {
-               TDB_DATA old;
-               old = tdb_fetch(ctdb_db->ltdb->tdb, key);
-
-               if ( (old.dsize == rec.dsize)
-               && !memcmp(old.dptr+sizeof(struct ctdb_ltdb_header),
-                         rec.dptr+sizeof(struct ctdb_ltdb_header),
-                         rec.dsize-sizeof(struct ctdb_ltdb_header)) ) {
-                       tdb_remove_flags(ctdb_db->ltdb->tdb, TDB_SEQNUM);
-                       seqnum_suppressed = true;
-               }
-               if (old.dptr) free(old.dptr);
-       }
-       ret = tdb_store(ctdb_db->ltdb->tdb, key, rec, TDB_REPLACE);
+       ret = tdb_storev(ctdb_db->ltdb->tdb, key, rec, 2, TDB_REPLACE);
        if (ret != 0) {
                DEBUG(DEBUG_ERR, (__location__ " Failed to store dynamic data\n"));
        }
-       if (seqnum_suppressed) {
-               tdb_add_flags(ctdb_db->ltdb->tdb, TDB_SEQNUM);
-       }
-
-       talloc_free(rec.dptr);
 
        return ret;
 }
@@ -195,3 +286,104 @@ int ctdb_ltdb_unlock(struct ctdb_db_context *ctdb_db, TDB_DATA key)
        }
        return ret;
 }
+
+
+/*
+  delete a record from a normal database
+*/
+int ctdb_ltdb_delete(struct ctdb_db_context *ctdb_db, TDB_DATA key)
+{
+       if (! ctdb_db_volatile(ctdb_db)) {
+               DEBUG(DEBUG_WARNING,
+                     ("Ignored deletion of empty record from "
+                      "non-volatile database\n"));
+               return 0;
+       }
+       if (tdb_delete(ctdb_db->ltdb->tdb, key) != 0) {
+               DEBUG(DEBUG_ERR,("Failed to delete empty record."));
+               return -1;
+       }
+       return 0;
+}
+
+int ctdb_trackingdb_add_pnn(struct ctdb_context *ctdb, TDB_DATA *data, uint32_t pnn)
+{
+       int byte_pos = pnn / 8;
+       int bit_mask   = 1 << (pnn % 8);
+
+       if (byte_pos + 1 > data->dsize) {
+               char *buf;
+
+               buf = malloc(byte_pos + 1);
+               memset(buf, 0, byte_pos + 1);
+               if (buf == NULL) {
+                       DEBUG(DEBUG_ERR, ("Out of memory when allocating buffer of %d bytes for trackingdb\n", byte_pos + 1));
+                       return -1;
+               }
+               if (data->dptr != NULL) {
+                       memcpy(buf, data->dptr, data->dsize);
+                       free(data->dptr);
+               }
+               data->dptr  = (uint8_t *)buf;
+               data->dsize = byte_pos + 1;
+       }
+
+       data->dptr[byte_pos] |= bit_mask;
+       return 0;
+}
+
+void ctdb_trackingdb_traverse(struct ctdb_context *ctdb, TDB_DATA data, ctdb_trackingdb_cb cb, void *private_data)
+{
+       int i;
+
+       for(i = 0; i < data.dsize; i++) {
+               int j;
+
+               for (j=0; j<8; j++) {
+                       int mask = 1<<j;
+
+                       if (data.dptr[i] & mask) {
+                               cb(ctdb, i * 8 + j, private_data);
+                       }
+               }
+       }
+}
+
+/*
+  this is the dummy null procedure that all databases support
+*/
+int ctdb_null_func(struct ctdb_call_info *call)
+{
+       return 0;
+}
+
+/*
+  this is a plain fetch procedure that all databases support
+*/
+int ctdb_fetch_func(struct ctdb_call_info *call)
+{
+       call->reply_data = &call->record_data;
+       return 0;
+}
+
+/*
+  this is a plain fetch procedure that all databases support
+  this returns the full record including the ltdb header
+*/
+int ctdb_fetch_with_header_func(struct ctdb_call_info *call)
+{
+       call->reply_data = talloc(call, TDB_DATA);
+       if (call->reply_data == NULL) {
+               return -1;
+       }
+       call->reply_data->dsize = sizeof(struct ctdb_ltdb_header) + call->record_data.dsize;
+       call->reply_data->dptr  = talloc_size(call->reply_data, call->reply_data->dsize);
+       if (call->reply_data->dptr == NULL) {
+               return -1;
+       }
+       memcpy(call->reply_data->dptr, call->header, sizeof(struct ctdb_ltdb_header));
+       memcpy(&call->reply_data->dptr[sizeof(struct ctdb_ltdb_header)], call->record_data.dptr, call->record_data.dsize);
+
+       return 0;
+}
+