Fix bug #7155 - valgrind Conditional jump or move depends on uninitialised value...
[samba.git] / source / smbd / mangle_hash.c
1 /*
2    Unix SMB/CIFS implementation.
3    Name mangling
4    Copyright (C) Andrew Tridgell 1992-2002
5    Copyright (C) Simo Sorce 2001
6    Copyright (C) Andrew Bartlett 2002
7    Copyright (C) Jeremy Allison 2007
8
9    This program is free software; you can redistribute it and/or modify
10    it under the terms of the GNU General Public License as published by
11    the Free Software Foundation; either version 3 of the License, or
12    (at your option) any later version.
13
14    This program is distributed in the hope that it will be useful,
15    but WITHOUT ANY WARRANTY; without even the implied warranty of
16    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17    GNU General Public License for more details.
18
19    You should have received a copy of the GNU General Public License
20    along with this program.  If not, see <http://www.gnu.org/licenses/>.
21 */
22
23 #include "includes.h"
24
25 /* -------------------------------------------------------------------------- **
26  * Other stuff...
27  *
28  * magic_char     - This is the magic char used for mangling.  It's
29  *                  global.  There is a call to lp_magicchar() in server.c
30  *                  that is used to override the initial value.
31  *
32  * MANGLE_BASE    - This is the number of characters we use for name mangling.
33  *
34  * basechars      - The set characters used for name mangling.  This
35  *                  is static (scope is this file only).
36  *
37  * mangle()       - Macro used to select a character from basechars (i.e.,
38  *                  mangle(n) will return the nth digit, modulo MANGLE_BASE).
39  *
40  * chartest       - array 0..255.  The index range is the set of all possible
41  *                  values of a byte.  For each byte value, the content is a
42  *                  two nibble pair.  See BASECHAR_MASK below.
43  *
44  * ct_initialized - False until the chartest array has been initialized via
45  *                  a call to init_chartest().
46  *
47  * BASECHAR_MASK  - Masks the upper nibble of a one-byte value.
48  *
49  * isbasecahr()   - Given a character, check the chartest array to see
50  *                  if that character is in the basechars set.  This is
51  *                  faster than using strchr_m().
52  *
53  */
54
55 static char magic_char = '~';
56
57 static const char basechars[] = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ_-!@#$%";
58 #define MANGLE_BASE       (sizeof(basechars)/sizeof(char)-1)
59
60 static unsigned char *chartest;
61
62 #define mangle(V) ((char)(basechars[(V) % MANGLE_BASE]))
63 #define BASECHAR_MASK 0xf0
64 #define isbasechar(C) ( (chartest[ ((C) & 0xff) ]) & BASECHAR_MASK )
65
66 static TDB_CONTEXT *tdb_mangled_cache;
67
68 /* -------------------------------------------------------------------- */
69
70 static NTSTATUS has_valid_83_chars(const smb_ucs2_t *s, bool allow_wildcards)
71 {
72         if (!*s) {
73                 return NT_STATUS_INVALID_PARAMETER;
74         }
75
76         if (!allow_wildcards && ms_has_wild_w(s)) {
77                 return NT_STATUS_UNSUCCESSFUL;
78         }
79
80         while (*s) {
81                 if(!isvalid83_w(*s)) {
82                         return NT_STATUS_UNSUCCESSFUL;
83                 }
84                 s++;
85         }
86
87         return NT_STATUS_OK;
88 }
89
90 static NTSTATUS has_illegal_chars(const smb_ucs2_t *s, bool allow_wildcards)
91 {
92         if (!allow_wildcards && ms_has_wild_w(s)) {
93                 return NT_STATUS_UNSUCCESSFUL;
94         }
95
96         while (*s) {
97                 if (*s <= 0x1f) {
98                         /* Control characters. */
99                         return NT_STATUS_UNSUCCESSFUL;
100                 }
101                 switch(*s) {
102                         case UCS2_CHAR('\\'):
103                         case UCS2_CHAR('/'):
104                         case UCS2_CHAR('|'):
105                         case UCS2_CHAR(':'):
106                                 return NT_STATUS_UNSUCCESSFUL;
107                 }
108                 s++;
109         }
110
111         return NT_STATUS_OK;
112 }
113
114 /* return False if something fail and
115  * return 2 alloced unicode strings that contain prefix and extension
116  */
117
118 static NTSTATUS mangle_get_prefix(const smb_ucs2_t *ucs2_string, smb_ucs2_t **prefix,
119                 smb_ucs2_t **extension, bool allow_wildcards)
120 {
121         size_t ext_len;
122         smb_ucs2_t *p;
123
124         *extension = 0;
125         *prefix = strdup_w(ucs2_string);
126         if (!*prefix) {
127                 return NT_STATUS_NO_MEMORY;
128         }
129         if ((p = strrchr_w(*prefix, UCS2_CHAR('.')))) {
130                 ext_len = strlen_w(p+1);
131                 if ((ext_len > 0) && (ext_len < 4) && (p != *prefix) &&
132                     (NT_STATUS_IS_OK(has_valid_83_chars(p+1,allow_wildcards)))) /* check extension */ {
133                         *p = 0;
134                         *extension = strdup_w(p+1);
135                         if (!*extension) {
136                                 SAFE_FREE(*prefix);
137                                 return NT_STATUS_NO_MEMORY;
138                         }
139                 }
140         }
141         return NT_STATUS_OK;
142 }
143
144 /* ************************************************************************** **
145  * Return NT_STATUS_UNSUCCESSFUL if a name is a special msdos reserved name.
146  * or contains illegal characters.
147  *
148  *  Input:  fname - String containing the name to be tested.
149  *
150  *  Output: NT_STATUS_UNSUCCESSFUL, if the condition above is true.
151  *
152  *  Notes:  This is a static function called by is_8_3(), below.
153  *
154  * ************************************************************************** **
155  */
156
157 static NTSTATUS is_valid_name(const smb_ucs2_t *fname, bool allow_wildcards, bool only_8_3)
158 {
159         smb_ucs2_t *str, *p;
160         size_t num_ucs2_chars;
161         NTSTATUS ret = NT_STATUS_OK;
162
163         if (!fname || !*fname)
164                 return NT_STATUS_INVALID_PARAMETER;
165
166         /* . and .. are valid names. */
167         if (strcmp_wa(fname, ".")==0 || strcmp_wa(fname, "..")==0)
168                 return NT_STATUS_OK;
169
170         if (only_8_3) {
171                 ret = has_valid_83_chars(fname, allow_wildcards);
172                 if (!NT_STATUS_IS_OK(ret))
173                         return ret;
174         }
175
176         ret = has_illegal_chars(fname, allow_wildcards);
177         if (!NT_STATUS_IS_OK(ret))
178                 return ret;
179
180         /* Name can't end in '.' or ' ' */
181         num_ucs2_chars = strlen_w(fname);
182         if (fname[num_ucs2_chars-1] == UCS2_CHAR('.') || fname[num_ucs2_chars-1] == UCS2_CHAR(' ')) {
183                 return NT_STATUS_UNSUCCESSFUL;
184         }
185
186         str = strdup_w(fname);
187
188         /* Truncate copy after the first dot. */
189         p = strchr_w(str, UCS2_CHAR('.'));
190         if (p) {
191                 *p = 0;
192         }
193
194         strupper_w(str);
195         p = &str[1];
196
197         switch(str[0])
198         {
199         case UCS2_CHAR('A'):
200                 if(strcmp_wa(p, "UX") == 0)
201                         ret = NT_STATUS_UNSUCCESSFUL;
202                 break;
203         case UCS2_CHAR('C'):
204                 if((strcmp_wa(p, "LOCK$") == 0)
205                 || (strcmp_wa(p, "ON") == 0)
206                 || (strcmp_wa(p, "OM1") == 0)
207                 || (strcmp_wa(p, "OM2") == 0)
208                 || (strcmp_wa(p, "OM3") == 0)
209                 || (strcmp_wa(p, "OM4") == 0)
210                 )
211                         ret = NT_STATUS_UNSUCCESSFUL;
212                 break;
213         case UCS2_CHAR('L'):
214                 if((strcmp_wa(p, "PT1") == 0)
215                 || (strcmp_wa(p, "PT2") == 0)
216                 || (strcmp_wa(p, "PT3") == 0)
217                 )
218                         ret = NT_STATUS_UNSUCCESSFUL;
219                 break;
220         case UCS2_CHAR('N'):
221                 if(strcmp_wa(p, "UL") == 0)
222                         ret = NT_STATUS_UNSUCCESSFUL;
223                 break;
224         case UCS2_CHAR('P'):
225                 if(strcmp_wa(p, "RN") == 0)
226                         ret = NT_STATUS_UNSUCCESSFUL;
227                 break;
228         default:
229                 break;
230         }
231
232         SAFE_FREE(str);
233         return ret;
234 }
235
236 static NTSTATUS is_8_3_w(const smb_ucs2_t *fname, bool allow_wildcards)
237 {
238         smb_ucs2_t *pref = 0, *ext = 0;
239         size_t plen;
240         NTSTATUS ret = NT_STATUS_UNSUCCESSFUL;
241
242         if (!fname || !*fname)
243                 return NT_STATUS_INVALID_PARAMETER;
244
245         if (strlen_w(fname) > 12)
246                 return NT_STATUS_UNSUCCESSFUL;
247
248         if (strcmp_wa(fname, ".") == 0 || strcmp_wa(fname, "..") == 0)
249                 return NT_STATUS_OK;
250
251         /* Name cannot start with '.' */
252         if (*fname == UCS2_CHAR('.'))
253                 return NT_STATUS_UNSUCCESSFUL;
254
255         if (!NT_STATUS_IS_OK(is_valid_name(fname, allow_wildcards, True)))
256                 goto done;
257
258         if (!NT_STATUS_IS_OK(mangle_get_prefix(fname, &pref, &ext, allow_wildcards)))
259                 goto done;
260         plen = strlen_w(pref);
261
262         if (strchr_wa(pref, '.'))
263                 goto done;
264         if (plen < 1 || plen > 8)
265                 goto done;
266         if (ext && (strlen_w(ext) > 3))
267                 goto done;
268
269         ret = NT_STATUS_OK;
270
271 done:
272         SAFE_FREE(pref);
273         SAFE_FREE(ext);
274         return ret;
275 }
276
277 static bool is_8_3(const char *fname, bool check_case, bool allow_wildcards,
278                    const struct share_params *p)
279 {
280         const char *f;
281         smb_ucs2_t *ucs2name;
282         NTSTATUS ret = NT_STATUS_UNSUCCESSFUL;
283         size_t size;
284
285         magic_char = lp_magicchar(p);
286
287         if (!fname || !*fname)
288                 return False;
289         if ((f = strrchr(fname, '/')) == NULL)
290                 f = fname;
291         else
292                 f++;
293
294         if (strlen(f) > 12)
295                 return False;
296
297         if (!push_ucs2_allocate(&ucs2name, f, &size)) {
298                 DEBUG(0,("is_8_3: internal error push_ucs2_allocate() failed!\n"));
299                 goto done;
300         }
301
302         ret = is_8_3_w(ucs2name, allow_wildcards);
303
304 done:
305         SAFE_FREE(ucs2name);
306
307         if (!NT_STATUS_IS_OK(ret)) {
308                 return False;
309         }
310
311         return True;
312 }
313
314 /* -------------------------------------------------------------------------- **
315  * Functions...
316  */
317
318 /* ************************************************************************** **
319  * Initialize the static character test array.
320  *
321  *  Input:  none
322  *
323  *  Output: none
324  *
325  *  Notes:  This function changes (loads) the contents of the <chartest>
326  *          array.  The scope of <chartest> is this file.
327  *
328  * ************************************************************************** **
329  */
330
331 static void init_chartest( void )
332 {
333         const unsigned char *s;
334
335         chartest = SMB_MALLOC_ARRAY(unsigned char, 256);
336
337         SMB_ASSERT(chartest != NULL);
338         memset(chartest, '\0', 256);
339
340         for( s = (const unsigned char *)basechars; *s; s++ ) {
341                 chartest[*s] |= BASECHAR_MASK;
342         }
343 }
344
345 /* ************************************************************************** **
346  * Return True if the name *could be* a mangled name.
347  *
348  *  Input:  s - A path name - in UNIX pathname format.
349  *
350  *  Output: True if the name matches the pattern described below in the
351  *          notes, else False.
352  *
353  *  Notes:  The input name is *not* tested for 8.3 compliance.  This must be
354  *          done separately.  This function returns true if the name contains
355  *          a magic character followed by excactly two characters from the
356  *          basechars list (above), which in turn are followed either by the
357  *          nul (end of string) byte or a dot (extension) or by a '/' (end of
358  *          a directory name).
359  *
360  * ************************************************************************** **
361  */
362
363 static bool is_mangled(const char *s, const struct share_params *p)
364 {
365         char *magic;
366
367         magic_char = lp_magicchar(p);
368
369         if (chartest == NULL) {
370                 init_chartest();
371         }
372
373         magic = strchr_m( s, magic_char );
374         while( magic && magic[1] && magic[2] ) {         /* 3 chars, 1st is magic. */
375                 if( ('.' == magic[3] || '/' == magic[3] || !(magic[3]))          /* Ends with '.' or nul or '/' ?  */
376                                 && isbasechar( toupper_ascii(magic[1]) )           /* is 2nd char basechar?  */
377                                 && isbasechar( toupper_ascii(magic[2]) ) )         /* is 3rd char basechar?  */
378                         return( True );                           /* If all above, then true, */
379                 magic = strchr_m( magic+1, magic_char );      /*    else seek next magic. */
380         }
381         return( False );
382 }
383
384 /***************************************************************************
385  Initializes or clears the mangled cache.
386 ***************************************************************************/
387
388 static void mangle_reset( void )
389 {
390         /* We could close and re-open the tdb here... should we ? The old code did
391            the equivalent... JRA. */
392 }
393
394 /***************************************************************************
395  Add a mangled name into the cache.
396  If the extension of the raw name maps directly to the
397  extension of the mangled name, then we'll store both names
398  *without* extensions.  That way, we can provide consistent
399  reverse mangling for all names that match.  The test here is
400  a bit more careful than the one done in earlier versions of
401  mangle.c:
402
403     - the extension must exist on the raw name,
404     - it must be all lower case
405     - it must match the mangled extension (to prove that no
406       mangling occurred).
407   crh 07-Apr-1998
408 **************************************************************************/
409
410 static void cache_mangled_name( const char mangled_name[13],
411                                 const char *raw_name )
412 {
413         TDB_DATA data_val;
414         char mangled_name_key[13];
415         char *s1;
416         char *s2;
417
418         /* If the cache isn't initialized, give up. */
419         if( !tdb_mangled_cache )
420                 return;
421
422         /* Init the string lengths. */
423         safe_strcpy(mangled_name_key, mangled_name, sizeof(mangled_name_key)-1);
424
425         /* See if the extensions are unmangled.  If so, store the entry
426          * without the extension, thus creating a "group" reverse map.
427          */
428         s1 = strrchr( mangled_name_key, '.' );
429         if( s1 && (s2 = strrchr( raw_name, '.' )) ) {
430                 size_t i = 1;
431                 while( s1[i] && (tolower_ascii( s1[i] ) == s2[i]) )
432                         i++;
433                 if( !s1[i] && !s2[i] ) {
434                         /* Truncate at the '.' */
435                         *s1 = '\0';
436                         /*
437                          * DANGER WILL ROBINSON - this
438                          * is changing a const string via
439                          * an aliased pointer ! Remember to
440                          * put it back once we've used it.
441                          * JRA
442                          */
443                         *s2 = '\0';
444                 }
445         }
446
447         /* Allocate a new cache entry.  If the allocation fails, just return. */
448         data_val = string_term_tdb_data(raw_name);
449         if (tdb_store_bystring(tdb_mangled_cache, mangled_name_key, data_val, TDB_REPLACE) != 0) {
450                 DEBUG(0,("cache_mangled_name: Error storing entry %s -> %s\n", mangled_name_key, raw_name));
451         } else {
452                 DEBUG(5,("cache_mangled_name: Stored entry %s -> %s\n", mangled_name_key, raw_name));
453         }
454         /* Restore the change we made to the const string. */
455         *s2 = '.';
456 }
457
458 /* ************************************************************************** **
459  * Check for a name on the mangled name stack
460  *
461  *  Input:  s - Input *and* output string buffer.
462  *          maxlen - space in i/o string buffer.
463  *  Output: True if the name was found in the cache, else False.
464  *
465  *  Notes:  If a reverse map is found, the function will overwrite the string
466  *          space indicated by the input pointer <s>.  This is frightening.
467  *          It should be rewritten to return NULL if the long name was not
468  *          found, and a pointer to the long name if it was found.
469  *
470  * ************************************************************************** **
471  */
472
473 static bool lookup_name_from_8_3(TALLOC_CTX *ctx,
474                                 const char *in,
475                                 char **out, /* talloced on the given context. */
476                                 const struct share_params *p)
477 {
478         TDB_DATA data_val;
479         char *saved_ext = NULL;
480         char *s = talloc_strdup(ctx, in);
481
482         magic_char = lp_magicchar(p);
483
484         /* If the cache isn't initialized, give up. */
485         if(!s || !tdb_mangled_cache ) {
486                 TALLOC_FREE(s);
487                 return False;
488         }
489
490         data_val = tdb_fetch_bystring(tdb_mangled_cache, s);
491
492         /* If we didn't find the name *with* the extension, try without. */
493         if(data_val.dptr == NULL || data_val.dsize == 0) {
494                 char *ext_start = strrchr( s, '.' );
495                 if( ext_start ) {
496                         if((saved_ext = talloc_strdup(ctx,ext_start)) == NULL) {
497                                 TALLOC_FREE(s);
498                                 return False;
499                         }
500
501                         *ext_start = '\0';
502                         data_val = tdb_fetch_bystring(tdb_mangled_cache, s);
503                         /*
504                          * At this point s is the name without the
505                          * extension. We re-add the extension if saved_ext
506                          * is not null, before freeing saved_ext.
507                          */
508                 }
509         }
510
511         /* Okay, if we haven't found it we're done. */
512         if(data_val.dptr == NULL || data_val.dsize == 0) {
513                 TALLOC_FREE(saved_ext);
514                 TALLOC_FREE(s);
515                 return False;
516         }
517
518         /* If we *did* find it, we need to talloc it on the given ctx. */
519         if (saved_ext) {
520                 *out = talloc_asprintf(ctx, "%s%s",
521                                         (char *)data_val.dptr,
522                                         saved_ext);
523         } else {
524                 *out = talloc_strdup(ctx, (char *)data_val.dptr);
525         }
526
527         TALLOC_FREE(s);
528         TALLOC_FREE(saved_ext);
529         SAFE_FREE(data_val.dptr);
530
531         return *out ? True : False;
532 }
533
534 /*****************************************************************************
535  Do the actual mangling to 8.3 format.
536 *****************************************************************************/
537
538 static bool to_8_3(const char *in, char out[13], int default_case)
539 {
540         int csum;
541         char *p;
542         char extension[4];
543         char base[9];
544         int baselen = 0;
545         int extlen = 0;
546         char *s = SMB_STRDUP(in);
547
548         extension[0] = 0;
549         base[0] = 0;
550
551         if (!s) {
552                 return False;
553         }
554
555         p = strrchr(s,'.');
556         if( p && (strlen(p+1) < (size_t)4) ) {
557                 bool all_normal = ( strisnormal(p+1, default_case) ); /* XXXXXXXXX */
558
559                 if( all_normal && p[1] != 0 ) {
560                         *p = 0;
561                         csum = str_checksum( s );
562                         *p = '.';
563                 } else
564                         csum = str_checksum(s);
565         } else
566                 csum = str_checksum(s);
567
568         strupper_m( s );
569
570         if( p ) {
571                 if( p == s )
572                         safe_strcpy( extension, "___", 3 );
573                 else {
574                         *p++ = 0;
575                         while( *p && extlen < 3 ) {
576                                 if ( *p != '.') {
577                                         extension[extlen++] = p[0];
578                                 }
579                                 p++;
580                         }
581                         extension[extlen] = 0;
582                 }
583         }
584
585         p = s;
586
587         while( *p && baselen < 5 ) {
588                 if (isbasechar(*p)) {
589                         base[baselen++] = p[0];
590                 }
591                 p++;
592         }
593         base[baselen] = 0;
594
595         csum = csum % (MANGLE_BASE*MANGLE_BASE);
596
597         memcpy(out, base, baselen);
598         out[baselen] = magic_char;
599         out[baselen+1] = mangle( csum/MANGLE_BASE );
600         out[baselen+2] = mangle( csum );
601
602         if( *extension ) {
603                 out[baselen+3] = '.';
604                 safe_strcpy(&out[baselen+4], extension, 3);
605         }
606
607         SAFE_FREE(s);
608         return True;
609 }
610
611 static bool must_mangle(const char *name,
612                         const struct share_params *p)
613 {
614         smb_ucs2_t *name_ucs2 = NULL;
615         NTSTATUS status;
616         size_t converted_size;
617
618         magic_char = lp_magicchar(p);
619
620         if (!push_ucs2_allocate(&name_ucs2, name, &converted_size)) {
621                 DEBUG(0, ("push_ucs2_allocate failed!\n"));
622                 return False;
623         }
624         status = is_valid_name(name_ucs2, False, False);
625         SAFE_FREE(name_ucs2);
626         /* We return true if we *must* mangle, so if it's
627          * a valid name (status == OK) then we must return
628          * false. Bug #6939. */
629         return !NT_STATUS_IS_OK(status);
630 }
631
632 /*****************************************************************************
633  * Convert a filename to DOS format.  Return True if successful.
634  *  Input:  in        Incoming name.
635  *
636  *          out       8.3 DOS name.
637  *
638  *          cache83 - If False, the mangled name cache will not be updated.
639  *                    This is usually used to prevent that we overwrite
640  *                    a conflicting cache entry prematurely, i.e. before
641  *                    we know whether the client is really interested in the
642  *                    current name.  (See PR#13758).  UKD.
643  *
644  * ****************************************************************************
645  */
646
647 static bool hash_name_to_8_3(const char *in,
648                         char out[13],
649                         bool cache83,
650                         int default_case,
651                         const struct share_params *p)
652 {
653         smb_ucs2_t *in_ucs2 = NULL;
654         size_t converted_size;
655
656         magic_char = lp_magicchar(p);
657
658         DEBUG(5,("hash_name_to_8_3( %s, cache83 = %s)\n", in,
659                  cache83 ? "True" : "False"));
660
661         if (!push_ucs2_allocate(&in_ucs2, in, &converted_size)) {
662                 DEBUG(0, ("push_ucs2_allocate failed!\n"));
663                 return False;
664         }
665
666         /* If it's already 8.3, just copy. */
667         if (NT_STATUS_IS_OK(is_valid_name(in_ucs2, False, False)) &&
668                                 NT_STATUS_IS_OK(is_8_3_w(in_ucs2, False))) {
669                 SAFE_FREE(in_ucs2);
670                 safe_strcpy(out, in, 12);
671                 return True;
672         }
673
674         SAFE_FREE(in_ucs2);
675         if (!to_8_3(in, out, default_case)) {
676                 return False;
677         }
678
679         cache_mangled_name(out, in);
680
681         DEBUG(5,("hash_name_to_8_3(%s) ==> [%s]\n", in, out));
682         return True;
683 }
684
685 /*
686   the following provides the abstraction layer to make it easier
687   to drop in an alternative mangling implementation
688 */
689 static struct mangle_fns mangle_fns = {
690         mangle_reset,
691         is_mangled,
692         must_mangle,
693         is_8_3,
694         lookup_name_from_8_3,
695         hash_name_to_8_3
696 };
697
698 /* return the methods for this mangling implementation */
699 struct mangle_fns *mangle_hash_init(void)
700 {
701         mangle_reset();
702
703         /* Create the in-memory tdb using our custom hash function. */
704         tdb_mangled_cache = tdb_open_ex("mangled_cache", 1031, TDB_INTERNAL,
705                                 (O_RDWR|O_CREAT), 0644, NULL, fast_string_hash);
706
707         return &mangle_fns;
708 }