* mkdtemp.c: New (moved from g10/), setenv.c: New, unsetenv.c: New.
[gnupg.git] / util / simple-gettext.c
1 /* simple-gettext.c  - a simplified version of gettext.
2  * Copyright (C) 1995, 1996, 1997, 1999 Free Software Foundation, Inc.
3  *
4  * This file is part of GnuPG.
5  *
6  * GnuPG is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License as published by
8  * the Free Software Foundation; either version 2 of the License, or
9  * (at your option) any later version.
10  *
11  * GnuPG is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14  * GNU General Public License for more details.
15  *
16  * You should have received a copy of the GNU General Public License
17  * along with this program; if not, write to the Free Software
18  * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA
19  */
20
21 /* This is a simplified version of gettext written by Ulrich Drepper.
22  * It is used for the Win32 version of GnuPG beucase all the overhead
23  * of gettext is not needed and we have to do some special Win32 stuff.
24  * I decided that this is far easier than to tweak gettext for the special
25  * cases (I tried it but it is a lot of code).  wk 15.09.99
26  */
27
28 #include <config.h>
29 #ifdef USE_SIMPLE_GETTEXT
30 #if !defined (_WIN32) && !defined (__CYGWIN32__)
31 #error This file can only be used udner Windows or Cygwin32
32 #endif
33
34 #include <stdio.h>
35 #include <stdlib.h>
36 #include <string.h>
37 #include <ctype.h>
38 #include <errno.h>
39 #include <sys/types.h>
40 #include <sys/stat.h>
41 #include <windows.h>
42 #include "types.h"
43 #include "util.h"
44
45
46 /* The magic number of the GNU message catalog format.  */
47 #define MAGIC         0x950412de
48 #define MAGIC_SWAPPED 0xde120495
49
50 /* Revision number of the currently used .mo (binary) file format.  */
51 #define MO_REVISION_NUMBER 0
52
53
54 /* Header for binary .mo file format.  */
55 struct mo_file_header
56 {
57   /* The magic number.  */
58   u32 magic;
59   /* The revision number of the file format.  */
60   u32 revision;
61   /* The number of strings pairs.  */
62   u32 nstrings;
63   /* Offset of table with start offsets of original strings.  */
64   u32 orig_tab_offset;
65   /* Offset of table with start offsets of translation strings.  */
66   u32 trans_tab_offset;
67   /* Size of hashing table.  */
68   u32 hash_tab_size;
69   /* Offset of first hashing entry.  */
70   u32 hash_tab_offset;
71 };
72
73 struct string_desc
74 {
75   /* Length of addressed string.  */
76   u32 length;
77   /* Offset of string in file.  */
78   u32 offset;
79 };
80
81
82
83 struct loaded_domain
84 {
85   char *data;
86   int must_swap;
87   u32 nstrings;
88 /*    char *mapped; */
89   struct string_desc *orig_tab;
90   struct string_desc *trans_tab;
91   u32 hash_size;
92   u32 *hash_tab;
93 };
94
95
96 static struct loaded_domain *the_domain;
97
98 static __inline__ u32
99 do_swap_u32( u32 i )
100 {
101   return (i << 24) | ((i & 0xff00) << 8) | ((i >> 8) & 0xff00) | (i >> 24);
102 }
103
104 #define SWAPIT(flag, data) ((flag) ? do_swap_u32(data) : (data) )
105
106
107 /* We assume to have `unsigned long int' value with at least 32 bits.  */
108 #define HASHWORDBITS 32
109
110 /* The so called `hashpjw' function by P.J. Weinberger
111    [see Aho/Sethi/Ullman, COMPILERS: Principles, Techniques and Tools,
112    1986, 1987 Bell Telephone Laboratories, Inc.]  */
113
114 static __inline__ ulong
115 hash_string( const char *str_param )
116 {
117     unsigned long int hval, g;
118     const char *str = str_param;
119
120     hval = 0;
121     while (*str != '\0')
122     {
123         hval <<= 4;
124         hval += (unsigned long int) *str++;
125         g = hval & ((unsigned long int) 0xf << (HASHWORDBITS - 4));
126         if (g != 0)
127         {
128           hval ^= g >> (HASHWORDBITS - 8);
129           hval ^= g;
130         }
131     }
132     return hval;
133 }
134
135
136 static struct loaded_domain *
137 load_domain( const char *filename )
138 {
139     FILE *fp;
140     size_t size;
141     struct stat st;
142     struct mo_file_header *data = NULL;
143     struct loaded_domain *domain = NULL;
144     size_t to_read;
145     char *read_ptr;
146
147     fp = fopen( filename, "rb" );
148     if( !fp )
149        return NULL; /* can't open the file */
150     /* we must know about the size of the file */
151     if( fstat( fileno(fp ), &st )
152         || (size = (size_t)st.st_size) != st.st_size
153         || size < sizeof (struct mo_file_header) ) {
154         fclose( fp );
155         return NULL;
156     }
157
158     data = malloc( size );
159     if( !data ) {
160         fclose( fp );
161         return NULL; /* out of memory */
162     }
163
164     to_read = size;
165     read_ptr = (char *) data;
166     do {
167         long int nb = fread( read_ptr, 1, to_read, fp );
168         if( nb < to_read ) {
169             fclose (fp);
170             free(data);
171             return NULL; /* read error */
172         }
173         read_ptr += nb;
174         to_read -= nb;
175     } while( to_read > 0 );
176     fclose (fp);
177
178     /* Using the magic number we can test whether it really is a message
179      * catalog file.  */
180     if( data->magic != MAGIC && data->magic != MAGIC_SWAPPED ) {
181         /* The magic number is wrong: not a message catalog file.  */
182         free( data );
183         return NULL;
184     }
185
186     domain = calloc( 1, sizeof *domain );
187     if( !domain )  {
188         free( data );
189         return NULL;
190     }
191     domain->data = (char *) data;
192     domain->must_swap = data->magic != MAGIC;
193
194     /* Fill in the information about the available tables.  */
195     switch( SWAPIT(domain->must_swap, data->revision) ) {
196       case 0:
197         domain->nstrings = SWAPIT(domain->must_swap, data->nstrings);
198         domain->orig_tab = (struct string_desc *)
199           ((char *) data + SWAPIT(domain->must_swap, data->orig_tab_offset));
200         domain->trans_tab = (struct string_desc *)
201           ((char *) data + SWAPIT(domain->must_swap, data->trans_tab_offset));
202         domain->hash_size = SWAPIT(domain->must_swap, data->hash_tab_size);
203         domain->hash_tab = (u32 *)
204           ((char *) data + SWAPIT(domain->must_swap, data->hash_tab_offset));
205       break;
206
207       default: /* This is an invalid revision.  */
208         free( data );
209         free( domain );
210         return NULL;
211     }
212
213     /* allocate an array to keep track of code page mappings */
214 /*      domain->mapped = calloc( 1, domain->nstrings ); */
215 /*      if( !domain->mapped ) { */
216 /*      free( data ); */
217 /*      free( domain ); */
218 /*      return NULL; */
219 /*      } */
220
221     return domain;
222 }
223
224
225 /****************
226  * Set the file used for translations.  Pass a NULL to disable
227  * translation.  A new filename may be set at anytime.
228  * WARNING: After changing the filename you shoudl not access any data
229  *          retrieved by gettext().
230  */
231 int
232 set_gettext_file( const char *filename )
233 {
234     struct loaded_domain *domain = NULL;
235
236     if( filename && *filename ) {
237         if( filename[0] == '/'
238 #ifdef HAVE_DRIVE_LETTERS
239             || ( isalpha(filename[0])
240                  && filename[1] == ':'
241                  && (filename[2] == '/' || filename[2] == '\\') )
242 #endif
243            ) {
244             /* absolute path - use it as is */
245             domain = load_domain( filename );
246         }
247         else { /* relative path - append ".mo" and get dir from the environment */
248             char *buf = NULL;
249             char *dir;
250             char *p;
251
252             dir = read_w32_registry_string( NULL,
253                                             "Control Panel\\Mingw32\\NLS",
254                                             "MODir" );
255             if( dir && (buf=malloc(strlen(dir)+strlen(filename)+1+3+1)) ) {
256                 strcpy(stpcpy(stpcpy(stpcpy( buf, dir),"\\"), filename),".mo");
257                 /* Better make sure that we don't mix forward and
258                    backward slashes.  It seems that some Windoze
259                    versions don't accept this. */
260                 for (p=buf; *p; p++)
261                   {
262                     if (*p == '/')
263                       *p = '\\';
264                   }
265                 domain = load_domain( buf );
266                 free(buf);
267             }
268             free(dir);
269         }
270         if( !domain )
271             return -1;
272     }
273
274     if( the_domain ) {
275         free( the_domain->data );
276 /*      free( the_domain->mapped ); */
277         free( the_domain );
278         the_domain = NULL;
279     }
280     the_domain = domain;
281     return NULL;
282 }
283
284
285 static const char*
286 get_string( struct loaded_domain *domain, u32 idx )
287 {
288     char *p = domain->data + SWAPIT(domain->must_swap,
289                                     domain->trans_tab[idx].offset);
290 #if 0 /* Mapping is not used any more.  Instead we convert the files when
291          Creating the binary distribution. */
292     if( !domain->mapped[idx] ) {
293         byte *pp;
294
295         domain->mapped[idx] = 1;
296         /* we assume Latin1 -> CP 850 for now */
297         for( pp=p; *pp; pp++ ) {
298             if( (*pp & 0x80) ) {
299                 switch( *pp ) {
300                   /* ISO-8859-1 to IBM-CP-850 */
301                   case 0xa0: *pp = '\xff' ; break;  /* nobreakspace */
302                   case 0xa1: *pp = '\xad' ; break;  /* exclamdown */
303                   case 0xa2: *pp = '\xbd' ; break;  /* cent */
304                   case 0xa3: *pp = '\x9c' ; break;  /* sterling */
305                   case 0xa4: *pp = '\xcf' ; break;  /* currency */
306                   case 0xa5: *pp = '\xbe' ; break;  /* yen */
307                   case 0xa6: *pp = '\xdd' ; break;  /* brokenbar */
308                   case 0xa7: *pp = '\xf5' ; break;  /* section */
309                   case 0xa8: *pp = '\xf9' ; break;  /* diaeresis */
310                   case 0xa9: *pp = '\xb8' ; break;  /* copyright */
311                   case 0xaa: *pp = '\xa6' ; break;  /* ordfeminine */
312                   case 0xab: *pp = '\xae' ; break;  /* guillemotleft */
313                   case 0xac: *pp = '\xaa' ; break;  /* notsign */
314                   case 0xad: *pp = '\xf0' ; break;  /* hyphen */
315                   case 0xae: *pp = '\xa9' ; break;  /* registered */
316                   case 0xaf: *pp = '\xee' ; break;  /* macron */
317                   case 0xb0: *pp = '\xf8' ; break;  /* degree */
318                   case 0xb1: *pp = '\xf1' ; break;  /* plusminus */
319                   case 0xb2: *pp = '\xfd' ; break;  /* twosuperior */
320                   case 0xb3: *pp = '\xfc' ; break;  /* threesuperior */
321                   case 0xb4: *pp = '\xef' ; break;  /* acute */
322                   case 0xb5: *pp = '\xe6' ; break;  /* mu */
323                   case 0xb6: *pp = '\xf4' ; break;  /* paragraph */
324                   case 0xb7: *pp = '\xfa' ; break;  /* periodcentered */
325                   case 0xb8: *pp = '\xf7' ; break;  /* cedilla */
326                   case 0xb9: *pp = '\xfb' ; break;  /* onesuperior */
327                   case 0xba: *pp = '\xa7' ; break;  /* masculine */
328                   case 0xbb: *pp = '\xaf' ; break;  /* guillemotright */
329                   case 0xbc: *pp = '\xac' ; break;  /* onequarter */
330                   case 0xbd: *pp = '\xab' ; break;  /* onehalf */
331                   case 0xbe: *pp = '\xf3' ; break;  /* threequarters */
332                   case 0xbf: *pp = '\xa8' ; break;  /* questiondown */
333                   case 0xc0: *pp = '\xb7' ; break;  /* Agrave */
334                   case 0xc1: *pp = '\xb5' ; break;  /* Aacute */
335                   case 0xc2: *pp = '\xb6' ; break;  /* Acircumflex */
336                   case 0xc3: *pp = '\xc7' ; break;  /* Atilde */
337                   case 0xc4: *pp = '\x8e' ; break;  /* Adiaeresis */
338                   case 0xc5: *pp = '\x8f' ; break;  /* Aring */
339                   case 0xc6: *pp = '\x92' ; break;  /* AE */
340                   case 0xc7: *pp = '\x80' ; break;  /* Ccedilla */
341                   case 0xc8: *pp = '\xd4' ; break;  /* Egrave */
342                   case 0xc9: *pp = '\x90' ; break;  /* Eacute */
343                   case 0xca: *pp = '\xd2' ; break;  /* Ecircumflex */
344                   case 0xcb: *pp = '\xd3' ; break;  /* Ediaeresis */
345                   case 0xcc: *pp = '\xde' ; break;  /* Igrave */
346                   case 0xcd: *pp = '\xd6' ; break;  /* Iacute */
347                   case 0xce: *pp = '\xd7' ; break;  /* Icircumflex */
348                   case 0xcf: *pp = '\xd8' ; break;  /* Idiaeresis */
349                   case 0xd0: *pp = '\xd1' ; break;  /* Eth */
350                   case 0xd1: *pp = '\xa5' ; break;  /* Ntilde */
351                   case 0xd2: *pp = '\xe3' ; break;  /* Ograve */
352                   case 0xd3: *pp = '\xe0' ; break;  /* Oacute */
353                   case 0xd4: *pp = '\xe2' ; break;  /* Ocircumflex */
354                   case 0xd5: *pp = '\xe5' ; break;  /* Otilde */
355                   case 0xd6: *pp = '\x99' ; break;  /* Odiaeresis */
356                   case 0xd7: *pp = '\x9e' ; break;  /* multiply */
357                   case 0xd8: *pp = '\x9d' ; break;  /* Ooblique */
358                   case 0xd9: *pp = '\xeb' ; break;  /* Ugrave */
359                   case 0xda: *pp = '\xe9' ; break;  /* Uacute */
360                   case 0xdb: *pp = '\xea' ; break;  /* Ucircumflex */
361                   case 0xdc: *pp = '\x9a' ; break;  /* Udiaeresis */
362                   case 0xdd: *pp = '\xed' ; break;  /* Yacute */
363                   case 0xde: *pp = '\xe8' ; break;  /* Thorn */
364                   case 0xdf: *pp = '\xe1' ; break;  /* ssharp */
365                   case 0xe0: *pp = '\x85' ; break;  /* agrave */
366                   case 0xe1: *pp = '\xa0' ; break;  /* aacute */
367                   case 0xe2: *pp = '\x83' ; break;  /* acircumflex */
368                   case 0xe3: *pp = '\xc6' ; break;  /* atilde */
369                   case 0xe4: *pp = '\x84' ; break;  /* adiaeresis */
370                   case 0xe5: *pp = '\x86' ; break;  /* aring */
371                   case 0xe6: *pp = '\x91' ; break;  /* ae */
372                   case 0xe7: *pp = '\x87' ; break;  /* ccedilla */
373                   case 0xe8: *pp = '\x8a' ; break;  /* egrave */
374                   case 0xe9: *pp = '\x82' ; break;  /* eacute */
375                   case 0xea: *pp = '\x88' ; break;  /* ecircumflex */
376                   case 0xeb: *pp = '\x89' ; break;  /* ediaeresis */
377                   case 0xec: *pp = '\x8d' ; break;  /* igrave */
378                   case 0xed: *pp = '\xa1' ; break;  /* iacute */
379                   case 0xee: *pp = '\x8c' ; break;  /* icircumflex */
380                   case 0xef: *pp = '\x8b' ; break;  /* idiaeresis */
381                   case 0xf0: *pp = '\xd0' ; break;  /* eth */
382                   case 0xf1: *pp = '\xa4' ; break;  /* ntilde */
383                   case 0xf2: *pp = '\x95' ; break;  /* ograve */
384                   case 0xf3: *pp = '\xa2' ; break;  /* oacute */
385                   case 0xf4: *pp = '\x93' ; break;  /* ocircumflex */
386                   case 0xf5: *pp = '\xe4' ; break;  /* otilde */
387                   case 0xf6: *pp = '\x94' ; break;  /* odiaeresis */
388                   case 0xf7: *pp = '\xf6' ; break;  /* division */
389                   case 0xf8: *pp = '\x9b' ; break;  /* oslash */
390                   case 0xf9: *pp = '\x97' ; break;  /* ugrave */
391                   case 0xfa: *pp = '\xa3' ; break;  /* uacute */
392                   case 0xfb: *pp = '\x96' ; break;  /* ucircumflex */
393                   case 0xfc: *pp = '\x81' ; break;  /* udiaeresis */
394                   case 0xfd: *pp = '\xec' ; break;  /* yacute */
395                   case 0xfe: *pp = '\xe7' ; break;  /* thorn */
396                   case 0xff: *pp = '\x98' ; break;  /* ydiaeresis */
397                   default  :  break;
398                 }
399             }
400         }
401
402     }
403 #endif /* unused code */
404     return (const char*)p;
405 }
406
407
408
409 const char *
410 gettext( const char *msgid )
411 {
412     struct loaded_domain *domain;
413     size_t act = 0;
414     size_t top, bottom;
415
416     if( !(domain = the_domain) )
417         goto not_found;
418
419     /* Locate the MSGID and its translation.  */
420     if( domain->hash_size > 2 && domain->hash_tab ) {
421         /* Use the hashing table.  */
422         u32 len = strlen (msgid);
423         u32 hash_val = hash_string (msgid);
424         u32 idx = hash_val % domain->hash_size;
425         u32 incr = 1 + (hash_val % (domain->hash_size - 2));
426         u32 nstr = SWAPIT (domain->must_swap, domain->hash_tab[idx]);
427
428         if ( !nstr ) /* Hash table entry is empty.  */
429             goto not_found;
430
431         if( SWAPIT(domain->must_swap,
432                     domain->orig_tab[nstr - 1].length) == len
433             && !strcmp( msgid,
434                        domain->data + SWAPIT(domain->must_swap,
435                                     domain->orig_tab[nstr - 1].offset)) )
436             return get_string( domain, nstr - 1 );
437
438         for(;;) {
439             if (idx >= domain->hash_size - incr)
440                 idx -= domain->hash_size - incr;
441             else
442                 idx += incr;
443
444             nstr = SWAPIT(domain->must_swap, domain->hash_tab[idx]);
445             if( !nstr )
446                 goto not_found; /* Hash table entry is empty.  */
447
448             if ( SWAPIT(domain->must_swap,
449                                 domain->orig_tab[nstr - 1].length) == len
450                  && !strcmp (msgid,
451                          domain->data + SWAPIT(domain->must_swap,
452                                            domain->orig_tab[nstr - 1].offset)))
453                 return get_string( domain, nstr-1 );
454         }
455         /* NOTREACHED */
456     }
457
458     /* Now we try the default method:  binary search in the sorted
459        array of messages.  */
460     bottom = 0;
461     top = domain->nstrings;
462     while( bottom < top ) {
463         int cmp_val;
464
465         act = (bottom + top) / 2;
466         cmp_val = strcmp(msgid, domain->data
467                                + SWAPIT(domain->must_swap,
468                                         domain->orig_tab[act].offset));
469         if (cmp_val < 0)
470             top = act;
471         else if (cmp_val > 0)
472             bottom = act + 1;
473         else
474             return get_string( domain, act );
475     }
476
477   not_found:
478     return msgid;
479 }
480
481 #if 0
482        unsigned int cp1, cp2;
483
484        cp1 = GetConsoleCP();
485        cp2 = GetConsoleOutputCP();
486
487        log_info("InputCP=%u  OutputCP=%u\n", cp1, cp2 );
488
489        if( !SetConsoleOutputCP( 1252 ) )
490            log_info("SetConsoleOutputCP failed: %d\n", (int)GetLastError() );
491
492        cp1 = GetConsoleCP();
493        cp2 = GetConsoleOutputCP();
494        log_info("InputCP=%u  OutputCP=%u after switch1\n", cp1, cp2 );
495 #endif
496
497 #endif /* USE_SIMPLE_GETTEXT */