Witness: enum witness_interface_state
[metze/wireshark/wip.git] / epan / dvb_chartbl.c
1 /* dvb_chartbl.c
2  * Routines for handling DVB-SI character tables (as defined in EN 300 468)
3  *
4  * $Id$
5  *
6  * Wireshark - Network traffic analyzer
7  * By Gerald Combs <gerald@wireshark.org>
8  * Copyright 1998 Gerald Combs
9  *
10  * This program is free software; you can redistribute it and/or
11  * modify it under the terms of the GNU General Public License
12  * as published by the Free Software Foundation; either version 2
13  * of the License, or (at your option) any later version.
14  *
15  * This program is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18  * GNU General Public License for more details.
19  *
20  * You should have received a copy of the GNU General Public License
21  * along with this program; if not, write to the Free Software
22  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
23  */
24
25 #include "config.h"
26
27 #include <glib.h>
28
29 #include <epan/proto.h>
30 #include <epan/tvbuff.h>
31 #include <epan/value_string.h>
32
33 #include "dvb_chartbl.h"
34
35
36 static const value_string dvb_string_encoding_vals[] = {
37    { DVB_ENCODING_INVALID,  "Incorrect length for encoding" },
38    { DVB_ENCODING_RESERVED, "Reserved for future use" },
39    { DVB_ENCODING_UNKNOWN,  "Unknown/undefined encoding" },
40
41    { DVB_ENCODING_LATIN,    "Latin (default table)" },
42
43    { DVB_ENCODING_ISO_8859_1,         "ISO/IEC 8859-1 (West European)" },
44    { DVB_ENCODING_ISO_8859_2,         "ISO/IEC 8859-2 (East European)" },
45    { DVB_ENCODING_ISO_8859_3,         "ISO/IEC 8859-3 (South European)" },
46    { DVB_ENCODING_ISO_8859_4,         "ISO/IEC 8859-4 (North and North-East European)" },
47    { DVB_ENCODING_ISO_8859_5,         "ISO/IEC 8859-5 (Latin/Cyrillic)" },
48    { DVB_ENCODING_ISO_8859_6,         "ISO/IEC 8859-6 (Latin/Arabic)" },
49    { DVB_ENCODING_ISO_8859_7,         "ISO/IEC 8859-7 (Latin/Greek)" },
50    { DVB_ENCODING_ISO_8859_8,         "ISO/IEC 8859-8 (Latin/Hebrew)" },
51    { DVB_ENCODING_ISO_8859_9,         "ISO/IEC 8859-9 (West European & Turkish)" },
52    { DVB_ENCODING_ISO_8859_10,        "ISO/IEC 8859-10 (North European)" },
53    { DVB_ENCODING_ISO_8859_11,        "ISO/IEC 8859-11 (Thai)" },
54    { DVB_ENCODING_ISO_8859_13,        "ISO/IEC 8859-13 (Baltic)" },
55    { DVB_ENCODING_ISO_8859_14,        "ISO/IEC 8859-14 (Celtic)" },
56    { DVB_ENCODING_ISO_8859_15,        "ISO/IEC 8859-15 (West European)" },
57    { DVB_ENCODING_ISO_10646_BMP,      "ISO/IEC 10646 Basic Multilingual Plane" },
58    { DVB_ENCODING_KSX_1001,           "KSX 1001-2004 (Korean character set)" },
59    { DVB_ENCODING_GB_2312,            "GB-2312-1980 (Simplified Chinese)" },
60    { DVB_ENCODING_ISO_10646_BIG5,     "ISO/IEC 10646 BIG5 subset" },
61    { DVB_ENCODING_ISO_10646_UTF8_BMP,
62        "ISO/IEC 10646 Basic Multilingual Plane, UTF-8 encoded" },
63
64    { 0, NULL }
65 };
66
67
68 static dvb_encoding_e
69 dvb_analyze_string_charset0(guint8 byte0)
70 {
71     switch (byte0) {
72         case 0x01:
73             return DVB_ENCODING_ISO_8859_5;
74         case 0x02:
75             return DVB_ENCODING_ISO_8859_6;
76         case 0x03:
77             return DVB_ENCODING_ISO_8859_7;
78         case 0x04:
79             return DVB_ENCODING_ISO_8859_8;
80         case 0x05:
81             return DVB_ENCODING_ISO_8859_9;
82         case 0x06:
83             return DVB_ENCODING_ISO_8859_10;
84         case 0x07:
85             return DVB_ENCODING_ISO_8859_11;
86         case 0x08:
87             return DVB_ENCODING_RESERVED; /* was reserved for ISO-8859-12 */
88         case 0x09:
89             return DVB_ENCODING_ISO_8859_13;
90         case 0x0A:
91             return DVB_ENCODING_ISO_8859_14;
92         case 0x0B:
93             return DVB_ENCODING_ISO_8859_15;
94         case 0x11:
95             return DVB_ENCODING_ISO_10646_BMP;
96         case 0x12:
97             return DVB_ENCODING_KSX_1001;
98         case 0x13:
99             return DVB_ENCODING_GB_2312;
100         case 0x14:
101             return DVB_ENCODING_ISO_10646_BIG5;
102         case 0x15:
103             return DVB_ENCODING_ISO_10646_UTF8_BMP;
104
105         default:
106             return DVB_ENCODING_UNKNOWN;
107     }
108 }
109
110
111 static dvb_encoding_e
112 dvb_analyze_string_charset0_10(guint16 byte12)
113 {
114     switch (byte12) {
115         case 0x0000:
116              return DVB_ENCODING_RESERVED;
117         case 0x0001:
118          return DVB_ENCODING_ISO_8859_1;
119         case 0x0002:
120          return DVB_ENCODING_ISO_8859_2;
121         case 0x0003:
122          return DVB_ENCODING_ISO_8859_3;
123         case 0x0004:
124          return DVB_ENCODING_ISO_8859_4;
125         case 0x0005:
126          return DVB_ENCODING_ISO_8859_5;
127         case 0x0006:
128          return DVB_ENCODING_ISO_8859_6;
129         case 0x0007:
130          return DVB_ENCODING_ISO_8859_7;
131         case 0x0008:
132          return DVB_ENCODING_ISO_8859_8;
133         case 0x0009:
134          return DVB_ENCODING_ISO_8859_9;
135         case 0x000A:
136          return DVB_ENCODING_ISO_8859_10;
137         case 0x000B:
138          return DVB_ENCODING_ISO_8859_11;
139         case 0x000C:
140          return DVB_ENCODING_RESERVED;
141         case 0x000D:
142          return DVB_ENCODING_ISO_8859_13;
143         case 0x000E:
144          return DVB_ENCODING_ISO_8859_14;
145         case 0x000F:
146          return DVB_ENCODING_ISO_8859_15;
147
148         default: /* 0x10 XX XX */
149             return DVB_ENCODING_UNKNOWN;
150     }
151 }
152
153
154 static dvb_encoding_e
155 dvb_analyze_string_charset0_1F(guint8 byte1)
156 {
157    /* http://www.dvbservices.com/identifiers/encoding_type_id */
158
159     switch (byte1) {
160        case 0x00: /* 0x1F 0x00 */
161           return DVB_ENCODING_RESERVED;
162        case 0x01:
163        case 0x02:
164        case 0x03:
165        case 0x04:
166           /* XXX: BBC */
167           return DVB_ENCODING_RESERVED;
168        case 0x05:
169        case 0x06:
170           /* XXX: Malaysian Technical Standards Forum Bhd */
171           return DVB_ENCODING_RESERVED;
172
173        default: /* 0x1F XX */
174           return DVB_ENCODING_RESERVED;
175     }
176 }
177
178
179 guint
180 dvb_analyze_string_charset(tvbuff_t *tvb, int offset, int length, dvb_encoding_e *encoding)
181 {
182    if (length >= 1) {
183       guint8 byte0 = tvb_get_guint8(tvb, offset + 0);
184
185       if (byte0 >= 0x20) {
186          /* the first byte is a normal character, not the number of a character table */
187          *encoding = DVB_ENCODING_LATIN;
188          return 0;
189
190       } else if (byte0 == 0x1F) {
191          if (length >= 2) {
192             *encoding = dvb_analyze_string_charset0_1F(tvb_get_guint8(tvb, offset + 1));
193             return 2;
194          }
195          *encoding = DVB_ENCODING_INVALID;
196          return 1;
197
198       } else if (byte0 >= 0x16) { /* 16 ... 1E */
199          *encoding = DVB_ENCODING_RESERVED;
200          return 1;
201
202       } else if (byte0 == 0x10) {
203          if (length >= 3) {
204             *encoding = dvb_analyze_string_charset0_10(tvb_get_ntohs(tvb, offset + 1));
205             return 3;
206          }
207          *encoding = DVB_ENCODING_INVALID;
208          return 1;
209
210       } else if ((byte0 >= 0x0C && byte0 <= 0x0F)) {
211          *encoding = DVB_ENCODING_RESERVED;
212          return 1;
213       } else {
214          *encoding = dvb_analyze_string_charset0(byte0);
215          return 1;
216       }
217    } else
218       *encoding = DVB_ENCODING_LATIN;
219
220    return 0;
221 }
222
223
224 guint
225 dvb_enc_to_item_enc(dvb_encoding_e encoding)
226 {
227    /* XXX: take ISO control codes into account,
228       e.g. 0x86 - turn emphasis on ; 0x87 - turn emphasis off */
229
230    switch (encoding) {
231       case DVB_ENCODING_ISO_8859_1:
232          return ENC_ISO_8859_1 | ENC_NA;
233
234       case DVB_ENCODING_ISO_8859_2:
235          return ENC_ISO_8859_2 | ENC_NA;
236
237       case DVB_ENCODING_ISO_8859_3:
238          return ENC_ISO_8859_3 | ENC_NA;
239
240       case DVB_ENCODING_ISO_8859_4:
241          return ENC_ISO_8859_4 | ENC_NA;
242
243       case DVB_ENCODING_ISO_8859_5:
244          return ENC_ISO_8859_5 | ENC_NA;
245
246       case DVB_ENCODING_ISO_8859_6:
247          return ENC_ISO_8859_6 | ENC_NA;
248
249       case DVB_ENCODING_ISO_8859_7:
250          return ENC_ISO_8859_7 | ENC_NA;
251
252       case DVB_ENCODING_ISO_8859_8:
253          return ENC_ISO_8859_8 | ENC_NA;
254
255       case DVB_ENCODING_ISO_8859_9:
256          return ENC_ISO_8859_9 | ENC_NA;
257
258       case DVB_ENCODING_ISO_8859_10:
259          return ENC_ISO_8859_10 | ENC_NA;
260
261       case DVB_ENCODING_ISO_8859_11:
262          return ENC_ISO_8859_11 | ENC_NA;
263
264       case DVB_ENCODING_ISO_8859_13:
265          return ENC_ISO_8859_13 | ENC_NA;
266
267       case DVB_ENCODING_ISO_8859_14:
268          return ENC_ISO_8859_14 | ENC_NA;
269
270       case DVB_ENCODING_ISO_8859_15:
271          return ENC_ISO_8859_15 | ENC_NA;
272
273       case DVB_ENCODING_ISO_10646_UTF8_BMP:
274          return ENC_UTF_8 | ENC_NA;
275
276       default: /* not supported */
277          return ENC_ASCII | ENC_NA;
278    }
279 }
280
281
282 void
283 dvb_add_chartbl(proto_tree *tree, int hf,
284         tvbuff_t *tvb, gint offset, gint length, dvb_encoding_e encoding)
285 {
286     if (length==0) {
287         proto_item *pi;
288
289         pi = proto_tree_add_text(tree, NULL, 0, 0,
290                 "Default character table (Latin)");
291         PROTO_ITEM_SET_GENERATED(pi);
292     }
293     else {
294         proto_tree_add_bytes_format_value(tree, hf,
295             tvb, offset, length, NULL, "%s (%s)",
296             val_to_str_const(encoding, dvb_string_encoding_vals, "Unknown"),
297             bytes_to_ep_str_punct(
298                 tvb_get_ptr(tvb, offset, length), length, ' '));
299     }
300 }
301
302 /*
303  * Editor modelines  -  http://www.wireshark.org/tools/modelines.html
304  *
305  * Local variables:
306  * c-basic-offset: 4
307  * tab-width: 8
308  * indent-tabs-mode: nil
309  * End:
310  *
311  * vi: set shiftwidth=4 tabstop=8 expandtab:
312  * :indentSize=4:tabSize=8:noTabs=true:
313  */