ASCII — это 8-битное значение. Юникод может быть 8-, 16- или 32-битным. Если я определяю подкласс как символ, как WTX узнает, является ли это 8-битным или 16-битным символом?

0
sun 6 Мар 2011 в 02:41

1 ответ

Установка подкласса элемента на character — это только половина решения. Вы также должны установить язык (по умолчанию «западный») и, что более важно, набор символов. Если вы выберете UTF-8 (-16, -32), синтаксический анализатор способен распознавать многобайтовые символы и будет правильно их читать (конечно, при условии, что анализируемый документ закодирован в кодировке дерева типов).

1
Michael Wein 13 Июл 2011 в 23:05