Някои XML документи могат да съдържат чужди букви като Норвежките æ ø å, и Френските ê è é.За да може parsera да покаже тези букви, трябва да запазите файла некодиран(Unicode).Notepadа на Windows 2000 може да запазва файлове некодирани.Погледнете долния пример:
CODE1
2
3
4
5
6
| <?xml version="1.0"?>
<note>
<from>Иван</from>
<to>Драган</to>
<message>Норвежки: æøå.Френски: êèé</message>
</note> |
Той е запазен като некодиран, защото няма атрибут за енкодинга.Това означава, че ще покаже Френските и Норвежките букви.Така написан файла ще покаже грешка на Netscape 6.2.Погледнете долните примери:
CODE1
2
3
4
| <?xml version="1.0" encoding="windows-1252"?>
<?xml version="1.0" encoding="ISO-8859-1"?>
<?xml version="1.0" encoding="UTF-8"?>
<?xml version="1.0" encoding="UTF-16"?> |
При първи, втория и третия енкодинг Netscape 6.2 няма да направи грешка.Но при четвъртия ще направи.Има два типа грешки, които са свързани с енкодинга.Първата ще се покаже когато имате букви, които не съответсват на енкодинга.А втората е когато сте запзили документа некодиран, но на енкодинг атрибутът е написан прост енкодинг като Windows-1252 и ISO-8859-1.Също така може да получите тази грешка ако сте запазили документа като с енкодинг но енкодинг атрибутът да показва UTF-16.За да избегнете такива грешки ви съветвам да да използвате едитори, които имат някакъв енкодинг, винаги да знаете какъв енкодинг използва и да го използвате същия във вашия XML документ.