UTF-8 i UTF-16 su varijabilne duljine, a broj označava minimalnu duljinu u bitovima. UTF-8 je ASCII kompatibilan u onom dijelu u kojem se preklapa (127 znakova), te za prosječni tekst pisan latinicom traži manje memorije (samo non-ASCII znakovi uzimaju 2 bytea ili više), ali je zato indeksiranje sporo jer ne možeš direktno mapirati memoriju u znakove, s obzirom na to da vrijednost prvog bita ukazuje na to da li je multibyte ili ne. UTF-16 nema direktnu kompatibilnost s ASCII-em jer je i prvih 127 znakova prikazano s 2 bytea, te za prosječni latinični tekst traži više memorije, ali zato za ćirilicu, kinesko i japansko pismo za većinu znakova omogućuje brže indeksiranje jer je većina znakova prikazana s 2 bytea.
UCS-2 je zastarjeli format fiksne širine 2 byte-a. Uz sitne razlike, većinom se poklapa s 16 bitnim znakovima iz UTF-16, pa aplikacije koje podržavaju UTF-16 u pravilu mogu raditi s UCS-2, ali obrnuto ne vrijedi.
|