Natrag   Forum.hr > Informatička tehnologija > Za napredne korisnike > Programiranje

Programiranje Za programere i one koji to žele postati ...

Odgovor
 
Tematski alati Opcije prikaza
Old 23.09.2016., 23:56   #1
Kodiranje teksta

Može li mi netko objasniti koja je razlika između UTF-16 kodiranja, UTF-8 kodiranja i UCS-2 kodiranja?
Natjecatelj is offline  
Odgovori s citatom
Old 24.09.2016., 10:26   #2
UTF-8 i UTF-16 su varijabilne duljine, a broj označava minimalnu duljinu u bitovima. UTF-8 je ASCII kompatibilan u onom dijelu u kojem se preklapa (127 znakova), te za prosječni tekst pisan latinicom traži manje memorije (samo non-ASCII znakovi uzimaju 2 bytea ili više), ali je zato indeksiranje sporo jer ne možeš direktno mapirati memoriju u znakove, s obzirom na to da vrijednost prvog bita ukazuje na to da li je multibyte ili ne. UTF-16 nema direktnu kompatibilnost s ASCII-em jer je i prvih 127 znakova prikazano s 2 bytea, te za prosječni latinični tekst traži više memorije, ali zato za ćirilicu, kinesko i japansko pismo za većinu znakova omogućuje brže indeksiranje jer je većina znakova prikazana s 2 bytea.

UCS-2 je zastarjeli format fiksne širine 2 byte-a. Uz sitne razlike, većinom se poklapa s 16 bitnim znakovima iz UTF-16, pa aplikacije koje podržavaju UTF-16 u pravilu mogu raditi s UCS-2, ali obrnuto ne vrijedi.
MrBlc is offline  
Odgovori s citatom
Old 27.09.2016., 00:06   #3
UTF-8 i UTF-16 mogu kodirati bilo koji znak iz Unicode-a.
UCS-2 kodom ne može se zapisati sve Unicode znakove.

UTF-8 koristi 1, 2, 3, ili 4 bajta za zapis jednog znaka iz unicode-a. 1 bajt je dovoljan za sve ASCII znakove, i taj je identičan ASCIIju.

UTF-16 koristi 2 ili 4 bajta po znaku.
Perovd is offline  
Odgovori s citatom
Odgovor



Kreni na podforum




Sva vremena su GMT +2. Trenutno vrijeme je: 04:13.