Encoding HTML (Character Set)


Untuk menampilkan halaman HTML dengan benar, browser web harus mengetahui rangkaian karakter yang akan digunakan.


Dari ASCII ke UTF-8

ASCII adalah standar pengkodean karakter pertama. ASCII mendefinisikan 128 karakter berbeda yang dapat digunakan di internet: angka (0-9), huruf alphabet (AZ), dan beberapa karakter khusus seperti! $ + - () @ <>.

ISO-8859-1 adalah character set default untuk HTML 4. Himpunan karakter ini mendukung 256 kode karakter yang berbeda. HTML 4 juga mendukung UTF-8.

ANSI (Windows-1252) adalah rangkaian karakter Windows asli. ANSI identik dengan ISO-8859-1, kecuali ANSI memiliki 32 karakter tambahan.

Spesifikasi HTML5 mendorong pengembang web untuk menggunakan rangkaian karakter UTF-8, yang mencakup hampir semua karakter dan simbol di dunia.


Atribut charset HTML

Untuk menampilkan halaman HTML dengan benar, browser web harus mengetahui character set yang digunakan di halaman.

Ini ditentukan dalam <meta>tag:

<meta charset="UTF-8">

Perbedaan Antara Beberapa Character set

Tabel berikut menampilkan perbedaan antara charset yang dijelaskan di atas:

Nomor ASCII ANSI 8859 UTF-8 Deskripsi
32 spasi
33 ! ! ! ! tanda seru
34 " " " " tanda kutip
35 # # # # tanda pagar
36 $ $ $ $ tanda dolar
37 % % % % tanda persen
38 & & & & simbol dan
39 ' ' ' ' apostrof
40 ( ( ( ( tanda kurung kiri
41 ) ) ) ) tanda kurung kanan
42 * * * * asterisk
43 + + + + tanda tambah
44 , , , , koma
45 - - - - tanda hubung minus
46 . . . . titik
47 / / / / solidus
48 0 0 0 0 angka nol
49 1 1 1 1 angka satu
50 2 2 2 2 angka dua
51 3 3 3 3 angka tiga
52 4 4 4 4 angka empat
53 5 5 5 5 angka lima
54 6 6 6 6 angka enam
55 7 7 7 7 angka tujuh
56 8 8 8 8 angka delapan
57 9 9 9 9 angka sembilan
58 : : : : titik dua
59 ; ; ; ; titik koma
60 < < < < tanda kurang dari
61 = = = = tanda sama dengan
62 > > > > tanda lebih dari
63 ? ? ? ? tanda tanya
64 @ @ @ @ komersial di (commercial at)
65 A A A A huruf kapital A
66 B B B B huruf kapital B
67 C C C C huruf kapital C
68 D D D D huruf kapital D
69 E E E E huruf kapital E
70 F F F F huruf kapital F
71 G G G G huruf kapital G
72 H H H H huruf kapital H
73 I I I I huruf kapital I
74 J J J J huruf kapital J
75 K K K K huruf kapital K
76 L L L L huruf kapital L
77 M M M M huruf kapital M
78 N N N N huruf kapital N
79 O O O O huruf kapital O
80 P P P P huruf kapital P
81 Q Q Q Q huruf kapital Q
82 R R R R huruf kapital R
83 S S S S huruf kapital S
84 T T T T huruf kapital T
85 U U U U huruf kapital U
86 V V V V huruf kapital V
87 W W W W huruf kapital W
88 X X X X huruf kapital X
89 Y Y Y Y huruf kapital Y
90 Z Z Z Z huruf kapital Z
91 [ [ [ [ tanda kurung siku kiri
92 \ \ \ \ kebalikan solidus
93 ] ] ] ] tanda kurung siku kanan
94 ^ ^ ^ ^ aksen sirkumfleks
95 _ _ _ _ garis rendah
96 ` ` ` ` aksen berat
97 a a a a huruf kecil a
98 b b b b huruf kecil b
99 c c c c huruf kecil c
100 d d d d huruf kecil d
101 e e e e huruf kecil e
102 f f f f huruf kecil f
103 g g g g huruf kecil g
104 h h h h huruf kecil h
105 i i i i huruf kecil i
106 j j j j huruf kecil j
107 k k k k huruf kecil k
108 l l l l huruf kecil l
109 m m m m huruf kecil m
110 n n n n huruf kecil n
111 o o o o huruf kecil o
112 p p p p huruf kecil p
113 q q q q huruf kecil q
114 r r r r huruf kecil r
115 s s s s huruf kecil s
116 t t t t huruf kecil t
117 u u u u huruf kecil u
118 v v v v huruf kecil v
119 w w w w huruf kecil w
120 x x x x huruf kecil x
121 y y y y huruf kecil y
122 z z z z huruf kecil z
123 { { { { kurung kurawal buka
124 | | | | garis vertikal
125 } } } } kurung kurawal tutup
126 ~ ~ ~ ~ tilde
127 DEL
128 tanda euro
129    TIDAK DIGUNAKAN
130 tanda kutip single low-9
131 ƒ huruf kecil f dengan kait
132 tanda kutip double low-9
133 elipsis horizontal
134 pisau belati
135 belati ganda
136 ˆ huruf pengubah aksen sirkumfleks
137 per tanda mille
138 Š huruf kapital S dengan caron
139 tanda kutip sudut kiri tunggal
140 Œ pengikat huruf kapital latin OE
141    TIDAK DIGUNAKAN
142 Ž huruf kapital Z dengan caron
143    TIDAK DIGUNAKAN
144    TIDAK DIGUNAKAN
145 ' tanda kutip tunggal kiri
146 ' tanda kutip tunggal kanan
147 tanda kutip ganda kiri
148 tanda kutip ganda kanan
149 peluru
150 en dash
151 em dash
152 ˜ tilde kecil
153 tanda trade mark (merk dagang)
154 š huruf kecil s dengan caron
155 tanda kutip sudut kanan tunggal
156 œ huruf ligatur kecil oe
157    TIDAK DIGUNAKAN
158 ž huruf kecil z dengan caron
159 Ÿ huruf kapital Y dengan diaeresis
160 spasi no-break
161 ¡ ¡ ¡ tanda seru terbalik
162 ¢ ¢ ¢ tanda sen
163 £ £ £ tanda pound
164 ¤ ¤ ¤ tanda mata uang
165 ¥ ¥ ¥ tanda yen
166 ¦ ¦ ¦ bar rusak
167 § § § tanda bagian
168 ¨ ¨ ¨ diaresis
169 © © © tanda hak cipta
170 ª ª ª indikator ordinal feminim
171 « « « tanda kutip sudut ganda kiri
172 ¬ ¬ ¬ tidak masuk
173 tanda hubung lembut
174 ® ® ® tanda terdaftar
175 ¯ ¯ ¯ garis makron
176 ° ° ° tanda derajat
177 ± ± ± tanda plus minus
178 ² ² ² superscript dua
179 ³ ³ ³ superscript tiga
180 ´ ´ ´ aksen lancip
181 µ µ µ tanda micro
182 tanda pilcrow
183 · · · titik tengah
184 ¸ ¸ ¸ cedilla
185 ¹ ¹ ¹ superscript satu
186 º º º indikator ordinal maskulin
187 » » » tanda kutip sudut ganda kanan
188 ¼ ¼ ¼ pecahan vulgar seperempat
189 ½ ½ ½ pecahan vulgar satu setengah
190 ¾ ¾ ¾ pecahan vulgar tiga perempat
191 ¿ ¿ ¿ tanda tanya terbalik
192 À À À huruf latin A dengan grave
193 Á Á Á huruf latin A dengan acute
194 Â Â Â huruf latin A dengan sirkumfleksa
195 Ã Ã Ã huruf latin A dengan tilde
196 Ä Ä Ä huruf latin A dengan diaeresis
197 Å Å Å huruf latin A dengan cincin diatasnya
198 Æ Æ Æ huruf kapital AE
199 Ç Ç Ç huruf kapital C dengan cedilla
200 È È È huruf kapital E dengan grave
201 É É É huruf kapital E dengan acute
202 Ê Ê Ê huruf kapital E dengan sirkumfleksa
203 Ë Ë Ë huruf kapital E dengan diaeresis
204 Ì Ì Ì huruf kapital I dengan grave
205 Í Í Í huruf kapital I dengan acute
206 Î Î Î huruf kapital I dengan sirkumfleksa
207 Ï Ï Ï huruf kapital I dengan diaeresis
208 Ð Ð Ð huruf kapital Eth
209 Ñ Ñ Ñ huruf kapital N dengan tilde
210 Ò Ò Ò huruf kapital O dengan grave
211 Ó Ó Ó huruf kapital O dengan acute
212 Ô Ô Ô huruf kapital O dengan sirkumfleksa
213 Õ Õ Õ huruf kapital O dengan tilde
214 Ö Ö Ö huruf kapital O dengan diaeresis
215 × × × tanda perkalian
216 Ø Ø Ø huruf kapital O dengan coretan
217 Ù Ù Ù huruf kapital U dengan grave
218 Ú Ú Ú huruf kapital U dengan acute
219 Û Û Û huruf kapital U dengan sirkumfleksa
220 Ü Ü Ü huruf kapital U dengan diaeresis
221 Ý Ý Ý huruf kapital Y dengan acute
222 Þ Þ Þ huruf kapital Thorn
223 ß ß ß huruf kecil s tajam
224 à à à huruf kecil a dengan grave
225 á á á huruf kecil a dengan acute
226 â â â huruf kecil a dengan sirkumfleksa
227 ã ã ã huruf kecil a dengan tilde
228 ä ä ä huruf kecil a dengan diaeresis
229 å å å huruf kecil a dengan cincin diatas
230 æ æ æ huruf kecil ae
231 ç ç ç huruf kecil c dengan cedilla
232 è è è huruf kecil e dengan grave
233 é é é huruf kecil e dengan acute
234 ê ê ê huruf kecil e dengan sirkumfleksa
235 ë ë ë huruf kecil e dengan diaeresis
236 ì ì ì huruf kecil i dengan grave
237 í í í huruf kecil i dengan acute
238 î î î huruf kecil i dengan sirkumfleksa
239 ï ï ï huruf kecil i dengan diaeresis
240 ð ð ð huruf kecil eth
241 ñ ñ ñ huruf kecil n dengan tilde
242 ò ò ò huruf kecil o dengan grave
243 ó ó ó huruf kecil o dengan acute
244 ô ô ô huruf kecil o dengan sirkumfleksa
245 õ õ õ huruf kecil o dengan tilde
246 ö ö ö huruf kecil o dengan diaeresis
247 ÷ ÷ ÷ tanda pembagian
248 ø ø ø huruf kecil o dengan coretan
249 ù ù ù huruf kecil u dengan grave
250 ú ú ú huruf kecil u dengan acute
251 û û û huruf kecil u dengan sirkumfleksa
252 ü ü ü huruf kecil u dengan diaeresis
253 ý ý ý huruf kecil y dengan acute
254 þ þ þ huruf kecil thorn
255 ÿ ÿ ÿ huruf kecil y dengan diaeresis

Character Set ASCII

ASCII menggunakan nilai dari 0 hingga 31 (dan 127) untuk karakter kontrol.

ASCII menggunakan nilai dari 32 hingga 126 untuk huruf, angka, dan simbol.

ASCII tidak menggunakan nilai 128-255.


Character Set ANSI (Windows-1252)

ANSI identik dengan ASCII untuk nilai dari 0 hingga 127.

ANSI memiliki sekumpulan karakter berpemilik untuk nilai dari 128 hingga 159.

ANSI identik dengan UTF-8 untuk nilai 160 hingga 255.


Character Set ISO-8859-1

ISO-8859-1 identik dengan ASCII untuk nilai dari 0 hingga 127.

ISO-8859-1 tidak menggunakan nilai 128 hingga 159.

ISO-8859-1 identik dengan UTF-8 untuk nilai 160 hingga 255.


Character Set UTF-8

UTF-8 identik dengan ASCII untuk nilai dari 0 hingga 127.

UTF-8 tidak menggunakan nilai 128 hingga 159. 

UTF-8 identik dengan ANSI dan 8859-1 untuk nilai 160 hingga 255.

UTF-8 melanjutkan dari nilai 256 dengan lebih dari 10.000 karakter berbeda.


Sumber referensi: w3schools

Komentar