UTF-8 Encoder/Decoder
Gratis online UTF-8-encodeer-/decodeerhulpmiddel, Unicode-codepoint-conversie
Wat is UTF-8-codering?
UTF-8 is een tekencodering met variabele breedte die elk teken in de Unicode-standaard weergeeft. Het gebruikt één tot vier bytes per teken en is de dominante codering voor het World Wide Web. ASCII-tekens (0-127) gebruiken één byte, waardoor UTF-8 achterwaarts compatibel is met ASCII.
De UTF-8-encoder/decoder gebruiken
Voer tekst in om de Unicode-codepunten in U+XXXX-formaat te zien. Voer codepunten in om ze terug te decoderen naar tekst. Deze tool helpt u bij het inspecteren en debuggen van tekencoderingsproblemen, vooral met meertalige inhoud en speciale tekens.
▶Wat is een Unicode-codepunt?
Een codepunt is een uniek nummer dat aan elk teken in de Unicode-standaard is toegewezen. Bijvoorbeeld, U+0041 is 'A', U+4F60 is '你'. Codepunten variëren van U+0000 tot U+10FFFF.
▶Hoe verschilt UTF-8 van UTF-16?
UTF-8 gebruikt 1-4 bytes per teken en is ASCII-compatibel. UTF-16 gebruikt 2 of 4 bytes per teken. UTF-8 is de meest voorkomende codering voor webcontent, terwijl UTF-16 intern wordt gebruikt door systemen zoals Windows en JavaScript.
▶Waarom tonen sommige tekens als vraagtekens of vakjes?
Dit betekent meestal dat het lettertype geen glyph heeft voor dat Unicode-codepunt. Het teken is correct gecodeerd maar kan niet worden weergegeven door de beschikbare lettertypen op uw systeem.