UTF-8-encoder/decoder
Gratis online tool voor UTF-8 encoder/decoder, converteren van Unicode codepoints
Wat is UTF-8-codering?
UTF-8 is een tekencodering met variabele breedte die elk teken in de Unicode-standaard weergeeft. Het gebruikt één tot vier bytes per teken en is de dominante codering voor het World Wide Web. ASCII-tekens (0-127) gebruiken één byte, waardoor UTF-8 achterwaarts compatibel is met ASCII.
De UTF-8-encoder/decoder gebruiken
Voer tekst in om de Unicode-codepunten in U+XXXX-formaat te zien. Voer codepunten in om ze terug te decoderen naar tekst. Deze tool helpt u bij het inspecteren en debuggen van tekencoderingsproblemen, vooral met meertalige inhoud en speciale tekens.
▶Wat is een Unicode-codepunt?
Een codepunt is een uniek nummer dat aan elk teken in de Unicode-standaard is toegewezen. Bijvoorbeeld, U+0041 is 'A', U+4F60 is '你'. Codepunten variëren van U+0000 tot U+10FFFF.
▶Hoe verschilt UTF-8 van UTF-16?
UTF-8 gebruikt 1-4 bytes per teken en is ASCII-compatibel. UTF-16 gebruikt 2 of 4 bytes per teken. UTF-8 is de meest voorkomende codering voor webcontent, terwijl UTF-16 intern wordt gebruikt door systemen zoals Windows en JavaScript.
▶Waarom tonen sommige tekens als vraagtekens of vakjes?
Dit betekent meestal dat het lettertype geen glyph heeft voor dat Unicode-codepunt. Het teken is correct gecodeerd maar kan niet worden weergegeven door de beschikbare lettertypen op uw systeem.
Als deze tool je heeft geholpen, denk dan eens aan het geven van een kop koffie aan mij.
Koop me een kop koffie.