Mojibake

Mojibake (文字化け, uttalas /modʑibake/) är ett namn på felaktiga, oläsbara tecken som visas när datorprogram inte visar text korrekt. När man använder datorer kodas text med hjälp av en teckenkodning. Vid överföring ersätts varje tecken med dess position (eller nummer) i kodningen. För att visa tecknet igen ersätts positionen återigen med tecknet. När den ursprungliga kodningen inte anges kan ett annat tecken användas när numret återigen ersätts med tecknet för visning. Unicode infördes för att lösa detta problem: UTF-8 kan koda de vanligaste tecknen i 2 bytes.

Innan Unicode infördes användes andra teckenkodningar. ISO-8859 innehåller till exempel 15 olika kodningar. Dessa är desamma för de tecken som vanligen används på engelska. De har flera "block" av "specialtecken", som arkiveras på olika sätt för varje kodning.



Så här kan en webbplats se ut om fel teckensnittskodning används.Zoom
Så här kan en webbplats se ut om fel teckensnittskodning används.

Den japanska Wikipedia-artikeln om Mojibake använder UTF-8-kodning. Denna skärmdump visar hur den ser ut när den avkodas med Windows standard CP1252-kodning.Zoom
Den japanska Wikipedia-artikeln om Mojibake använder UTF-8-kodning. Denna skärmdump visar hur den ser ut när den avkodas med Windows standard CP1252-kodning.

Ordets ursprung

Mojibake är ett japanskt ord. Ordet 文字化け ([moʥibake]) består av två delar. 文字 (moji) betyder bokstav, tecken. 化け (bake), från verbet 化けける (bakeru), betyder att framträda i förklädnad, att ta formen av, att förändras till det sämre. Bokstavligen betyder det "karaktärsförändring".



Frågor och svar

F: Vad är "mojibake"?


S: Mojibake är termen för felaktiga och oläsliga tecken som visas när datorprogram inte kan visa text på rätt sätt.

F: Hur kodas text när man använder datorer?


S: Text kodas med hjälp av en teckenkodning, där varje tecken ersätts med sin position eller sitt nummer i kodningen.

F: Vad händer när den ursprungliga kodningen inte anges vid överföring av text?


S: När den ursprungliga kodningen inte anges kan ett annat tecken användas när numret ersätts med det tecken som ska visas.

F: Vad är Unicode, och hur löser det detta problem?


S: Unicode är en standard för teckenkodning som kan representera de flesta tecken i två byte. Det löser problemet med att använda olika teckenkodningar och säkerställer att tecknen visas korrekt.

F: Vilka är några exempel på andra teckenkodningar som användes före Unicode?


S: ISO-8859 är ett exempel på en annan teckenkodning som användes före Unicode.

F: Hur många olika kodningar innehåller ISO-8859?


S: ISO-8859 innehåller 15 olika kodningar.

F: Är specialtecknen i ISO-8859 desamma för alla dess kodningar?


S: Nej, specialtecknen i ISO-8859 är arkiverade på olika sätt för varje kodning.

AlegsaOnline.com - 2020 / 2023 - License CC3