Denna lista är ofullständig, du kan hjälpa till genom att komplettera den.
Det här är en lista över språk som använder sig av skriftsystem för att sortera.
Vad menas med "sorterade efter skriftsystem"?
Att ett språk är "sorterat efter skriftsystem" betyder att ord eller poster ordnas (kollektivt: sorteras, alfabetiseras eller kollideras) enligt regler som bygger på det alfabet, stavelsesystem eller teckenuppsättning som språket använder. Sorteringsordningen är inte universell — den bestäms av språkets eller regionens konventioner och av tekniska implementationer (till exempel operativsystem, databaser eller bibliografiska system).
Vanliga skriftsystem och exempel på språk
- Latinska alfabetet — exempel: svenska, engelska, tyska, franska, polska. Varianter: tilläggsbokstäver (å, ä, ö, ñ, ç) och lokala regler för var dessa bokstäver placeras i alfabetet.
- Cyrilliska — exempel: ryska, bulgariska, serbiska (kan också använda latinskt alfabet).
- Arabiska skrift — exempel: arabiska, persiska (farsi), urdu. Skriften är höger-till-vänster och sortering tar ofta hänsyn till basformen utan vokaltecken.
- Devanagari och andra indiska abugidor — exempel: hindi, marathi, nepali. Sortering följer ofta alfabetisk ordning baserat på konsonant- och vokalgrupper.
- Kinesiska tecken (hanzi/kanji) — exempel: mandarin, kantonesiska, japanska (som använder kanji). Sorteringsmetoder: pinyin-alfabetisk ordning, rad- och streckordning eller indextabeller baserade på radikaler.
- Hangul — koreanska, där syllabblocken kan sorteras efter deras underliggande jamo-alfabet.
- Hebreiska — hebreiska språket; sortering är normalt alfabetisk men utan vokaltecken (niqqud).
- Etiopiska (Ge'ez/Amharic) — exempel: amhariska, tigrinska; sortering baseras på stavelseorden i skriftsystemet.
Typiska skillnader i sorteringsregler
- Hantering av diakritiska tecken: vissa språk betraktar bokstäver med diakritika som separata bokstäver (till exempel vissa östeuropeiska alfabet), medan andra behandlar dem som varianter av basbokstaven (och sorterar efter basbokstav först).
- Digrafer och multibokstavssekvenser: i vissa traditioner räknas kombinationer som ch som en egen enhet, i andra räknas de som två separata bokstäver.
- Ordning för utökade tecken: i språk som använder extra bokstäver (å, ä, ö, ñ, ł) varierar deras position relative till A–Z.
- Riktning: höger-till-vänster-skrifter påverkar hur man visar listor och index men principen för alfabetisk ordning är i praktiken densamma, bara från motsatt håll.
- Hur man behandlar ton- eller vokalmarkörer: i vissa skriftsystem (t.ex. i sydostasiatiska och vissa semitiska skrifter) ignoreras diakritiska tonmarkörer vid sortering.
Tekniska aspekter och moderna standarder
- Unicode definierar teckenuppsättningar men inte alltid exakt hur en locale-specifik sortering ska göras.
- Unicode Collation Algorithm (UCA) är en ram för jämförelse av tecken; den kan skräddarsys (tailoring) för att följa språk- eller region-specifika regler.
- Bibliotek och verktyg: ICU (International Components for Unicode), systembibliotek i operativsystem och databaser (t.ex. COLLATE i SQL) erbjuder implementeringar av sorteringsregler och locale-tailoring.
- Praktiska problem: olika implementationer kan ge olika resultat — exempelvis kan webbläsare, telefonböcker och ordböcker ha egna konventioner. Testning och angivande av locale (t.ex. sv_SE, es_ES, zh_Hans) är viktigt.
Exempel på hur sortering påverkar användning
- Adress- och telefonlistor: placering av namn med diakritiska tecken.
- Bibliotekskataloger: ofta noggranna regler för författarnamn, artikeltitlar och översättningar.
- Sökmotorer och alfabetiska menyer i mjukvara: måste hantera olika skriftsystem och lokala förväntningar.
- Lexikografiska listor: ordböcker kan använda särskilda principer (t.ex. sortera baserat på rot eller böjningsform).
Riktlinjer för att komplettera listan
Om du vill hjälpa till att utöka artikeln kan du följa dessa rekommendationer:
- Ange skriftsystemets namn och exempel på språk som använder det.
- Beskriuv sorteringsprinciper för språket eller skriftsystemet (t.ex. var diakritiska tecken placeras, om digrafer är egna bokstäver, särskilda regler för tonmarkörer).
- Lägg gärna till källor eller referenser om lokala alfabetregler eller standarder (t.ex. officiella språkmyndigheter, Unicode-dokument, nationalbibliotek).
- För teknisk precision: ange locale-koder eller hänvisa till UCA/ICU-tailoring när det är relevant.
- Om du lägger till exempel för sorteringsordning, visa gärna både originaltext och hur den skulle ordnas i praktiken.
Sammanfattning
Sortering efter skriftsystem är en kombination av språkliga konventioner och tekniska regler. Det finns stora variationer mellan språk och regioner, därför är det viktigt att ange vilken konvention eller locale man avser när man beskriver sorteringsregler. Hjälp gärna till att komplettera listan genom att lägga till specifika skriftsystem, exempel på språk och de sorteringsprinciper som gäller för dem.