Språk sorterade efter skriftsystem – lista och översikt

Upptäck en översikt över språk sorterade efter skriftsystem — komplett lista, exempel och hur du kan bidra för att förbättra och komplettera innehållet.

Författare: Leandro Alegsa

Denna lista är ofullständig, du kan hjälpa till genom att komplettera den.

Det här är en lista över språk som använder sig av skriftsystem för att sortera.

 

Vad menas med "sorterade efter skriftsystem"?

Att ett språk är "sorterat efter skriftsystem" betyder att ord eller poster ordnas (kollektivt: sorteras, alfabetiseras eller kollideras) enligt regler som bygger på det alfabet, stavelsesystem eller teckenuppsättning som språket använder. Sorteringsordningen är inte universell — den bestäms av språkets eller regionens konventioner och av tekniska implementationer (till exempel operativsystem, databaser eller bibliografiska system).

Vanliga skriftsystem och exempel på språk

  • Latinska alfabetet — exempel: svenska, engelska, tyska, franska, polska. Varianter: tilläggsbokstäver (å, ä, ö, ñ, ç) och lokala regler för var dessa bokstäver placeras i alfabetet.
  • Cyrilliska — exempel: ryska, bulgariska, serbiska (kan också använda latinskt alfabet).
  • Arabiska skrift — exempel: arabiska, persiska (farsi), urdu. Skriften är höger-till-vänster och sortering tar ofta hänsyn till basformen utan vokaltecken.
  • Devanagari och andra indiska abugidor — exempel: hindi, marathi, nepali. Sortering följer ofta alfabetisk ordning baserat på konsonant- och vokalgrupper.
  • Kinesiska tecken (hanzi/kanji) — exempel: mandarin, kantonesiska, japanska (som använder kanji). Sorteringsmetoder: pinyin-alfabetisk ordning, rad- och streckordning eller indextabeller baserade på radikaler.
  • Hangul — koreanska, där syllabblocken kan sorteras efter deras underliggande jamo-alfabet.
  • Hebreiska — hebreiska språket; sortering är normalt alfabetisk men utan vokaltecken (niqqud).
  • Etiopiska (Ge'ez/Amharic) — exempel: amhariska, tigrinska; sortering baseras på stavelseorden i skriftsystemet.

Typiska skillnader i sorteringsregler

  • Hantering av diakritiska tecken: vissa språk betraktar bokstäver med diakritika som separata bokstäver (till exempel vissa östeuropeiska alfabet), medan andra behandlar dem som varianter av basbokstaven (och sorterar efter basbokstav först).
  • Digrafer och multibokstavssekvenser: i vissa traditioner räknas kombinationer som ch som en egen enhet, i andra räknas de som två separata bokstäver.
  • Ordning för utökade tecken: i språk som använder extra bokstäver (å, ä, ö, ñ, ł) varierar deras position relative till A–Z.
  • Riktning: höger-till-vänster-skrifter påverkar hur man visar listor och index men principen för alfabetisk ordning är i praktiken densamma, bara från motsatt håll.
  • Hur man behandlar ton- eller vokalmarkörer: i vissa skriftsystem (t.ex. i sydostasiatiska och vissa semitiska skrifter) ignoreras diakritiska tonmarkörer vid sortering.

Tekniska aspekter och moderna standarder

  • Unicode definierar teckenuppsättningar men inte alltid exakt hur en locale-specifik sortering ska göras.
  • Unicode Collation Algorithm (UCA) är en ram för jämförelse av tecken; den kan skräddarsys (tailoring) för att följa språk- eller region-specifika regler.
  • Bibliotek och verktyg: ICU (International Components for Unicode), systembibliotek i operativsystem och databaser (t.ex. COLLATE i SQL) erbjuder implementeringar av sorteringsregler och locale-tailoring.
  • Praktiska problem: olika implementationer kan ge olika resultat — exempelvis kan webbläsare, telefonböcker och ordböcker ha egna konventioner. Testning och angivande av locale (t.ex. sv_SE, es_ES, zh_Hans) är viktigt.

Exempel på hur sortering påverkar användning

  • Adress- och telefonlistor: placering av namn med diakritiska tecken.
  • Bibliotekskataloger: ofta noggranna regler för författarnamn, artikeltitlar och översättningar.
  • Sökmotorer och alfabetiska menyer i mjukvara: måste hantera olika skriftsystem och lokala förväntningar.
  • Lexikografiska listor: ordböcker kan använda särskilda principer (t.ex. sortera baserat på rot eller böjningsform).

Riktlinjer för att komplettera listan

Om du vill hjälpa till att utöka artikeln kan du följa dessa rekommendationer:

  • Ange skriftsystemets namn och exempel på språk som använder det.
  • Beskriuv sorteringsprinciper för språket eller skriftsystemet (t.ex. var diakritiska tecken placeras, om digrafer är egna bokstäver, särskilda regler för tonmarkörer).
  • Lägg gärna till källor eller referenser om lokala alfabetregler eller standarder (t.ex. officiella språkmyndigheter, Unicode-dokument, nationalbibliotek).
  • För teknisk precision: ange locale-koder eller hänvisa till UCA/ICU-tailoring när det är relevant.
  • Om du lägger till exempel för sorteringsordning, visa gärna både originaltext och hur den skulle ordnas i praktiken.

Sammanfattning

Sortering efter skriftsystem är en kombination av språkliga konventioner och tekniska regler. Det finns stora variationer mellan språk och regioner, därför är det viktigt att ange vilken konvention eller locale man avser när man beskriver sorteringsregler. Hjälp gärna till att komplettera listan genom att lägga till specifika skriftsystem, exempel på språk och de sorteringsprinciper som gäller för dem.

Arabisk skrift

  • Arabiska
  • Azeri (Iran)
  • Balochi
  • Berber
  • Bosniska (även kyrillisk skrift och latinsk skrift)
  • Fulani (vid enstaka tillfällen)
  • Hausa (vid enstaka tillfällen)
  • Judisk-spansk (fram till 1900-talet)
  • Kanuri (vid enstaka tillfällen)
  • Kashmiri
  • Kazakiska i Kina
  • Kurdiska (Iran och Irak)
  • Madagaskiska (fram till 1800-talet)
  • Malajiska (14-1700-talet)
  • Mazanderani
  • Mozarabiska (numera utdöd)
  • Ottomansk turkiska
  • Pashtu
  • Persisk
  • Punjabi (Pakistan)
  • Saraiki
  • Sindhi
  • Spanska (tidigare före 1500-talet, alias Aljamiado)
  • Swahili (vid enstaka tillfällen)
  • Tadzjikiska (vid enstaka tillfällen)
  • Tausug
  • Urdu
  • Uiguriska

Många språk i Ryssland och Centralasien innan de ersattes med latin och senare kyrilliska

  • Bashkir
  • Vitryska (vid enstaka tillfällen)
  • Kazakh
  • Kirgizistan
  • Tatariska
  • Uzbekiska
 

Armenisk skrift

  • Armeniska
 

Boramas skrift

  • Somaliska
 

Brahmisk familj och derivat

Devanagari

  • Sanskrit
  • Hindi
  • Marathi
  • Maithili
  • Bhojpuri
  • Nepali
  • Sindhi (även skrivet på arabiska)
  • Konkani
  • Kashmiri
  • Bodo
  • Dogri

Assamese/Bengali

  • Assamese
  • Bengali
  • Bishnupriya Manipuri
  • Garo
  • Kokborok
  • Meitei
  • Mundari
  • Sanskrit

Balinesisk skrift

  • Balinesiska språket (tidigare)

Baybayin-skrift

  • Ilokano (tidigare)
  • Kapampangan (tidigare)
  • Pangasinan (tidigare)
  • Tagalog (tidigare)
  • Bikolspråket (tidigare)
  • Visayanska språk (tidigare)

Buhid-skrift

  • Buhid

Burmesisk skrift

  • Burmesiska
  • Karen
    • Geba Karen
    • Pa-O
    • Pwo Karen
    • S'gaw Karen
  • Måndag
  • Rumai Palaung
  • Shan

Gujarati-skrift

  • Gujarati

Gurmukhi-skrift

  • Punjabi (även skriven på shahmukhi, en variant av den arabiska skriften)

Kaithi-skrift

[icon]

Detta avsnitt är tomt. Du kan hjälpa till genom att fylla på den. (juni 2013)

Hanunó'o-skrift

  • Hanunó'o

Javansk skrift (Hanacaraka)

  • Javanesiska (i gammal litteratur och som en del av kulturarvet)
  • Sundanesiska

Kannada-skrift

Khmer-skrift

  • Khmer

Laotisk skrift

Lepcha-skrift

  • Lepcha

Limbu-skrift

  • Limbu

Lontara-skrift (buginesiska)

  • Buginesiska (tidigare)

Malayalam-skrift

  • Malayalam
  • Konkani

Oriya-skrift

  • Oriya

"Phags-pa-skrift

  • Kinesiska (tidigare)
  • Mongoliska (tidigare)
  • Sanskrit (tidigare)
  • Tibetanska (för dekorativa ändamål)
  • Uiguriska (tidigare)

Sinhala-skrift

  • Singalesiska

Tagbanwa-skrift

  • Språk i Palawan

Tamilsk skrift

  • Tamil

Telugu-skrift

Thaana-skrift

  • Dhivehi

Thailändsk skrift

  • Thailändska

Tibetansk skrift

  • Tibetanska
  • Dzongkha
  • Ladakhi
  • Zhang-Zhung (utdöd)
 

Kanadensisk aboriginsk skrift

  • Blackfoot
  • Chipewyan
  • Cree
  • Dakelh
  • Inuktitut
  • Ojibwe
  • Sekani
  • Slavey
  • Tasttine
  • Tłįchǫ
 

Cherokee-skrift

  • Cherokee
 

Koptiskt alfabet

 

Kyrillisk skrift

 

Bosniska kyrilliska alfabetet (bosančica)

Ge'ez-skrift (etiopisk skrift)

 

Georgisk skrift

  • Georgiska
  • Laz (ibland latin)
  • Mingrelian
  • Svan
 

Glagolitiska alfabetet

  • Gamla kyrkans slaviska språk (utdött, används fortfarande liturgiskt)
  • Kroatiska (tidigare)
 

Gotiskt alfabet

  • Gotisk (utdöd)
 

Grekisk skrift

 

Kinesiska tecken och derivat

  • Kinesiska
    • Guanhua (mandarin)
    • Wu, som inkluderar shanghajanskt språk
    • Yue (kantonesiska)
    • Min som omfattar taiwanesiska
    • Xiang
    • Hakka
    • Gan
    • Jin från mandarin
    • Huizhou från Wu
    • Ping delvis från kantonesiska
  • Minoritetsspråk i Kina
    • Dong
    • Bai (föråldrad)
    • Miao (föråldrad)
    • Zhuang, med Zhuang-logogram (föråldrad)
  • Japanska (kanji plus kana derivat)
  • koreanska (hanja) (föråldrad; används i akademiska texter och tidningar)
  • Vietnamesiska (Chữ nho och Chữ nôm) (används i historiska eller akademiska texter, eller för konstnärliga eller estetiska ändamål, men är i allmänt bruk praktiskt taget utdött).
  • Utdöda språk
    • Khitan, skriven på khitanska skriftspråk
    • Jurchen, skrivet med jurchenisk skrift
    • Tangut, skrivet på tangutskrift
 

Hangul

 

Hebreisk skrift

  • Arameiska (och andra skriftsystem)
  • Bukhori
  • Hebreiska
  • Hulaula
  • Judeo-Berber
  • Judisk-irakisk arabiska
  • Judisk-marockansk
  • Judisk-tripolitansk arabiska
  • Judisk-tunisisk arabiska
  • Judisk-portugisisk
  • Judisk-spanska (ursprungligen Rashi-skriften, och andra skriftsystem)
  • Judisk-judisk jemenitisk
  • Juhuri
  • Lishan Didan
  • Lishana Deni
  • Lishanid Noshan
  • Shuadit
  • Jiddisch
  • Zarfatisk
 

Kaddare-skrift

  • Somaliska
 

Kana

  • Japanska (plus kanji)
  • Ainu har modifierat katakana kanas något, vilket gör det möjligt att representera slutljud som enbart är konsonanter.
 

Khitanska skrifter

  • Khitan (utdöd)
 

Latinsk skrift

  • Afrikaans
  • Albanska
  • Aragonien
  • Asturian
  • Aymara
  • Azerbajdzjanska
  • Baskiska
  • Vitryska (tidigare kallad "Łacinka"; numera kyrillisk skrift)
  • Bislama
  • Boholano (tidigare användes Baybayin)
  • Bosniska (även kyrillisk skrift och arebica)
  • Bretonskt
  • Katalanska
  • Cebuano
  • Chamorro
  • Cornish
  • Korsika
  • Kroatiska
  • Tjeckiska
  • Danska
  • Holländska
  • Engelska
  • Esperanto
  • Estniska
  • Färöiska
  • Fijian
  • Filippinska (tidigare användes Baybayin)
  • Finska
  • Franska
  • Frisiska
  • Friulian
  • Fula (Pulaar)
  • Gaeliska (skotska)
  • Galiciska
  • Ganda
  • Tyska
  • Gikuyu
  • Guaraní
  • Haitianska
  • Hausa (använde tidigare arabisk skrift)
  • Hawai'ian
  • Hiti Motu
  • Ungerska (använde gammal ungersk skrift före år 1000)
  • Isländska
  • Ido
  • Igbo
  • Ilocano (tidigare användes Baybayin)
  • Indonesiska
  • Interlingua
  • Innu-aimun
  • Irländska
  • Italienska
  • Javanesiska - använder även ett alfabet som kallas Hanacaraka i vissa områden.
  • Judeo-Spanish - Använder även andra skrifter
  • Kinyarwanda
  • Kirundi
  • Kongo
  • Kurdiska (Kurmanji)
  • Latin
  • Lettiska
  • Laz (används av Turkiet och europeiska Lazs)
  • Leonese
  • Lingala
  • Litauiska
  • Lombard
  • Luxemburgiska
  • Maori
  • Malagasy
  • Malajiska
  • Maltesiska
  • Manx
  • Marshallöarna
  • Moldaviska - även kyrilliska
  • Montenegrin
  • Nahuatl (efter den spanska erövringen)
  • Nauruanska
  • Navaho eller Navajo
  • Ndebele
  • Norsk
  • Occitanska
  • Oromo (tidigare skriven med Ge'ez-skriptet)
  • Palauan
  • Polska
  • Portugisiska
  • Quechua
  • Rumänska (tidigare med kyrilliskt alfabet)
  • Romani
  • Samoanska
  • Skottland
  • Serbiska (använder officiellt kyrillisk skrift)
  • Seychellisk kreol
  • Shona
  • Slovakiska
  • Slovenska
  • Somaliska (tidigare användes arabisk skrift och Osmanya-skrift)
  • Sotho (norra)
  • Sotho (södra)
  • Spanska
  • Swahili
  • Svenska
  • Swati
  • Tagalog (tidigare användes Baybayin)
  • Tahiti
  • Tatariska (tidigare användes arabiska, 1927-1938 latinbaserad janalif, sedan kyrilliska och sedan 2000 återigen latin, men i allmänhet på internet)
  • Tetum
  • Tok Pisin
  • Tongan
  • Tsonga
  • Tswana
  • Turkiska (tidigare med arabisk skrift)
  • Turoyo (nytt latinskt alfabet, ursprungligen syriskt alfabet)
  • Uzbekiska (officiell skrift, tidigare kyrillisk skrift)
  • Venda
  • Vietnamesiska (tidigare med Chữ nho och Chữ nôm)
  • Volapük
  • Võro
  • Vallonien
  • Walesiska
  • Wolof
  • Xhosa
  • Yoruba
  • Zulu
  • Zazaki
 

Mayaskrift

  • Mayaspråk (tidigare)
 

Mongoliska och relaterade skrifter

Gamla uiguriska alfabetet

  • Uiguriska (tidigare)

Mongolisk skrift

  • Mongoliska

Manchu-skrift

Munda-skrifter

Sorang Sompeng

  • Sora

Ol Cemet'

  • Santali

Varang Kshiti

  • Ho
 

N'Ko manuskript

  • N'ko

Naxi-skrift

  • Naxi (föråldrad)
 

Nsibidi

  • Ekoi
  • Igbo
  • Ibibio
 

Ogham

  • Primitiv irländska
  • Pictisk
 

Osmanya-skrift

  • Somaliska
 

Pahawh Hmong

  • Hmong
 

Runisk skrift

 

Gammal ungersk skrift

 

Syrisk skrift

  • Arabiska (se Garshuni)
  • Assyriska Neoarameiska
  • Bohtan Neoarameiska
  • Kaldeiska Neoarameiska
  • Hertevin
  • Koy Sanjaq Surat
  • Senaya
  • Syriska
  • Turoyo (har också en ny latinsk skrift)
 

Tifinagh

  • Amazigh (Marocko)
  • Tuareg
 

Yi-skript

  • Yi
 


Sök
AlegsaOnline.com - 2020 / 2025 - License CC3