Alfabetisk ordning: definition, sorteringsregler och språk

Alfabetisk ordning: definition, tydliga sorteringsregler för olika språk, hantering av diakritiska tecken och praktiska exempel för snabb och korrekt sortering.

Författare: Leandro Alegsa

Alfabetisk ordning är ett sätt att sortera (organisera) en lista så att en läsare snabbt kan hitta ett namn eller en titel. Man följer den vedertagna bokstavsordningen i ett alfabet. Principen är gammal — vissa listor i alfabetisk ordning fanns redan under det tidiga romarriket — och blev vanligare efter renässansen.

Vad menas med alfabetisk sortering?

Alfabetisk sortering jämför tecken i ord eller fraser från vänster till höger, bokstav för bokstav. Om två ord börjar med samma bokstäver går jämförelsen vidare till nästa tecken tills ett skiljetecken hittas. I praktiken finns flera varianter beroende på språk och kontext, till exempel:

  • Ordinarie lexikografisk ordning: bokstavsförlopp bestämmer ordningen (exempel: "katt" före "kattunge").
  • Ordboks-/uppslagsverksordning: kan ignorera skiljetecken eller behandla diakritiska tecken på särskilt sätt.
  • Numerisk sortering: i vissa sammanhang sorteras tal efter deras numeriska värde (2 före 10), annars som text (10 före 2 om man bara jämför tecken).

Språk- och landsberoende regler

Sortering skiljer sig mellan språk eftersom olika alfabet har olika extra bokstäver och olika regler för diakritika.

  • Svenska: alfabetet består av A–Z följt av de tre extra bokstäverna Å, Ä och Ö. Dessa räknas som egna bokstäver och kommer efter Z i ordningen: ... X, Y, Z, Å, Ä, Ö.
  • Danska och norska: har bokstäverna Æ, Ø och Å som egna slutbokstäver och sorterar dem efter Z, i ordningen ... X, Y, Z, Æ, Ø, Å.
  • Tyska: innehåller ä, ö, ü och ß men dessa hanteras olika beroende på regelverk (se nästa avsnitt).
  • Spanska: betraktar normalt ñ som en egen bokstav som placeras efter n. I modern praxis används ofta lokalanpassad kollation som tar hänsyn till detta.
  • Andra språk: många språk har egna specialregler (t.ex. isländska, ungerska) — därför används ofta lokalspecifika sorteringsalgoritmer i datorprogram.

Diakritiska tecken och specialregler (exempel från tyska)

Bokstäver med diakritiska tecken kan antingen anses vara varianter av en grundbokstav eller egna tecken. För tyska finns två vedertagna alternativ:

  • Alternativ ett (DIN 5007-1): bokstaven med diakritiska tecken behandlas som bokstaven utan diakritika — ä som a, ö som o, ü som u. Denna metod används ofta i uppslagsverk.
  • Alternativ två (DIN 5007-2): bokstaven ersätts av en flerbokstavskombination vid sortering: ä → ae, ö → oe, ü → ue och ß → ss. Denna metod har använts i telefonkataloger.

Observera att detta kan skilja sig åt beroende på språk: Danska har till exempel en bokstav som ser ut som ä men den sorteras efter z och behandlas inte som a som i tyska.

Praktiska aspekter vid sortering i datorer

  • Locale-aware collation: moderna system använder standarder som Unicode Collation Algorithm (UCA) och bibliotek som ICU/CLDR för att tillämpa lands- och språkspecifika regler.
  • Versaler/gemener: sortering är ofta skiftlägesokänslig (case-insensitive), så "Anna" och "anna" behandlas lika. I vissa tekniska sammanhang kan skiftläge bryta likhet (case-sensitive).
  • Skiljetecken och mellanslag: regler varierar — vissa system ignorerar mellanslag och punkt medan andra placerar punkter före bokstäver.
  • Tal i text: välj numerisk sortering om "2" ska komma före "10". Annars sorteras teckensträngar lexikografiskt ("10" före "2").

Exempel

  • Svensk ordning: "Anders, Anna, Bengt, Zandra, Åke, Älva, Östen" (Å, Ä, Ö sist).
  • Tyskt exempel (DIN 5007-1): "Aal, Ängel, Bär" → Ängel behandlas som Angel (nära A).
  • Tyskt exempel (DIN 5007-2): "Aal, Aeon, Bär" → Aeon (för ä som ae) placeras efter de som börjar med "ae".
  • Numerisk kontra lexikal: lista ["1", "2", "10"] → lexikal: 1, 10, 2; numerisk: 1, 2, 10.

Råd vid praktiska sorteringsval

  • Bestäm målgruppen och språk: använd lokalanpassad sortering för bästa läsbarhet.
  • För kataloger och uppslagsverk rekommenderas tydliga regler för diakritika och specialtecken (dokumentera valet).
  • I databaser och programvara: använd beprövade bibliotek (ICU, systemets locale-funktioner) i stället för egenimplementerad teckenjämförelse.
  • Tänk på användarvänlighet: telefonkataloger och register föredrar ofta enklare ersättningsregler (t.ex. ä→ae) för att förenkla sökning.

Sammanfattningsvis är alfabetisk ordning ett grundläggande verktyg för att ordna information, men exakta regler varierar med språk, kontext och tekniska lösningar. Välj regler konsekvent och anpassa efter språkliga normer och användarbehov.

Engelska

En lista med objekt som Eric, Lydia, Andrea och Bob organiseras efter första bokstaven. A kommer före B, B kommer före E och E kommer före L i alfabetet. När alfabetisk ordning används:

  • Andrea
  • Bob
  • Eric
  • Lydia

Om många ord har samma första bokstav sorteras de efter andra bokstaven.

  • Larry
  • Leonard
  • Linda
  • Lydia

Därefter används den tredje och fjärde bokstaven tills hela listan är sorterad.

Orden a, an och the ignoreras. Ibland skrivs de i slutet, efter ett kommatecken. Även mellanslag och bindestreck ( - ) ignoreras.

  • En lång dags resa till natten
  • Det långa avskedandet
  • För hand: En författares anteckningsbok
  • Den långa vägen hem
  • Lång resa tillbaka
  • Den långa vandringen

En formel kan användas för att systematiskt ignorera a, an och the. För Microsoft Excel skulle det vara:

=IF(LEFT(A2,2)="A ",RIGHT(A2,LEN(A2)-2),IF(LEFT(A2,3)="An ",RIGHT(A2,LEN(A2)-3),IF(LEFT(A2,4)="The ",RIGHT(A2, LEN(A2)-4),A2))))

Det kan också anges på följande sätt:

  • En lång dags resa till natten, A
  • Långt farväl, The Long Goodbye
  • För hand: En författares anteckningsbok
  • Den långa vägen hem, The Long Road Home
  • Lång resa tillbaka
  • Den långa promenaden

Namnen är vanligtvis ordnade efter släktnamn, inte efter förnamn.

  • Gene Hackman
  • Tom Hanks
  • Katharine Hepburn
  • Jennifer Love Hewitt

Namnen skrivs ofta med efternamnen först.

  • Hackman, Gene
  • Hanks, Tom
  • Hepburn, Katharine
  • Hewitt, Jennifer Love

Siffror kan sorteras på två sätt. Ibland listas de i ordning från minsta till största. Detta är det normala sättet att sortera tal.

  • 1
  • 3
  • 9
  • 18
  • 27
  • 81

Andra gånger kan de sorteras som om de vore vanliga, stavade ord. Detta sätt används ofta för siffror i titlar.

  • Arton
  • Åttioen
  • Nio
  • En
  • Tre
  • Tjugosju
 

Frågor och svar

F: Vad är alfabetisk ordning?


S: Alfabetisk ordning är ett sätt att sortera (organisera) en lista genom att följa den vanliga bokstavsordningen i ett alfabet.

F: När användes den för första gången?


S: Alfabetisk ordning användes för första gången under det tidiga romarriket och blev vanlig efter renässansen.

F: Hur sker sortering på engelska?


S: Sortering av saker på engelska sker med hjälp av det romerska alfabetet.

F: Finns det olika regler för sortering beroende på språk?


S: Ja, olika språk har olika regler för sortering.

F: Hur sorteras siffror annorlunda än ord eller tecken?


S: Det finns olika sätt att sortera siffror och specialtecken, t.ex. bokstäver med diakritiska tecken.

F: Hur behandlar tyskspråkiga personer bokstäver med diakritiska tecken vid sortering?


S: Tyska talare kan antingen behandla bokstaven med diakritiska tecken på samma sätt som bokstaven utan diakritiska tecken (så kallad DIN 5007-1, som vanligtvis används för uppslagsverk), eller så kan de ersätta dem med något annat tecken (så kallad DIN 5007-2, som används för telefonböcker).

F: Gäller denna regel för alla språk som använder diakritiska tecken? S: Nej, denna regel kan skilja sig åt mellan olika språk. Danska har också en bokstav ن men sorterar den efter z och behandlas inte som a som i tyska.


Sök
AlegsaOnline.com - 2020 / 2025 - License CC3