Folkets synonymlexikon Synlex
Alla som sökte i svensk-engelska Lexin 24 mars-15 november 2005 fick möjlighet att
bedöma ett slumpmässigt framtaget synonymparsförslag.
Nu kan man slå i ett synonymlexikon med över 82000
synonympar som bedömts vara tillräckligt bra. Svara bara på
en synonymparsfråga
så får du chans att söka i Folkets synonymlexikon.
Det går att ladda hem synonymlexikonet i
XML-format. Eftersom Folkets synonymlexikon har byggts upp tillsammans av
tiotusentals frivilliga Internetanvändare är lexikonet fritt.
Historik
Synonymlexikonet började byggas upp den 24 mars 2005.
Då fanns 250000 synonymparsförslag.
Den 7 april sållades 10% av synonymparsförslagen bort efter att
många bedömt paren som synonymer av grad 0. Den 17 maj hade totalt
85000 synonymparsförslag sorterats bort, varefter 63% återstod.
Kvaliteten på återstående synonymparsförslag blev då betydligt
bättre. Från och med juni 2005 sållas även synonymparsförslag som ansetts
bra bort från de synonympar som presenteras för bedömning, men de är förstås kvar
i Folkets synonymlexikon.
Ungefär 25000 användarsynonymförslag har lagts till. Även om vi försöker ta bort
felstavade och tokiga förslag så kan en del förslag som presenteras vara oseriösa.
Vi ber användarna att bortse från dessa förslag och helt enkelt svara 0 på
synonymitetsfrågan.
Vad menar vi med att två ord är synonymer?
Synonymer är ord som betyder samma sak. Men det är mycket ovanligt med ord som är helt utbytbara. Vissa ord har till exempel olika stilvärde (flicka och tös). Andra har överlappande men inte identisk betydelse (god och smaklig). Detta gör att språkvetare är försiktiga med att definiera exakt vilka ord som är synonymer.
I Synlex är det folkets definition av synonym som används. Det betyder att om tillräckligt många personer anser att två ord är synonymer (till en viss grad) så kommer orden att vara det i lexikonet.
Om synonymparsförslagen
Vissa förslag kan tyckas vara helt gripna ur luften. Ibland föreslås ord ur
olika ordklasser som synonymförslag. Hur är det möjligt?
Ursprungsförslagen togs fram helt automatiskt från olika lexikon (svenska
ord har översatts till ett annat språk och sedan tillbaka igen). Sedan
har omkring två tredjedelar av alla dessa förslag sållats bort med
hjälp av en automatisk språkstatistisk metod som kallas RI (Random
indexing). Det är bland återstående förslag som vi slumpat fram
förslag som användarna av Lexin får bedöma. Utöver detta har
användarna själva fått lägga till egna synonymparsförslag.
Vilka ligger bakom Synlex?
Synlexprojektet leds av professor
Viggo Kann
vid institutionen för datavetenskap vid KTH.
Prototyper till stödsystem för Synlex utvecklades i ett programmeringsprojekt vid KTH.
Vi vill tacka Myndigheten för skolutveckling, Lexinprojektet och Skoldatanätet för
att vi fick lägga ut synonymparsfrågorna på Lexins söksvarssida.
Mer information
Om du vill veta mer om Synlex kan du läsa en
svensk rapport
om hur systemet planerades att fungera och hur synonymförslagen är framtagna.
Det finns också en
forskningsrapport som även beskriver resultatet hittills.
Folkets synonymlexikon har fått en efterföljare: Folkets lexikon med ett svensk-engelskt och engelsk-svenskt lexikon.