| engelsk term | svensk term | kommentar |
|---|---|---|
| (the) curse of dimensionality | dimensionalitetsförbannelsen | |
| accuracy | korrekthet, även noggrannhet | |
| active chart parsing | parsning med aktiv chart | |
| active edge | aktiv båge, aktiv kant | |
| acyclic graph | acyklisk graf | |
| adjective | adjektiv | |
| affix | affix | |
| agenda | agenda | |
| agglutinating language | agglutinerande språk | |
| alignment | länkning, linjering | |
| alignment | länkning | (men inte i "model alignment") |
| alphabet | alfabet | |
| ambiguity | tvetydighet, mångtydighet, flertydighet, ambiguitet, dubbeltydighet | |
| annotated corpus | annoterad korpus, även uppmärkt korpus | |
| annotation pipeline | annoteringspipeline, även annoteringskedja | |
| annotation reliability | annoteringstillförlitlighet | |
| annotation | annotering, även uppmärkning | |
| annotation | annotering | |
| application | tillämpning, applikation | |
| argument mining | argumentutvinning | |
| argumentation mining | argumentationsutvinning | |
| artificial intelligence, AI | artificiell intelligens, AI | |
| artificial neural network, ANN | artificiellt neuronnät, även artificiellt neuralt nätverk | |
| assisted | stödd | |
| attention mechanism | fokusmekanism | |
| attention | fokus, även uppmärksamhet | |
| attribute value pair | attribut-värdepar | |
| attribute | attribut | |
| authorship attribution | författarbestämning | |
| auto regression | autoregression | |
| automatic pseudonymization | automatisk pseudonymisering | |
| automaton | automat | |
| backpropagation | bakåtpropagering | |
| backtracking | retursökning | |
| bag of words | ordsäck, även ordpåse | |
| batch | batch, även omgång | plural batchar eller batcher |
| bias | bias, även skevhet, i vissa sammanhang fördomar | |
| bottom-up parsing | nedifrånochupp-parsning, datadriven parsning | |
| bound morpheme | bundet morfem | |
| breadth-first | bredden-först | |
| cartesian product | kartesisk produkt | |
| case | kasus | |
| categorial grammar | kategorialgrammatik | |
| category | kategori | |
| chart parsing | chartparsning | |
| chart | chart | |
| Chomsky's hierarchy | Chomskyhierarkin | |
| chunk parsing, shallow parsing | ytparsning | |
| chunk | ordsekvens | |
| chunking | chunkning | |
| circumfix | cirkumfix | |
| classification | klassificering | |
| clause | sats | |
| clitic particle | enklitisk partikel | |
| closed class, closed category | sluten klass, sluten kategori | |
| cluster | kluster | |
| clustering | klustring | |
| clusterning | klustring | |
| cohort study | kohortstudie | |
| collocation | kollokation, samförekomst | |
| competence | kompetens, förmåga | |
| complement | komplement, fyllnadsled | |
| composition | komposition | |
| compositionality | komponerbarhet, kompositionalitet | |
| compound word | sammansättning | |
| computational complexity | beräkningskomplexitet | |
| computational linguistics | datalingvistik, datorlingvistik | |
| computer-assisted language learning, CALL | datorstödd språkinlärning | |
| computer | dator | |
| concatenation | konkatenering | |
| concordance | konkordans | |
| confusion matrix | förväxlingsmatris | |
| conjunction | konjunktion | |
| consonant | konsonant | |
| constituency parsing | konstituentparsning, även konstituentanalys | |
| context-free grammar | kontextfri grammatik | |
| context-sensitive grammar | kontextkänslig grammatik | |
| context | sammanhang, kontext | |
| convolutional neural network, CNN | faltningsnät, faltningsnätverk | |
| coordination | samordning | |
| coreference resolution | koreferenslösning, även koreferensbestämning | |
| corpus | korpus | |
| corpus | korpus | korpusen, korpusar, undvik korpuset |
| cost function | kostnadsfunktion | |
| cross validation | korsvalidering | |
| data driven | datadriven | |
| data mining | utvinning ur data, även datautvinning | |
| data science | dataanalys | |
| data structure | datastruktur | |
| data-intensive research | dataintensiv forskning | |
| dataset | datamängd | Använd inte dataset på svenska |
| decision tree | beslutsträd | |
| deep generative methods | djupa generativa metoder | |
| deep learning | djupinlärning | |
| default value | förvalt värde, skönsvärde, defaultvärde | |
| dependency grammar | dependensgrammatik | |
| dependency parsing | dependensparsning | |
| depth-first (search or parsing) | djupet först (sökning eller parsning) | |
| determinism | determinism | |
| deterministic FSA | ändlig automat | |
| deterministic | deterministisk | |
| determinization (of an automaton) | göra deterministisk | |
| diachronic | diakron, även diakronisk | |
| dialogue system | dialogsystem | |
| dialogue | dialog | |
| dictionary | lexikon, ordlista | |
| digit | siffra | |
| dimensionality reduction | dimensionsreduktion | |
| directed acyclic graph (DAG) | riktad acyklisk graf | |
| directed graph | riktad graf | |
| disambiguation | disambiguering | |
| disambiguation | disambiguering | |
| discovery procedure | upptäcktsprocedur | |
| discriminating machine learning | klassificerande maskininlärning | |
| distance | avstånd | |
| distributional semantics | distributionell semantik | |
| document classification | dokumentklassificering | |
| dotted rule | punkterad regel | |
| dynamic programming | dynamisk programmering | |
| edge | kant, båge | |
| element | element | |
| embedding | inbäddning | |
| empty set, void set | tom mängd | |
| encoder-decoder | kodare-avkodare, kodnings-avkodnings- (i sammansättningar) | |
| Engelsk term | Svensk term | Kommentar, definition mm |
| entailment | logisk följd | |
| entry | lexikoningång | |
| epoch | epok | |
| epsilon-transition | epsilonövergång | |
| evaluation | utvärdering | |
| expert system | expertsystem | |
| expression (in a formal system) | uttryck | |
| expression (in natural language) | uttryck | |
| F-score | F-värde, även F-mått | |
| feature engineering | särdragsdesign | jfr promptdesign |
| feature extraction | särdragsextraktion, även särdragsutvinning | |
| feature | särdrag | (inom maskininlärning) |
| final state | finaltillstånd, sluttillstånd | |
| fine-tuning | finjustering | |
| finite state transducer, FST | finit transduktor | |
| finite-state automaton, finite-state machine, FSM | ändlig automat | |
| fluency | flyt | (språkligt) flyt |
| formal language | formellt språk | |
| formal semantics | formell semantik | |
| free morpheme | fritt morfem | |
| frequency analysis | frekvensanalys | |
| functionality | funktionalitet | |
| gender | genus | |
| general language | allmänspråk | |
| generalization | generalisering | |
| generation | generation | |
| generative adversarial networks GAN | generativa antagonistiska nätverk | |
| generative AI | generativ AI | |
| generative machine learning | generativ maskininlärning | |
| generative modelling | generativ modellering | |
| gold standard | guldstandard | en guldstandard används som facit i utvärderingar men behöver inte vara korrekt |
| GPSG, generalized phrase structure grammar | Generaliserad frasstrukturgrammatik, GPSG | |
| gradient search | gradientsökning | |
| grammar checking | grammatikkontroll | |
| grammar | grammatik | |
| grammatical description | grammatisk beskrivning, även grammatika | |
| grammatical word | formord, funktionsord, grammatiskt ord | |
| graph | graf | |
| graph | graf | nätverk |
| grounding | förankring | |
| head | huvud | |
| hidden Markov model, HMM | dold Markovmodell | |
| HTR: hand-written text recognition | handskriftsigenkänning | |
| hyperonym | hyperonym | |
| hyperparameter | hyperparameter | |
| hypertext | hypertext | |
| hyphenation | avstavning | |
| hyponym | hyponym | |
| idiolect | idiolekt | |
| index term | indexterm | |
| indexing | indexering | |
| inference | inferens | |
| infix | infix | |
| inflection | böjning | |
| information extraction, IE | informationsextraktion, informationsutvinning | |
| information extraction | informationsextraktion | |
| information retrieval | informationssökning | |
| inheritance | arv | |
| input | inmatning | |
| interactive | interaktiv | |
| intersection | skärningspunkt | |
| intonation | intonation | |
| isolating language | analytiskt språk, isolerande språk | |
| iteration | iteration | |
| k-fold cross-validation | k-faldig korsvalidering | |
| k-Nearest Neighbors, k-NN | k-närmaste grannar | |
| Kleene star | Kleene-stjärna | |
| Kleene-plus | Kleene-plus | |
| knowledge graph | kunskapsgraf | |
| knowledge | kunskap | |
| L2 data | L2-data | förkortning av andraspråksdata |
| L2 Swedish | L2-svenska | förkortning av andraspråkssvenska |
| label | etikett, tagg | En annotering |
| language acquisition | språkinlärning | |
| language identifier, language detector | språkdetektor | |
| language learning | språkinlärning | |
| language model | språkmodell | |
| language planning and maintenance | språkvård | |
| language resource | språkresurs | |
| language technology, human language technology | språkteknologi | |
| language/linguistic diversity | språklig mångfald | |
| large language model, LLM | stor språkmodell | |
| lattice | gitter | |
| left recursive rule | vänsterrekursiv regel | |
| lemma | lemma | |
| lemma | lemma | |
| lemmatization | lemmatisering | |
| lexeme | lexem | |
| lexical semantics | lexikal semantik | |
| lexicon | lexikon (ordbok) | |
| lexicon | lexikon | |
| linguistic analysis | lingvistisk analys, även språklig analys | |
| linguistic database | lingvistisk databas | |
| loan word | lånord | |
| loss function | förlustfunktion | |
| machine translation program | maskinöversättare | |
| machine translation, MT | maskinöversättning | |
| machine translation | maskinöversättning | |
| machine-aided translation | datorstödd översättning | |
| mapping, function | mappning | |
| mark-up | uppmärkning | |
| Markov model | Markovmodell | |
| meaning | betydelse | |
| measure | mått | |
| metadata | metadata | |
| metasymbol | metasymbol | |
| minimization (of an automaton) | minimering (av en automat) | |
| model alignment | modellanpassning | |
| modify | modifiera | |
| morph | morf | |
| morpheme | morfem | |
| morphological analysis | morfologisk analys | |
| morphology | morfologi | |
| morphophoneme | morfofonem | |
| morphophonemic representation | morfofonemisk representation | |
| morphotactics | morfotax | |
| multi-word expression | flerordsuttryck | |
| multilingual | flerspråkig | |
| mutual information | ömsesidig information | |
| naive Bayes classifier | naiv bayesiansk klassificerare | |
| naive Bayes | naiv Bayes | |
| named entity recognition | namnigenkänning | |
| named entity | namngiven entitet | |
| natural language descriptions | beskrivningar i naturligt språk | |
| natural language processing, NLP | språkteknologi, även naturligtspråkbehandling | |
| natural language understanding | förståelse av naturligt språk, även språkförståelse om det är underförstått att det är naturligt språk | |
| natural number | naturligt tal | |
| neologism | neologism | |
| network | nätverk | |
| neural network | neuronnät, även neuralt nätverk | |
| node, vertex | hörn, nod | |
| non-deterministic | icke-deterministisk | |
| nonterminal symbol, meta symbol | icke-terminal symbol | |
| normalising flow (models) | normaliserade flödesmodeller | |
| noun | substantiv | |
| null string, epsilon | tom sträng, epsilon | |
| number | numerus | |
| operator | operator | |
| optical character recognition, OCR | optisk teckenigenkänning, även optisk teckenläsning, maskinläsning | |
| optimization, programming(2) | optimering | |
| optimization | optimering | |
| outlier | utliggare | |
| output | utmatning | |
| overfitting | överanpassning, i vissa sammanhang överträning | använd gärna överanpassad, övertränad |
| overgeneration | övergenerering | |
| paradigm | paradigm | |
| parallel corpus, bitext, parallel text | parallellkorpus | |
| parser | parser | |
| parsing | parsning | |
| parsing | parsning | |
| part of speech tag | ordklasstagg, ordklassetikett | |
| part of speech tagging | ordklasstaggning, ordklassigenkänning | |
| part of speech | ordklass | |
| pause | paus | |
| phoneme | fonem | |
| phrase | fras | |
| pipeline | pipeline, även kedja | |
| pitch | tonhöjd | |
| polysynthetic language, incorporating language | polysyntetiskt språk | |
| POS Tag, part-of-speech tag | ordklasstagg | |
| possessive suffix | possessivsuffix | |
| postposition | postposition | |
| precision | precision | |
| precision | precision | |
| prefix | förstavelse, prefix | |
| preposition | preposition | |
| preprocessing | förbearbetning, även förbehandling, förprocessning | |
| pretrained model | förtränad modell | |
| principal component analysis, PCA | huvudkomponentanalys | |
| prompt engineering | promptdesign | |
| prompt | prompt | (substantiv) |
| prompt | prompta | (verb) |
| prototype | prototyp | |
| pushdown automaton | begränsad stackautomat | |
| quantisation, quantization | diskretisering | |
| question answering system | frågebesvarande system | |
| question answering | frågebesvarande | t ex frågebesvarande system |
| queue | kö | |
| random forest | slumpskog | |
| readability | läsbarhet | |
| recall | täckning | |
| recall | täckning | |
| recognition | igenkänning | |
| recognize | känna igen | |
| recurrent neural network | återkopplat neuronnät, även återkopplat neuralt nätverk | |
| recursive transition network | rekursivt tillståndsnätverk | |
| recursive | rekursiv | |
| regression | regression | |
| regular expression | reguljärt uttryck | |
| regular grammar | reguljär grammatik | |
| regular language, regular set | reguljär mängd, reguljärt språk | |
| reinforcement learning | förstärkningsinlärning | Maskininlärning som provar sig fram och förstärker beteenden som leder till positivt resultat och försvagar beteenden som leder till negativt resultat |
| relation | relation | |
| representation | representation | |
| rewrite grammar | omskrivningsgrammatik | |
| rewrite rule | omskrivningsregel | |
| robust | robust | |
| rounded vowel | rundad vokal | |
| scope ambiguity | räckviddsflertydighet | |
| script | skript | |
| search stem | sökstam | |
| self-attention | självfokus | |
| semantics | semantik | |
| semi-supervised learning | delvis övervakad inlärning, även delvis vägledd inlärning | |
| sense | betydelse | |
| sentence segmentation | meningssegmentering | |
| sentence | mening | |
| sentiment analysis | sentimentanalys, i vissa sammanhang attitydanalys | |
| sentiment | sentiment, i vissa sammanhang attityd | |
| sequence labeling | sekvenstaggning | |
| set | mängd | |
| sign language recognition, SLR | teckenspråksigenkänning | |
| smoothing | utjämning | |
| source language | källspråk | |
| space | mellanslag | |
| spectrogram | spektrogram | |
| spectrum | spektrum | |
| speech interface | talgränssnitt | |
| speech recognition | taligenkänning | |
| speech recognition | taligenkänning | |
| speech synthesis, text-to-speech | talsyntes | |
| speech synthesis | talsyntes | |
| speech-to-text | tal-till-text | |
| speech | tal | |
| spelling checking | stavningskontroll | |
| spelling correction | rättstavning | |
| spoken language | talat språk | |
| start state | starttillstånd | |
| state | tillstånd | |
| stem, truncated word | ordstam | |
| stemming | trunkering, stemming | |
| stemming | trunkering | |
| stop word | stoppord | |
| stop words | stoppord | |
| stress | betoning | |
| string | sträng | |
| subject | subjekt | |
| suffix | suffix, ändelse | |
| summary | sammanfattning, sammandrag | |
| supervised learning | övervakad inlärning, även vägledd inlärning | |
| surface form | ytform | |
| synonym | synonym | |
| synset, synonym set | synonymmängd | |
| syntactic analysis, syntax analysis | syntaxanalys, även syntaktisk analys | |
| syntactic parser | syntaktisk parser | |
| syntactic parsing | syntaktisk parsning | |
| syntactic tree | syntaxträd | |
| syntax | syntax | |
| tag | tagg | |
| tag | tagg | |
| tagging | taggning | |
| target language | målspråk | |
| template | mall | |
| tensor | tensor | pl. tensorer |
| term | term | |
| terminal symbol | slutsymbol | |
| terminology | terminologi | |
| test data | testdata | |
| text classification | textklassificering | |
| text mining | utvinning ur text, även textutvinning | |
| text normalizaiton | textnormalisering | |
| text summarization | textsammanfattning | |
| text-to-speech | text-till-tal | |
| text | text | |
| token | token | |
| tokenisation/tokenization | tokenisering | ordsegmentering kan användas om det är ord som tokeniseras |
| tokenize, tokenise | ordsegmentera | |
| top-down parsing | uppifrånochnedparsning | |
| training data | träningsdata | |
| transfer learning | transferinlärning | |
| transfer model | transfermodell, transferarkitektur | |
| transition | övergång | |
| translation memory | översättningsminne | |
| translation | översättning | |
| translator | översättare | |
| treebank | trädbank | |
| two-level morphology | tvånivåmorfologi | |
| two-level rule | tvånivåregel | |
| type-token ratio, TTR | typ-token-kvot, även ordvariationskvot | |
| unambiguous | entydig, otvetydig | |
| underfitting | underanpassning, i vissa sammanhang underträning | använd gärna underanpassad, undertränad |
| unification | unifiering | |
| union | union | |
| unrestricted rewrite grammar | obegränsad omskrivningsgrammatik | |
| unsupervised learning | oövervakad inlärning, även (icke) vägledd inlärning | |
| user interface | användargränssnitt | |
| validation data | valideringsdata | |
| variational autoencoder, VAE | variationskodningsnätverk | |
| vectorization | vektorisering | |
| verb | verb | |
| vertex | nod | |
| vision-language model | bild-text-modell | |
| vocabulary | vokabulär | |
| voice interface | röstgränssnitt | |
| vowel | vokal | |
| web crawler | nätspindel | Närbesläktat med "web scraping" (med skillnaden att man snarare syftar på att extrahera innehållet istället för att upptäcka länkar) |
| word derivation | avledning | |
| word embedding, word vector | ordinbäddning, ordvektor | orden används ibland helt synonymt och ibland i något olika betydelser |
| word form | ordform | |
| word representation | ordrepresentation | |
| word sense disambiguation | ordbetydelsedisambiguering | |
| word sense | ordbetydelse | |
| word token | ordförekomst | |
| word-form, word type | ordform | |
| WordNet | ordnät | |
| world knowledge | omvärldskunskap | |
| written language | skrivet språk |
Kontaktperson: Viggo Kann viggo@kth.se