Komunikacijski kanal, prirodni jezik i programski jezik, sadržaj i obilježje
RIJEČ
fon-fonem, morf-morfem, oblici riječi - leksem/lema; glasoslovlje i struktura zapisa
OBLIKOSLOVLJE - MORFOLOGIJA
glasovne promjene; fleksija i derivacija, regularni izrazi
PARADIGMA
sprezanje i sklonidba, razredi i vrste otvorenih riječi; semantičke uloge
SKLADNJA
struktura rečenice, dijelovi rečenice, vrste rečenica; PS-tree fijagram, fraze (NP, VP, OP, ...) i služba riječi u rečenci (s-p-o, priložne oznake...)
GRAMATIKA
gramatički uzorci, komadi i pukotine, NLTK u Chomsky-evim sintaktičkim strukturama; Contex-free grammar i dependency grammar.
CORPORA
obrada dokumenata iz dijakronijsko-sinkronijskog skupa; konkordancije, frekvencijske distribucije riječi, kategorizacije
SEMANTIKA
značenje riječi i njihovih kombinacija (kolokacije, frazemi, idiomi,...) ; stilske figure u diskursu (metafore, metonimije, ...) i njihovo dohvaćanje računalom
STATISTIKA
kad riječ postane broj; korelacije, regresijska analiza, testovi i razdiobe: t-test, hi-kvadrat test, ...
SINTAKSNO-SEMANTIČKI MREŽNI OKVIR
integracija svih jezikoslovnih područja: morfologije, sintakse i semantike; proširenje novim modulima
LOGIKA
predikatna logika u jezikoslovlju; kvantifikatori; ontologijsko i epistemijsko značenje
RUDARENJE TEKSTA
izvlačenje strukture iz nestrukturiranog dokumenta; nadgledana i nenadgledana analiza 'vreće riječi'
SEMANTIČKA ANALIZA
FCA (free concept analysis) i LSA (latent semantic analysis) u otkrivanju skrivene informacije u tekstu
ONTOLOGIJA
povezani podaci u jezikoslovlju; CroLLOD u globalnom mrežnom oblaku