Téma diplomovej práce

Modelovanie morfologie podstatnych mien v slovencine pomocou neuronovej siete.

Zadanie: Navrhnite model doprednej neuronovej siete, ktora bude generovat spravne tvary podstatnych mien v zavislosti od pozadovaneho padu. Analyzujte spravanie siete pocas ucenia a po nauceni a porovnajte ho s vyvojom ludskej reci u dietata. Implementujte model tak, aby bol pouzitelny aj pod OS Linux.

Blizsi popis: Vdaka svojej morfologickej bohatosti je slovencina velmi dobrym kandiadatom na testovanie schopnosti neuronovej siete zvladnut ulohu sklnovania substantiv. Drviva vacsina doterajsich prac z oblasti modelovania prirodzenejo jazyka bola zamerana na anglictinu, konkretne v morfologii na slovesa (ucenie minuleho casu pravidelnych a nepravidelnych slovies), pretoze morfologia podstatnych je v podstate velmi jednoducha. V slovencine (ako aj ostatnych slovanskych jazykoch) je morfologicka stavba substantiva dolezitym zdrojom informacie pre syntakticku a semanticku analyzu vety (zatial co spominana anglictina sa pritom skor opiera o poradie slov v vete). Modelovanie morfologie mozno z matematickeho hladiska chapat ako hladanie zobrazenia medzi vstupom (podstatne meno v prvom pade) a vystupom (sklonovany tvar), co je typ ulohy typicky vhodny pre neuronovu siet. Sucasne, modelovanie kognitivnej ulohy pomocou neuronovej siete predstavuje pokus vysvetlit takyto proces u ludskeho jedinca. Preto je pri modelovani zaujimave analyzovat, ake typy chyb neuronova siet robi, a porovnat ich s chybami u dietata.

Stav prace: Precital som niekolko textov tykajucich sa mojej diplomovky. Hlavne ako postupovali pri tvorbe podobneho programu v inych jazykoch. Nasiel som tam naznaky, ze neuronova siet, je na riesenie tohto problemu lepsia ako exaktny postup napriklad pomocou expertneho systemu. Zacal som pracu na projekte tym, ze som vytvoril program, ktory sklonuje podstatne mena, ak mu zadam vzor(*1). Zatial nadalej pracujem na tvorbe vstupu na ucenie neuronovej siete. Mam k dipozicii program (diplomova praca jednej studentky fmfi uk), ktory zo slova urobi jeho foneticky prepis. Druha alternativa je dat to urobit do SAV, kde mi poskytli moznos dat si nejaky slovnik prelozit do fonem. Asi sa na zaciatok chopim druhej moznosti. Ked bude praca hotova, tak budem potrebovat aj online prekladac. Dalsi preblem, ktoremu sa venujem je reprezentacia slova (vo fonemach) ako vstupu do neuronovej siete. Asi pouzijem CCV model. Este neviem, ci budem pouzivat fonemy prepisane binarne, alebo ako realne cislo.

poznamky:
(*1):Vzory z knihy Sapfo, 130 vzorov.

Literatura: Sapfo, Emil Páleš, VEDA ,Bratislava 1994

Linky:
Brian MacWhinney, Professor of Psychology, Carnegie Mellon University: Language learning: Cues or rules?
Prehladovky
Prehladova kapitola a fonemach
Prehladova kapitola o podstatnych menach
Fonemy ktore pouzivam
Priloha1
Priloha2