Máltøknidepilin Og Onnur Á Ráðstevnu Í Italia Mai 2024 Dávid Á Lág Annika Simonsen Barbara Scalvini Og Iben Nyholm Debess
Dávid á Lág, ph.d.-vísindastarvsfólk á Náttúruvísindadeildini, Annika Simonsen, granskari á Háskóla Islands, Barbara Scalvini, adjunktur á NVD, og Iben Nyholm Debess, ph.d.-vísindastarvsfólk og samskipari á Máltøknideplinum á Setrinum
06.06.2024
Setrið Føroyamálsdeildin Náttúruvísindadeildin
Skriva út

Máltøknidepilin lagt føroysk úrslit fram í Italia

GPT4 megnar næstan líka so væl sum menniskju, ið duga føroyskt, at skyna á, um føroyskar tíðindagreinar eru positivar ella negativar. Hetta er millum kanningarúrslitini, sum granskarar á Máltøknideplinum á Fróðskaparsetri Føroya og Háskóla Island, hava lagt fram á máltøkniráðstevnu í Torino

Starvsfólk á Máltøknideplinum á Setrinum hava verið á stóru ráðstevnuni LREC-COLING2024 í Torino í Italia frá 20. til 25. mai.

Ráðstevnan var í ár ein samanrenning av tveimum ráðstevnum, LREC (Language Resources and Evaluation Conference) og COLING (International Conference on Computational Linguistics). Talan er um eina risastóra vísindaliga stevnu, sum í ár hevði næstan 3.000 luttakarar og 1.500 framløgur. Á skránni vóru fyrilestrar og framløgur um alskyns evni og ta nýggjastu granskingina í máltøkni og teldufrøðiligum málvísindum. 

Starvsfólkini á Máltøknideplinum á Setrinum løgdu seg serliga eftir at fáa nýggja vitan um teldutýðing, dátutilgerð, talutøkni, marking av dátum og meting av málmyndlum, sum eru teirra dagligu granskingarøki. 

Fróðskaparsetur Føroya hevði tvær framløgur á skránni.

Barbara Scalvini, adjunktur í teldufrøði á Náttúruvísindadeildini, og Iben Nyholm Debess, phd.-vísindastarvsfólk á Føroyamálsdeildini og samskipari á Máltøknideplinum, løgdu fram um greinina “Evaluating the potential of language-family-specific generative models for low-resource data augmentation: a Faroese case study”.

Í hesi greinini hava tær kannað, hvussu GPT-SW3, ið er ein generativur málmyndil fyri norðurlendsk mál, skilir føroyskt, sum er eitt mál við lítlum tilfeingi. Úrslitini vísa m.a., at myndilin vísir sum heild góðar førleikar og góð málslig atlit at teldutýðing úr føroyskum. Hesi úrslit hava lagt lunnar undir víðari menning av myndlinum at nýta til teldutýðing í føroyskum høpi.

Tann greinin kann lesast her.

Eisini løgdu Iben Nyholm Debess frá Setrinum og Annika Simonsen og Hafsteinn Einarsson frá Háskóla Íslands fram um greinina “Good or Bad News? Exploring GPT-4 for Sentiment Analysis for Faroese on a Public News Corpus”.

Her hava tey kannað, um og hvussu GPT-4, ið er ein stórmálmyndil (Large Language Model - LLM), mentur av fleiri ymsum málum, skilir "lyndi" í føroyskum tíðindagreinum. Altso verða søgurnar mettar at vera positivar, neutralar ella negativar? Og úrslitið av hesi lutfalsliga lítlu kanningini geva greiða ábending um, at GPT-4 dugir rættiliga væl at meta um "lyndi" í tekstum á føroyskum máli.

Tá tey samanbóru "lyndis"-metingarnar av tíðindasøgunum, sum GPT-4 kom við, við somu metingar, sum tvey menniskju gjørdu hvør í sínum lagi av somu tekstum, samsvaraðu úrslitini væl.

Eitt sekundert úrslit, sum dagaði fram av hesi kanningini, er, at munandi fleiri av útlendsku tíðindasøgunum vóru negativar sammett við tíðindasøgurnar um heimlig viðurskifti í Føroyum. Tilsamans 170 greinar hjá ávikavist Portalinum og Dimmalætting vórðu greinaðar.

Lesið greinina her.

Tey á Máltøknideplinum siga annars, at ráðstevnan í Torino gav teimum nógva nýggja vitan, hugskot og faklig sambond, sum fara at menna virksemið í komandi tíðum.