Máltøknidepilin lagt føroysk úrslit fram í Italia
GPT4 megnar næstan líka so væl sum menniskju, ið duga føroyskt, at skyna á, um føroyskar tíðindagreinar eru positivar ella negativar. Hetta er millum kanningarúrslitini, sum granskarar á Máltøknideplinum á Fróðskaparsetri Føroya og Háskóla Island, hava lagt fram á máltøkniráðstevnu í Torino
Starvsfólk á Máltøknideplinum á Setrinum hava verið á stóru ráðstevnuni LREC-COLING2024 í Torino í Italia frá 20. til 25. mai.
Ráðstevnan var í ár ein samanrenning av tveimum ráðstevnum, LREC (Language Resources and Evaluation Conference) og COLING (International Conference on Computational Linguistics). Talan er um eina risastóra vísindaliga stevnu, sum í ár hevði næstan 3.000 luttakarar og 1.500 framløgur. Á skránni vóru fyrilestrar og framløgur um alskyns evni og ta nýggjastu granskingina í máltøkni og teldufrøðiligum málvísindum.
Starvsfólkini á Máltøknideplinum á Setrinum løgdu seg serliga eftir at fáa nýggja vitan um teldutýðing, dátutilgerð, talutøkni, marking av dátum og meting av málmyndlum, sum eru teirra dagligu granskingarøki.
Fróðskaparsetur Føroya hevði tvær framløgur á skránni.
Barbara Scalvini, adjunktur í teldufrøði á Náttúruvísindadeildini, og Iben Nyholm Debess, phd.-vísindastarvsfólk á Føroyamálsdeildini og samskipari á Máltøknideplinum, løgdu fram um greinina “Evaluating the potential of language-family-specific generative models for low-resource data augmentation: a Faroese case study”.
Í hesi greinini hava tær kannað, hvussu GPT-SW3, ið er ein generativur málmyndil fyri norðurlendsk mál, skilir føroyskt, sum er eitt mál við lítlum tilfeingi. Úrslitini vísa m.a., at myndilin vísir sum heild góðar førleikar og góð málslig atlit at teldutýðing úr føroyskum. Hesi úrslit hava lagt lunnar undir víðari menning av myndlinum at nýta til teldutýðing í føroyskum høpi.
Tann greinin kann lesast her.
Eisini løgdu Iben Nyholm Debess frá Setrinum og Annika Simonsen og Hafsteinn Einarsson frá Háskóla Íslands fram um greinina “Good or Bad News? Exploring GPT-4 for Sentiment Analysis for Faroese on a Public News Corpus”.
Her hava tey kannað, um og hvussu GPT-4, ið er ein stórmálmyndil (Large Language Model - LLM), mentur av fleiri ymsum málum, skilir "lyndi" í føroyskum tíðindagreinum. Altso verða søgurnar mettar at vera positivar, neutralar ella negativar? Og úrslitið av hesi lutfalsliga lítlu kanningini geva greiða ábending um, at GPT-4 dugir rættiliga væl at meta um "lyndi" í tekstum á føroyskum máli.
Tá tey samanbóru "lyndis"-metingarnar av tíðindasøgunum, sum GPT-4 kom við, við somu metingar, sum tvey menniskju gjørdu hvør í sínum lagi av somu tekstum, samsvaraðu úrslitini væl.
Eitt sekundert úrslit, sum dagaði fram av hesi kanningini, er, at munandi fleiri av útlendsku tíðindasøgunum vóru negativar sammett við tíðindasøgurnar um heimlig viðurskifti í Føroyum. Tilsamans 170 greinar hjá ávikavist Portalinum og Dimmalætting vórðu greinaðar.
Lesið greinina her.
Tey á Máltøknideplinum siga annars, at ráðstevnan í Torino gav teimum nógva nýggja vitan, hugskot og faklig sambond, sum fara at menna virksemið í komandi tíðum.
- 19.11.2024 Setrið NámsvísindadeildinBókaútgáva: Kommunur í eini broytingartíðSámal Matras Kristiansen, samfelagsfrøðingur og námslekta...
- 14.11.2024 SetriðLandsstýrismaðurin skoðar umvælingina á FrælsinumMánadagin 11. november 2024 var Djóni Nolsøe Joensen, lan...
- 13.11.2024 Setrið Søgu- og samfelagsdeildinSmá men kná - ein greining av treysti í mikrosamfelagnumFøroyar kláraðu seg lutfalsliga væl gjøgnum koronakreppun...