Kuva luotu Midjourney-tekoälyllä
Digitaalisuus

Jyväskylän yliopiston tutkimus: Tekoäly ei tarvitse syväoppimista

17.8.2023 12:57
Mikko Perttunen
Tutkijoiden mukaan yksinkertaisempi tekoäly on eettisempi ja ympäristöystävällisempi.

Tekoälyn viimeaikainen menestys perustuu keskeisesti yhteen koneoppimistekniikkaan: syväoppimiseen. Syväoppimisella tarkoitetaan sellaisia tekoälymenetelmiä, jotka hyödyntävät lukuisia neuroverkkokerroksia ja massiivisten aineistojen prosessointia, jonka avulla verkot niin sanotusti opetetaan eli saatetaan käyttökuntoon.

Syväoppimista käytetään erityisesti, kun tietokonetta opetetaan ratkaisemaan vaativia tehtäviä, kuten esimerkiksi tuottamaan uusia sisältöjä, ohjaamaan autoja ja robotteja tai vaikkapa pelaamaan monimutkaisia strategiapelejä. Syväoppimismallit ovat viime aikoina tulleet ihmisille tutuksi esimerkiksi chatGPT:n myötä, vaikka ne ovat käytössä paljon laajemminkin.

Jyväskylän yliopistossa tutkijat yksinkertaistivat tekoälyä 1700-luvun matematiikan avulla. Tutkijoiden mukaan perinteiset matemaattiset optimointimenetelmät toimivat yksinkertaisen tekoälyn kouluttamisessa paremmin kuin 2000-luvulla kehitetty syväoppiminen.

Professori Tommi Kärkkäinen ja väitöskirjatutkija Jan Hänninen tutkivat Jyväskylän yliopistossa itseoppivia menetelmiä ja saivat kuusi vuotta sitten yllättäviä tuloksia, joiden mukaan syväoppimisen ydintä, monimutkaisia neuroverkkorakenteita, ei välttämättä tarvita. Parempia tuloksia saadaan aikaan yhdistämällä yksinkertaisia verkkorakenteita uudella tavalla.

Syväoppimismenetelmien käyttö on aina hyvin monimutkainen ja virhealtis savotta.
MAINOS

– Syväoppimismenetelmien käyttö on aina hyvin monimutkainen ja virhealtis savotta. Tämä tekee malleista väistämättä raskaita ja vaikeasti hahmotettavia. Uusi neuroverkkojen mallimme on ilmaisuvoimaisempi ja pystyy merkittävästi tiivistämään laajoja tietoaineistoja, Kärkkäinen kuvailee tutkimustuloksia tiedotteessa.

Uuden tekoälyn rakenne pohjautuu 1700-luvun matematiikkaan, mutta Kärkkäisen ja Hännisen mukaan myös perinteiset 1960- ja 1970-luvuilla esitetyt matemaattiset optimointimenetelmät toimivat yksinkertaisemman tekoälyn opettamisessa jopa paremmin kuin 2000-luvun syväoppiminen.

Yksinkertaisempi tekoäly on myös eettisesti ja ympäristöllisesti kestävämpi.

– Mitä läpinäkyvämpi ja yksinkertaisempi tekoäly on, sitä helpompaa on tarkastella sen käytön eettisiä näkökulmia. Vaikkapa lääketieteen sovelluksissa syväoppimismalleja ei voida laajasti hyödyntää, koska potilasturvallisuutta ei voi varmasti arvioida, Kärkkäinen toteaa.

Yksinkertaisemmat mallit säästävät resursseja eli kuluttavat esimerkiksi vähemmän sähköä ja ovat näin ympäristöystävällisempiä.

MAINOS
MAINOS