Universitetet i Tromsø samarbeider med storbank om dataanalyse

Maskinlæring er den mest moderne formen for dataanalyse, og Universitetet i Tromsø har gjort seg bemerket på området. Santander Consumer Bank tok derfor initiativ til et samarbeid.

mann sitter foran pc

Det er utrolig hva man kan få fram av nyttig informasjon fra et enormt tallmateriale, også kalt Big Data, ved hjelp av matematikk, statistikk, fysikk og dataprogrammering.

For eksempel kan man finne ut mer om risiko knyttet til utlån og nedbetalingsevne gjennom å analysere tall fra en bank. Spørsmålet er bare hvordan man på best mulig måte kommer fram til svaret.

Det ønsker Santander Consumer Bank å finne ut sammen med maskinlæringsgruppa på Institutt for fysikk og teknologi, ved Universitetet i Tromsø, og Norsk Regnesentral.

Nyttig for begge parter

Banken anser maskinlæring som et veldig interessant felt, og ønsker å bli bedre på datanalyse og maskinlæring. De finansierer derfor en nærings-ph.d. ved Universitetet i Tromsø.

– Vi synes den beste fremgangsmåten å bygge kompetanse på, er gjennom et forskningsprosjekt. Vi ser derfor forskningen som en del av en langsiktig strategi for å bygge intern kompetanse og ekspertise innen maskinlæring på feltet kredittrisiko-modellering, forteller Rogelio Andrade Mancicidor i Santander Consumer Bank.

At maskinlæringsgruppa ved universitetet er svært aktiv både i Norge og i utlandet og har gjort seg bemerket i andre maskinlæringsmiljøer, var årsaken til at banken ble oppmerksom på gruppa.

– Det er en unik forskningsgruppe i Norge som har fokus på ulike maskinlærings-algoritmer og metodikker. Derfor tok vi kontakt med gruppeleder Robert Jenssen for å starte forskningsprosjektet, sier Mancicidor.

– Santander tok kontakt med oss fordi de som alle andre banker gjerne vil vite mer om risikoen knyttet til utlån. Ingen banker ønsker å gi lån til noen som ikke kan håndtere nedbetalingen. Banken har allerede modeller i dag som kan fortelle noe, men ønsker en enda grundigere vurdering, forteller førsteamanuensis og leder for maskinlæringsgruppa, Robert Jenssen.

Han mener samarbeidet er nyttig for begge parter.

– Maskinlæringsfeltet drives framover når vi løser reelle problemer. Det er også et felt med konstante forandringer som vi som forskere må henge med på. Derfor er det nyttig å samarbeide tett med andre aktører, mener Jenssen.

illustrasjon av hvordan vi bruker maskinlæring
Maskinlæring er allerede noe vi bruker og har nytte av, men de færreste er klar over det. Illustrasjon: Colourbox.

Maskinlæring bak Siri, Amazon og Netflix

Maskinlæring er et nytt forskningsfelt, men det er i voldsom utvikling og blir stadig viktigere for samfunnet. Faktisk er maskinlæring noe vi alle allerede bruker og har nytte av, men de færreste er klar over det.

Maskinlæring, som er tett knyttet til kunstig intelligens, har blant annet revolusjonert teknologi som ansiktsgjenkjenning, talegjenkjenning, bildeanalyse, maskinoversetting og e-postfiltre.

Har du iPhone så har du kanskje benyttet deg av Siri, talegjenkjenningsprogrammet som gir relevant tilbakemelding på det du spør om. Siri benytter seg av oppslagsverk på internett, og lærer etter hvert som du benytter deg av tjenesten – alt for å gi deg enda bedre brukertilpassede tilbakemeldinger.

Eller du har kanskje logget deg inn i internettbutikken Amazon eller video- og strømmingstjenesten Netflix. Da har du nok opplevd at disse tjenestene foreslår stadig nye bøker og filmer du kan se – og mange ligner søk du allerede har foretatt. Det er avanserte analyseteknikker og maskinlæring som ligger bak også her.

Maskinlæringsfeltet har røtter tilbake til 60-70-tallet og forskning på mønstergjenkjennelse, men det var først på 90-tallet feltet begynte å utvikle seg i den retningen vi ser i dag.

Etterligner hjernens prosesser

Men hva er maskinlæring?

– Du kan sammenligne maskinlæring med hjernen vår – som er det ultimate maskinlæringssystemet. Fra vi er født får vi begrep om omverdenen gjennom sansene, og underveis forteller også andre mennesker oss hva vi opplever, forklarer Robert Jenssen.

Barn som ser en katt får beskjed av foreldrene at det er en katt, og neste gang de ser en katt har de fått mer begrep om hva det er. Helt til de ser en hund, og må lære seg at det er noe annet enn en katt. Etter hvert kategoriserer hjernen informasjonen, slik at barnet erfarer hva som er hund, katt eller noe annet.

– Dette er ikke ulikt måten maskinens systemer lærer, men i stedet for bearbeide informasjon gjennom neuroner og synapser, så benytter vi tall. Svært forenklet kan man si at hunder representeres med kategorien 1 og katter med kategorien 2. Når datamaskinen blir presentert for et bilde av en hund, så skal den – ved å bearbeide bildet (som består av tall) – komme fram til at bildet svarer til kategorien 1, altså en hund. Ved hjelp av mye justering så lærer maskinen etter hvert å gjøre stadig mer komplekse oppgaver, forteller Jenssen.  

Hjelper kreftpasienter

Maskinlæring kan brukes innen flere forskningsfelt: innen biologi kan det benyttes til å kartlegge genomet, innen fiskeri kan det bidra til bedre forvaltning, og beregninger innen klimaforskning.

Det kan også benyttes innen helseforskning for å forutsi sykdom. I dag gjør maskinlæringsgruppen ved Universitetet i Tromsø analyser i samarbeid med gastroavdelingen ved Universitetssykehuset Nord-Norge og Nasjonalt senter for E-Helseforskning. Her prøver man å finne ut hvilke pasienter som har størst risiko for komplikasjoner etter kreftoperasjoner i magen.

Hensikten er å forutsi hvilke pasienter som er i risikosonen for visse typer bivirkninger og tilbakefall. Men det er et enormt materiale å forholde seg til, både blodprøver og journaltekst må gjøres om til tall før man kan begynne å lete etter mønstre. Hver pasient kan representeres med 10 000 tall. Har man 10 000 pasienter, så sier det seg selv at det blir et stort tallmateriale.

– Men det bør være stort for at vi skal ha et godt grunnlag for å finne mønstre, sier Jenssen.

Har gjort seg bemerket

Maskinlæringsgruppa består av flere ph.d-studenter, postdoktorer og en rekke masterstudenter. De siste årene har de gjort seg bemerket innen maskinlæringsfeltet gjennom en rekke internasjonale forskningspriser.

Maskinlæringsruppa har også fått FRIPRO-midler fra Norges forskningsråd for å  utvikle grunnforskningsprosjektet Next Generation Learning Machines.

– Innen maskinlæring er det kort vei fra grunnforskning til anvendt forskning og noe som faktisk kan brukes, sier Jenssen, og legger til: 

– Vi blir jo veldig glade når noe av det vi gjør kan benyttes.

Populært blant studenter

Den store interessen for maskinlæring i samfunnet gjenspeiler seg også blant studentene, der Institutt for fysikk og teknologi sitt maskinlæringkurs på masternivå er blant de største.

Studentrekrutteringen til det mest relevante studiet, nemlig sivilingeniørstudiet i Anvendt fysikk og matematikk med stud ieretning Maskinlæring og statistikk, er også veldig god.

Les mer: 

Av Randi Merete Solhaug, Universitetet i Tromsø
Publisert 2. jan. 2019 11:32 - Sist endret 3. jan. 2019 12:08