Šis multimodalinis metodas, jungiantis du skirtingus duomenų šaltinius, leidžia tiksliau ir objektyviau analizuoti emocinę būklę, atverdamas galimybes naujam depresijos diagnostikos etapui.
KTU mokslininkai sukūrė dirbtinio intelekto įrankį depresijos diagnostikai
Depresija – vienas iš dažniausiai pasitaikančių psichikos sveikatos sutrikimų. Pasaulyje net 280 milijonų žmonių yra paveikti šios diagnozės, todėl Kauno technologijos universiteto (KTU) tyrėjai sukūrė dirbtinio intelekto (DI) modelį, padedantį atpažinti depresiją remiantis tiek kalbos, tiek smegenų veiklos duomenimis.
„Depresija yra vienas labiausiai paplitusių psichikos sutrikimų, sukeliančių skaudžias pasekmes tiek individui, tiek visuomenei, todėl kuriame naują, objektyvesnį diagnostikos būdą, kuris ateityje galėtų tapti prieinamas kiekvienam“, – sako KTU profesorius ir vienas iš išradimo autorių Rytis Maskeliūnas.
Nors daugelis depresijos diagnostikos tyrimų tradiciškai remiasi vienu duomenų tipu, mokslininkų teigimu, naujasis metodas, atsižvelgiantis į kelis aspektus, suteikia daugiau informacijos apie žmogaus emocinę būklę.
Įspūdingas tikslumas, naudojant balso ir smegenų veiklos duomenis
Toks kalbos ir smegenų veiklos duomenų derinys depresijos diagnostikoje pasiekė įspūdingą 97,53 proc. tikslumą, ženkliai viršydamas alternatyvių metodų rezultatus. „Taip yra todėl, kad balsas tyrimą papildo tokiais duomenimis, kurių negalime ir dar nemokame išgauti iš smegenų“, – aiškina R. Maskeliūnas.
Musyyab Yousufi, KTU doktorantas, prisidėjęs prie šio išradimo kūrimo, teigia, jog duomenų pasirinkimas buvo detaliai apmąstytas: „Nors galima manyti, jog, pavyzdžiui, veido išraiškos atskleidžia daugiau apie žmogų, balsą pasirinkome, nes jo pokyčiai gali subtiliai atskleisti emocinę būklę, diagnozei paveikiant kalbos tempą, intonaciją ir bendrą energiją, o minėtosios veido išraiškos gali būti labiau kontroliuojamos“.
Be to, tyrėjai suprato, jog retas depresija sergantis pacientas norėtų savo veido įrašu dalintis viešai. Priešingai nei smegenų elektrinės veiklos (EEG) ar balso duomenys, veidas – tiesiogiai asmenį identifikuojanti informacija.
„Negalime pažeisti pacientų privatumo, o ir tolimesniam naudojimui mūsų pasirinktų duomenų derinimas yra perspektyvesnis“, – tvirtina KTU informatikos fakulteto (IF) profesorius.
Mokslininkas pabrėžia, jog jie nėra medicinos ekspertai, todėl tyrimo atlinkti tiesiogiai su pacientais negali. Dėl šios priežasties visi duomenys buvo gauti iš MODMA (angl. Multimodal Open Dataset for Mental Disorder Analysis) duomenų rinkinio. EEG duomenys buvo renkami ir įrašinėjami penkias minutes, dalyviams būnant budriems, ramybės būsenoje, užmerkus akis ir nejudant.
Atliekant garso tyrimo eksperimentines užduotis pacientai dalyvavo klausimų ir atsakymų sesijoje bei keliose veiklose, orientuotose į skaitymą ir paveikslėlių apibūdinimą, siekiant užfiksuoti jų natūralią kalbą ir kognityvinę būklę.
DI turės išmokti diagnozę pagrįsti
Surinkti EEG ir garso signalai buvo transformuoti į spektrogramas, leidžiančias duomenis pavaizduoti vizualiai. Kad šiuos duomenis būtų galima palyginti, buvo pritaikyti specialūs filtrai triukšmui pašalinti ir panaudotas modifikuotas „DenseNet-121“ giluminio mokymosi modelis, gebantis atpažinti depresijos požymius vaizduose. Kiekvienas vaizdas atspindėjo signalų pokyčius laikui bėgant, EEG parodė smegenų veiklos bangų formas, o garsas – dažnių ir intensyvumo pasiskirstymą.
Į šį modelį buvo įtrauktas pasirinktinis klasifikavimo sluoksnis, apmokytas skirstyti duomenis į sveikų arba depresija sergančių žmonių klases. Vertinant sėkmingą klasifikaciją ir buvo įvertintas programos tikslumas.
Ateityje šis DI modelis galėtų pagreitinti depresijos diagnostiką ar ją net paversti nuotoline bei sumažinti subjektyvių vertinimų riziką. Tam reikalingi tolimesni klinikiniai tyrimai bei programos tobulinimai, tačiau R. Maskeliūnas teigia, jog susiduriama ir su iššūkiais.
„Pagrindinė tokių tyrimų problema – duomenų trūkumas, nes žmonės nenori atsiverti, dalintis“, – teigia jis.
Kitas svarbus KTU Multimedijos inžinerijos katedros profesoriaus paminėtas aspektas yra tai, jog nepakanka vien gero tikslumo sukurtam DI algoritmui, nes gydytojas turi suprasti, kas lėmė tokį diagnostinį rezultatą. „Algoritmas dar turi išmokti suprantamai paaiškinti diagnozę“, – šypsosi mokslininkas.
R. Maskeliūno teigimu, su šia problema susiduriama ne vienoje srityje dėl didėjančio poreikio taikyti DI ten, kur priimami sprendimai tiesiogiai veikia žmones, pavyzdžiui, sveikatos priežiūroje, finansuose ir teisinėje sistemoje.
Todėl dabar populiarėja XAI (angl. explainable artificial inteligence) paaiškinamoji dirbtinio intelekto technologija, siekianti naudotojui atskleisti, kodėl modelis priima konkrečius sprendimus, taip padidinanti pasitikėjimą DI.
Straipsnis „Multimodal Fusion of EEG and Audio Spectrogram for Major Depressive Disorder Recognition Using Modified DenseNet121“ paskelbtas žurnale „Brain Sciences“ ir jį galima rasti čia.
Nuotrauka: www.freepik.com