Aki adatbázisokból profilozik
Ki az a szakember, aki egy emberölési ügy helyszíni nyomai alapján képes arra, hogy akár több ezer adatbázis használatával felállítsa a gyilkos statisztikai profilját? Használja-e a mesterséges intelligenciát? Ha igen, mire? Hermann Zsombor pszichológus, statisztikus, gépi tanulás szakértő válaszolt.
A magyar rendőrség történetének első profilalkotással és viselkedéselemzéssel foglalkozó csoportja kizárólag kiemelt és erőszakos bűncselekményekkel foglalkozik. A profilalkotás alatt a bűncselekmény helyszínén gyűjtött információk, az ügy körülményei és a sértett ismerete alapján valamilyen módon arra következtetnek az egység tagjai, hogy milyen ember lehet az ismeretlen elkövető. Hermann Zsombor 2021 óta segíti az Országos Rendőr-főkapitányság bűnügyi elemző-értékelő főosztályának profilozóit, idén április 1-je óta pedig a Budapesti Rendőr-főkapitányság kiberbűnözés elleni osztályát is erősíti.
– Pszichológia szakon végeztem. Még az egyetemen ismertem meg a kriminálpszichológia tantárgyat, ezután kapcsolódtam be egy kutatásba a Nemzeti Közszolgálati Egyetemen. Ettől kezdve foglalkoztam számítógépes adatok elemzésével is. Amikor Lohner Klaudia főhadnagy, aki ebben a kutatásban is részt vett, hívott a profilozókhoz, nagyon szívesen kezdtem a csapattal dolgozni. Azonnal egyértelmű volt a számomra, hogy hozzám a statisztikai profilozás áll a legközelebb. Főleg, mert egyik tanáromnak köszönhetően én annyira megszerettem a statisztikát az egyetemen, hogy korábban önszorgalomból is elkezdtem ezzel foglalkozni.
– Miközben az emberek legtöbbjének a statisztika szó a dögunalommal egyenlő…
– Így van. Én meg egy nagyon izgalmas területnek érzem ezt. A feladványt, a kihívást látom abban, hogy egy adatbázisból kinyert adathalmaz alapján milyen új ismeretre tudok szert tenni. Ráadásul egy olyan ismeretre, ami hiánypótló lehet az aktuális nyomozás előrehaladása szempontjából.
– Ez a munka, gondolom, feltételez egy tökéletességre törekvést is az emberben.
– Igen, és precizitást. Technikai oldalról központi fontosságú az adatbázis mérete és minősége. Elegendő mennyiségű és a valóságnak megfelelő ismeret, adat nélkül nem születhet értelmezhető eredmény. Nagyon sokszor szembesülünk azzal, hogy egy ügyben nem minden információ ismert, így van, ami nem kerül be az adatbázisba. Lehet, hogy azért, mert egyszerűen soha nem derítették fel. De az is előfordulhat, hogy senki nem gondolta úgy, hogy az ügy szempontjából fontos lenne. Viszont ha össze akarnák hasonlítani az adott esetet más ügyekkel, akkor már komoly jelentősége lenne a kimaradt információnak.
– Tud erre konkrét példát mondani?
– Például megtörténhet, hogy az elkövetőnek, aki egy szórakozóhelyen erős felindulásból követ el emberölést, szélsőséges politikai nézetei vannak. Lehet, hogy az ügy szempontjából nem tartozik ez a tárgyhoz, mert a helyszínen egy más okból kialakult vita miatt fajult el a helyzet. Tehát senki nem kérdez rá erre, miközben lehet, hogy más szempontból fontos lenne.
– Adott esetben ez motiváció lehet később egy másik bűncselekmény elkövetésénél?
– Előfordulhat, de a legfontosabb az, hogy amire nincs adat, azt nem tudjuk figyelembe venni az összefüggések keresésénél.
– Ez azonban azt is feltételezi, hogy a profilozás egyfajta felvilágosító munkával jár együtt. Külön fel kell hívni a rendőrök figyelmét mindenre, ami fontos lehet ahhoz, hogy minél teljesebbek legyenek az adatbázisok.
– Igen. A mai, felgyorsult világunkban a megbízható, digitális adatrögzítés jelentősége igencsak felértékelődött. Az adatrögzítés precizitása több terület, és kiemelten az elemző-értékelő terület számára igen fontos. Így a profilalkotásban is: már világszerte számos országban, például Kanadában, az Egyesült Államokban, de Magyarországon is létezik egy saját profiladatlap. Hazánkban már a 90-es évek közepe óta, ennek a megújításán is dolgozunk most. Az eredeti változata több mint kétszáz megválaszolandó kérdésből áll, az új kicsit finomra hangoltabb ennél. Nyilván ezen az adatlapon több kérdés tűnhet irrelevánsnak, de előfordulhat, hogy épp ezekből származik egy olyan lényegi információ, ami egy másik ügy megfejtéséhez elengedhetetlen.
– Hogyan fogalmazná meg pontosan, amit profilozóként csinál?
– Az én területem elsősorban az életellenes bűncselekményekre fókuszál. Amikor adott egy helyszín és ismeretlen az elkövető, mi abban próbálunk segíteni, hogy leszűkítsük a gyanúsítottak körét. Az én tevékenységemet úgy lehet a legegyszerűbben összefoglalni, hogy adottak a helyszínen rögzített nyomok, sértetti jellemzők, tanúvallomások és egyéb elérhető információk. Én ezek alapján különböző statisztikai eljárásokkal a lehetséges elkövetőnek különböző jellemzőit próbálom megbecsülni. Nyilván ehhez hozzátartozik az is, hogy van, amit pontosabban meg lehet mondani, van, amit pedig kevésbé.
– Az adatbázis Magyarországra koncentrálódik?
– Az országok közötti szociokulturális és egyéb különbségek, a bűnözés speciális hazai jellemzői miatt nem tudjuk más ország adatait közvetlenül felhasználni. Ugyanakkor nagyon izgalmas megvizsgálni a különböző államok adatbázisai közötti hasonlóságokat és különbségeket. Plusz borzasztóan fontos, hogy milyen módszereket használunk. Tanuló algoritmusokkal dolgozunk, ami a mesterséges intelligenciának egy része. Ezek a módszerek folyamatosan fejlődnek, évente vagy akár naponta olyan előrelépések történnek, amelyekre figyelni kell.
– Mit gondol, komoly veszélyt jelent a profilozók számára a mesterséges intelligencia?
– A mesterséges intelligencia még nem tart ott, hogy veszélyt jelentsen. Pontosabban a profilozás szempontjából a szakmai előzmény és az utómunka is borzasztóan fontos. Nem gondolom, hogy ezt és az emberi tényező szerepét tudná helyettesíteni. Valamilyen szinten, ahogy az előbb is mondtam, mi is a mesterséges intelligenciával dolgozunk. Ezt inkább egy eszközként, egy összetett elemzési folyamat részeként érdemes felfogni, amiből a lehető legtöbbet kell kihozni.
– Rengeteg könyvben, filmben, sorozatban köszön vissza az, amivel foglalkozik. Van ezek közül, amit valamiért kedvel?
– A Gyilkos elméket az elsőtől az utolsó részig láttam. De a BBC Sherlock Holmes-sorozatát is. A szakterületem a statisztikai adatbázisokból dolgozik. Ez egy letisztított forma. Itt számok szerepelnek, egyesek, nullák, különböző jellemzők, de nincs az az emberi színesség, mint ami a könyvekben, sorozatokban tapasztalható.
– Elég sajátos lehet a munkája. Ha jól értem, van olyan helyzet, amikor teljesen függetlenítenie kell magát az emberi tényezőtől. Máskor pedig úgy kell értékelnie az adatokat, hogy végig szem előtt kell tartania, emberek állnak a száraz számok mögött?
– Igazából az én munkakörömhöz hasonló statisztikai profilalkotás zajlik bármilyen piaci környezetben, ahol például fogyasztói szokások alapján vásárlók csoportjait szeretnék meghatározni. Például ki mennyi pénzt fog költeni egy termékre. Az én munkám sajátossága, és nyilván a megterhelő része is az, hogy itt minden egyes sor az adatbázisban egy emberi élet végét jelenti.
– Mert alapvetően emberölésekkel foglalkozik.
– Elsősorban igen, de dolgozunk szexuális bűncselekményekkel is. Az én munkám olyan szempontból különleges, hogy gyakorlatilag, amire van adat, azzal tudunk dolgozni. Függetlenül attól, hogy milyen jellegű a vizsgált bűncselekmény. Nyilván, amit én csinálok, az nem létezik önmagában. Borzasztóan fontos, hogy ez csak egy megközelítés, az egységnél dolgozó többi kollégám – akár pszichológiai, kriminológiai, pszichiátriai, rendőrszakmai – vizsgálata mellett. Amikor megkapunk egy ügyet, felteszünk egy kérdést, hogy mire vagyunk kíváncsiak, miről gyűjtünk adatokat. Tudjuk, hogy ha kihagyunk, akár csak egyetlen szempontot is, lehet, hogy összedől az egész munkánk, és nem találjuk meg azt az összefüggést, amit keresünk. Amikor pedig kijön egy eredmény, azt minden esetben egységesen értelmezzük, értékeljük. Plusz arról is együtt döntünk, hogy azt hogyan illeszthetjük be szakmailag az ügybe.
– Ezt úgy kell elképzelni, hogy menet közben gépi tanulás szakértőként tulajdonképp folyamatosan pontosítania kell az adatokat, állítani a szoftveren, hogy a számítógép az adatbázisból felismerje az összefüggéseket?
– Pontosan. Igen, tanítjuk a számítógépet, hogy felismerje az összefüggést. Rengeteg mindent lehet rajta állítani, a legeslegapróbb részletekig lehet ezeket finomhangolni, és arra rátalálni, hogy az adott helyzetben vajon mi fog működni. Ugye a világban megvannak, hogy melyek a legnépszerűbb algoritmusok, de mégis mindenkinek a saját adataihoz kell igazítania ezeket. Az pedig hihetetlenül izgalmas folyamat, amikor letöltök egy szoftvert, belépek a beállításába, és mindent egy kicsit átkattintok. Ráérezni, eldönteni, hogy nekem ez nem kell, ez meg igen. Majd szembesülni azzal, hogy amit kigondoltam, működik.
– Lohner Klaudia főhadnagy, az egység csoportkoordinátora egy korábbi interjúban beszélt egy ügyről, amelyben egy vidéki helységben nagyon brutális módon otthon öltek meg egy idős asszonyt, aki hosszas haláltusa után vesztette életét. Ez olyan ügy volt, amelyben az eljárás elején rögtön bevonták a profilozókat is a folyamatokba. Elutaztak a helyszínre. Ahogy visszaértek, elkezdték az elemzést. A pszichológus kidolgozta az elkövető pszichológiai profilját. A nyelvész a vallomások elemzésével foglalkozott közben. A helyszínről küldött adatokból Zsombor a statisztikai profilt készítette el…
– Ez valóban nagyon fontos ügyünk volt. Időközben bejött a helyszínen rögzített DNS-vizsgálat eredménye, amellyel megtalálták a tettest. Ekkor mi már felállítottunk egy kriminológiai, pszichológiai, statisztikai profilt, ami szinte egy az egyben ráillett az elkövetőre. A statisztikában ez volt talán az első eset, hogy megalkottuk a teljes profilját a tettesnek. Nem egyszerű egyértelműen eldönteni a meglévő adatbázisok alapján, hogy mi az az adat, ami pontos és megbízható, és mi az, ami nem. Önmagában ez volt nagyon izgalmas feladat. Itt is megvolt, hogy leültem, és nem volt egy nagy, piros gomb, amire rányomtam, majd megoldotta a gép magától a feladatot. Sok adatbázisokkal végzett munka és a matematikai-statisztikai összefüggések átlátása és megértése szükséges ahhoz, hogy a megfelelő eredményt nyerjük ki és a minimálisra csökkentsük a hibázási lehetőséget. Nekem végig kellett játszani, mikor mit kell átállítani a beállításokon ahhoz, hogy választ kapjunk a kérdéseinkre. Nagyon izgalmas pont volt összevetni a pszichológiai, a kriminológiai és a statisztikai profilt, és a bűnügyi elemzés eredményeit, hogy mennyire szépen illeszkednek egymáshoz.
– Mi jött ki pontosan a feltételezett elkövetőről?
– Erről nem beszélhetek.
– Sokat beszéltünk a munkája lényegéről, de arról nem, hogy emellett mennyire fontos, fontos-e fogvatartottakkal is kapcsolatba kerülnie.
– A szakmai gyakorlatomat az Igazságügyi Megfigyelő és Elmegyógyító Intézetben töltöttem. Ez még a mesterképzésem végén volt. Biztos vagyok benne, ahhoz, hogy valaki profilozó legyen, akkor is, ha statisztikai adatokkal dolgozik, ahogy én, fontos megismerni az emberi oldalt is. Nemcsak átolvasni az ügyek aktáit, az elkövetőkről szóló információkat vagy épp a vallomásokat, de akár elmenni a börtönökbe is, és látni, hogy a letisztult számok, amik nekem kijönnek, a valóságban mit jelentenek. Ahhoz, hogy én értelmezni tudjam az adatokat, elengedhetetlen ismernem a hús-vér valóságot.
P. GÁL JUDIT
FOTÓ: FRANCZ ILONA