Proteverb – Pravni, etični in tehnološki vidiki obdelave besedilnih in govornih virov podatkov za znanstvene, raziskovalne in razvojne namene
O PROJEKTU
Slovenščina je z vidika razvoja jezikovnih tehnologij jezik, za katerega je na voljo malo digitalnih virov. Zaradi tega sta sodobno raziskovanje s perspektive računalniške znanosti in razvoj produktov, ki temeljijo okrog procesiranja naravnega jezika, bistveno počasnejša kot to velja za jezike z veliko digitalnimi viri. Za ustrezno pridobivanje jezikovnih virov in sekundarno uporabo slednjih v čimbolj naravni obliki, ki zaradi tega lahko vsebujejo tudi nekatere osebne podatke, pa je pomembno interpretiranje Splošne uredbe o varstvu podatkov (GDPR) in izjem prav za raziskovalne namene. Prav tovrstna odstopanja omogočajo doseganje posebnih namenov, na katere se veže tudi pričujoči ciljni raziskovalni projekt, ki bo prvikrat v slovenskem prostoru sistematično naslovil pridobivanje in obdelavo (osebnih) podatkov na način, ki so v interesu znanosti in tako prek apliciranja v obliki pilotnega projekta prispeval k razvoju slednje, kot tudi gospodarstva na podlagi novih spoznanj in praks.
Raziskovalni projekt bo združil, prepletel in poglobil znanje več različnih znanstvenih ved tako z družboslovnega kot tudi naravoslovnega in tehničnega področja ter humanistike. Tovrstno součinkovanje je ključno za zagotovitev, da se napredek v tehnološkem razvoju osmisli ter regulira tako, da se maksimira družbena korist in da se hkrati minimizirajo negativni učinki v obliki posegov v etične in pravne standarde ter človekove pravice. Tak vsestranski pristop je edini način, da koncept odprte znanosti zaživi kar v največji meri.
Raziskovalni projekt bo združil, prepletel in poglobil znanje več različnih znanstvenih ved tako z družboslovnega kot tudi naravoslovnega in tehničnega področja ter humanistike. Tovrstno součinkovanje je ključno za zagotovitev, da se napredek v tehnološkem razvoju osmisli ter regulira tako, da se maksimira družbena korist in da se hkrati minimizirajo negativni učinki v obliki posegov v etične in pravne standarde ter človekove pravice. Tak vsestranski pristop je edini način, da koncept odprte znanosti zaživi kar v največji meri.
Projekt bo primarno pomembno prispeval k razvoju treh vej znanosti, in sicer prava, informatike in računalništva ter humanistike.
Pri vseh treh področjih znanosti bo omogočen takojšnji prenos ugotovitev in znanj v pedagoški proces na domačih in tujih univerzah, tako preko sodelovanja študentov pri razvijanju zgoraj omenjenih tehnologij kot pri poučevanju, ki ga izvajajo raziskovalci, udeleženi pri tem projektu, ki so hkrati profesorji na različnih fakultetah.
Akademski rezultati tega projekta bodo premostili ključne ovire za napredek znanosti, ki stremi k optimizaciji uporabe podatkov za raziskovalne namene brez kršitev pravnih standardov ter človekovih pravic.
Tip projekta: CRP
Šifra projekta: V5-2265
Trajanje projekta: 1. 10. 2022 – 31. 3. 2025
VSEBINA PROJEKTA
VSEBINA PROJEKTA:
Ciljni raziskovalni projekt bo razdeljen v več faz:
- Preučili bomo pravni okvir obdelave podatkov v raziskovalni-znanstvene namene. Izhodišče bosta predstavljala Splošna uredba in ZVOP-1, ki ju bomo nadgradili s primerjalnopravno analizo in spremljanjem razvoja zakonodajnega predloga ZVOP-2.
- Preučili bomo dosedanje prakse zbiranja podatkov v znanstveno-raziskovalne namene, zanimalo nas bo tako dostopanje do podatkov raziskovalcev in raziskovalnih organizacij kot tudi izkušnje z deljenjem podatkov javnih organov in institucij (npr. sodišč). Identificirali bomo ključne dejavnike tveganj, ki so onemogočali dostop do podatkov v preteklosti, da bi izoblikovali protokol za varovanje zasebnosti tekom obdelovanja podatkov za znanstveno-raziskovalne
- v okviru projekta bodo razviti postopki za ustrezno dostopanje do podatkov in anonimizacijo podatkov, ki bo temeljila na prilagoditvi in izboljšanju obstoječih anonimizatorjev. Oblikovali bomo priporočila glede metod biometrične anonimizacije zvočnih govornih posnetkov, ki temeljijo na metodah strojnega učenja, z namenom zmanjšanja vplivov na zanesljivost samodejnih razpoznavalnikov govora.
Z uporabo protokola za varovanje zasebnosti in postopkov za dostopanje do podatkov, vključno z anonimizacijo, bomo poskusili pridobiti podatke (pilot). Pilotni del raziskave bo obsegal pripravo potrebnih podlag za prevzem podatkov, prevzem podatkov, anonimizacijo podatkov ter ureditev dokumentacije, postopkov in pravil za potrebe obdelave podatkov v okviru raziskovalne inštitucije. Na podlagi podatkov, pridobljenih za pilotni del ciljnega raziskovalnega projekta bomo specializirali anonimizator besedil kot tudi razpoznavalnik govora za slovenski jezik.
VODJA PROJEKTA IN KONZORCIJSKI PARTNERJI
Vodja projekta je Inštitut za kriminologijo pri Pravni fakulteti v Ljubljani.
Partnerji konzorcija:
Univerza v Ljubljani, Fakulteta za računalništvo in informatiko Univerza v Ljubljani, Fakulteta za elektrotehniko Institut “Jožef Stefan”
Člani raziskovalnega projekta

Aleš Završnik
vodja projekta
Simon Dobrišek
Fakulteta za elektrotehniko, Univerza v Ljubljani

Kristina Lazarevič Padar
Marko Bajec
Fakulteta za računalništvo in informatiko, Univerza v Ljubljani

Iva Ramuš Cvetkovič

Saša Krajnc
Simon Krek
Inštitut “Jožef Štefan”
REZULTATI IN DOSEŽKI PROJEKTA
Izvirni znanstveni članek
-
ZAVRŠNIK, Aleš. Criminal Justice, Artificial Intelligence Systems, and Human Rights. Ûridičeskie nauki i obrazovanie. 2023, no. 70, pp. 150-164. ISSN 2304-1730. [Online]: http://www.iolr.org/wp-content/uploads/2023/04/Zavrsnik-A.-Criminal-justice….pdf. [COBISS.SI-ID 159764739]
-
ZAVRŠNIK, Aleš, RAMUŠ CVETKOVIČ, Iva, LAZAREVIČ PADAR, Kristina, STARIHA, Andraž. Data Control and Research in Criminology. Journal of Criminal Investigation and Criminology. Jan.-Mar. 2024, vol. 75, no. 1, pp. 72-89. ISSN 0034-690X. [COBISS.SI-ID 192594691]
Strokovni članek
- ZAVRŠNIK, Aleš. Artificial Intelligence in Criminal Justice: Impact on Human Rights. Pravo i pravda: Journal of Legal Theory and Practice. 2023, vol. 21, no. 1, pp. 173-192. ISSN 1512-8571. [COBISS.SI-ID 155372291]
Prispevek na konferenci brez natisa
- ŠARF, Pika. Tanka meja med osebnim in anonimiziranim podatkom v digitalni dobi : predavanje, Konferenca prava varstva osebnih podatkov, Portorož, 15. november 2022. [COBISS.SI-ID 150492163]
- ZAVRŠNIK, Aleš. Artificial intelligence and criminal justice : predavanje, International Scientific and Practical Conference “Digital Forensics in the Modern World: Problems of Theory and Practice”, Taškent, 5. 5. 2023. [COBISS.SI-ID 159767299]
- ZAVRŠNIK, Aleš. Kriminaliteta in podatki : predavanje na 4. konferenci Prava informacijske varnosti, Portorož, 16. 3. 2023. [COBISS.SI-ID 159392003]
- ZAVRŠNIK, Aleš. Umjetna inteligencija i krivično pravosuđe : predavanje, međunarodni seminar “Digitalizacija u pravu, zaštita privatnosti i automatizacija – DPZPA”, Sarajevo, 18. 5. 2023. [COBISS.SI-ID 159770371]
Objavljeni povzetek znanstvenega prispevka na konferenci
- ZAVRŠNIK, Aleš. Fair trial implications of automation in criminal justice systems. V: 2023 ASC Annual Meeting : Seeking justice: reconciling with our past, reimagining the future : Philadelphia, 15. 11. 2023 –18. 11. 2023. [S. l.]: American Society of Criminology, 2023. 1 spletni vir. https://convention2.allacademic.com/one/asc/asc23/index.php?cmd=Online+Program+View+Paper&selected_paper_id=2075050&PHPSESSID=7p1hcnhkka36t6t7ki72oj4i07. [COBISS.SI-ID 183045891]
Drugo
-
Organizacija Jesenske šole z naslovom “Pravo pred izzivi digitalne (r)evolucije”, 22. 11. 2024. https://www.inst-krim.si/category/jesenska-sola/
- KREK, Simon. Avtorske pravice, slovenskega jezika grob. Dnevnik. [Tiskana izd.]. 29. nov. 2022, leto 72, št. 276, str. 17, avtorj. sl. ISSN 1318-0320. https://www.dnevnik.si/1043001868/Kultura/jezikolumna-avtorske-pravice-slovenskega-jezika-grob, https://trojina.si/2022/12/14/avtorske-pravice-slovenskega-jezika-grob/. [COBISS.SI-ID 184173827]
- SPLICHAL, Slavko (intervjuvanec), BRATKO, Ivan (intervjuvanec), KRONEGGER, Luka (intervjuvanec), KALUŽA, Jernej (intervjuvanec), KREK, Simon (intervjuvanec), ŠARF, Pika (intervjuvanec), GORJANC, Vojko (intervjuvanec). Poletje umetne inteligence. Ljubljana: Radiotelevizija Slovenija javni zavod, 2023. 1 spletni vir (1 zvočna datoteka (22 min 12 sek)). Vroči mikrofon. https://val202.rtvslo.si/podkast/vroci-mikrofon/584/174960060. [COBISS.SI-ID 154859523]
- SPLICHAL, Slavko (intervjuvanec), BRATKO, Ivan (intervjuvanec), KREK, Simon (intervjuvanec), KALUŽA, Jernej (intervjuvanec), ŠARF, Pika (intervjuvanec). Upodatkovanje družbe. Ljubljana: Radiotelevizija Slovenija javni zavod, 2023. 1 spletni vir (1 zvočna datoteka (9 min 11 sek)). Aktualna tema. https://365.rtvslo.si/arhiv/aktualna-tema/174958360. [COBISS.SI-ID 154855171]
- SLAČEK, Nina (oseba, ki intervjuva), BOGATAJ JANČIČ, Maja (intervjuvanec), CVAR, Nina (intervjuvanec), DOBRANIĆ, Filip (intervjuvanec), ZAVRŠNIK, Aleš (intervjuvanec). Kdo bo imel koristi in kdo škodo od nove umetne inteligence. Ljubljana: Radiotelevizija Slovenija javni zavod, 2023. 1 spletni vir (1 zvočna datoteka (50 min, 52 sek)). Intelekta. https://365.rtvslo.si/arhiv/intelekta/174964772. [COBISS.SI-ID 155695363]
Predavanje na tuji univerzi
- ZAVRŠNIK, Aleš. AI and penal system : lecture at module “Artificial Intelligence and Intellectual Property”, Strasbourg University, Center for International Intelectual Property Studies, 24. 1. 2023, Zoom. [COBISS.SI-ID 142227715]
- ZAVRŠNIK, Aleš. AI and penal system : lecture at Università Cattolica del Sacro Cuore, Milano, 12. 9. 2023, Zoom. [COBISS.SI-ID 164318467]
- ZAVRŠNIK, Aleš. Veštačka inteligencija u pravosuđu: prilike i rizici algoritamskog upravljanja : predavanje, Fakulteta za organizacijske vede Univerze v Beogradu in Raziskovalno-razvojni inštitut umetne inteligence Srbije, Novi Sad, 8. december 2023. [COBISS.SI-ID 178939651]
Druga predavanja
-
ZAVRŠNIK, Aleš. Umetna inteligenca in družbena škoda : predavanje, Ustavno sodišče RS, Ljubljana, 8. 11. 2023. [COBISS.SI-ID: 183957251]