La linguistica forense contro il cyber crime

La disciplina della linguistica forense studia la linguistica applicata a processi legali e giudiziari. Qualsiasi testo, se implicato in contesto criminale o legale, può essere oggetto di linguistica forense. Gli esperti di questa disciplina collaborano con le istituzioni forensi e giudiziarie per fornire prove in un caso. L’oggetto di studio è un prodotto testuale, sia scritto che orale. Questi testi possono essere documenti, conversazioni telefoniche o in una chat, email, post sui social o siti web, dunque anche testi digitali. I periti linguistici possono confermare o meno un imputato esaminando prove audio, essendo in grado di riconoscere l’accento, verificarne la provenienza e analizzare il tono di voce. Sono, inoltre, in grado di determinare se quest’ultimo nasconde minacce e identificare l’identità di qualcuno comparando diversi testi. Tutto ciò viene raccolto e usato per fornire prove alle forze dell’ordine nell’ambito della ricostruzione degli eventi in un’indagine.

Gli ambiti di analisi di questi professionisti spaziano tra vari settori, come l’analisi comparativa della proprietà d’autore, il profilo sociolinguistico, la determinazione di un significato, così come dispute su violazioni del copyright. Inoltre, alcuni casi non coinvolgono la linguistica forense come investigazione di ulteriori prove, ma sono gli stessi reati ad essere intrinsecamente linguistici in quanto vengono commessi attraverso il linguaggio, come ad esempio le minacce, le estorsioni o le corruzioni. La linguistica forense nasce negli anni Ottanta del secolo scorso e si diffonde dal Regno Unito in altri paesi. Sebbene sia molto affermato come campo di studio e di indagine nei paesi di common law, trova meno spazio negli ordinamenti civilisti.

La linguistica forense applicata alla criminalità informatica

Negli ultimi anni, con le nuove tecnologie, la linguistica forense è stata applicata a fondo in alcune indagini di criminalità informatica. Il cyber crime, infatti, si manifesta per lo più con abusi testuali. Sin dai primi sviluppi informatici, la linguistica forense ha lavorato su casi che includevano messaggi di testo (sms), tweet e così via. Si ricorre a questa disciplina anche per verificare prove complesse che sono state contraffatte o alterate attraverso gli smartphone, ancora di più oggi attraverso l’uso di strumenti di intelligenza artificiale, che riproducono e manipolano la voce in modo perfetto e permettono ai criminali di camuffare la loro identità.

Sia il cyber crime che la linguistica forense sono in continua evoluzione e man mano che il progresso tecnologico avanza, si ampliano i campi di applicazione, come dimostra la branca della linguistica forense computazionale. I linguisti, d’altra parte, possono contribuire allo sviluppo di sistemi che potrebbero essere applicati in casi di criminalità informatica. Definire il linguista forense, soprattutto chi lavora nell’ambito della criminalità informatica, può essere complesso, data la natura internazionale del cyber crime stesso. Il ruolo dei linguisti cyber forensi e il loro ambito di competenza può variare a seconda dei vincoli entro cui devono operare e di paese in paese.

Il cyber crime è un ambito che include diversi tipi di reati, dall’hacking al cyber grooming, ovvero l’adescamento sul web, così come le frodi finanziarie e le truffe sentimentali, stalking, abusi, cyber bullismo, hate speech, crimini legati alla proprietà intellettuale (IP crimes) e violazione della privacy. L’elenco aumenta continuamente perché i crimini oggi trovano nuovi spazi – e nuove vittime – declinati nel web. Per questo motivo, sono necessari nuovi strumenti e nuovi approcci interdisciplinari per combatterli. L’informatica ha abbattuto le barriere delle frontiere, agendo in uno spazio globale, e allo stesso modo ha sfocato i confini delle competenze dei casi. Adottando nuove prospettive, è più facile star dietro a questo campo in trasformazione.

Un dato, emerso da numerosi studi, è di estremo aiuto a questa disciplina. La globalizzazione e il vasto utilizzo dei social media hanno incrementato il multilinguismo a livello globale. Secondo alcuni studi, circa l’80% delle comunicazioni sul web avvengono in inglese e sono prodotte da non madrelingua. Di conseguenza, il compito del linguista forense è quello di identificare la lingua madre di un parlante attraverso un’analisi dello stile, dell’uso della seconda lingua e altri aspetti sociolinguistici. Scoprire l’autore di un crimine informatico, valutando questi aspetti, è possibile, anche su testi molto brevi.

Un dato, emerso da numerosi studi, è di estremo aiuto a questa disciplina. La globalizzazione e il vasto utilizzo dei social media hanno incrementato il multilinguismo a livello globale. Secondo alcuni studi, circa l’80% delle comunicazioni sul web avvengono in inglese e sono prodotte da non madrelingua. Di conseguenza, il compito del linguista forense è quello di identificare la lingua madre di un parlante attraverso un’analisi dello stile, dell’uso della seconda lingua e altri aspetti sociolinguistici. Scoprire l’autore di un crimine informatico, valutando questi aspetti, è possibile, anche su testi molto brevi.

Il legame tra linguistica forense e cyber crime si fa sempre più stretto con i progressi della tecnologia e l’evoluzione dei software a disposizione delle forze dell’ordine e dei ricercatori, che permetterà ricerche più precise e avrà un impatto significativo anche su chi, invece, cerca di eludere il rilevamento, potenzialmente con metodi come il cosiddetto spoofing. Le strategie di elusione da parte dei criminali informatici sono in costante evoluzione, e questo fa sì che le forze investigative debbano stare al passo per adattarsi ai cambiamenti. Anche la definizione e la teorizzazione della criminalità informatica risultano difficili a causa della duttilità e della fluidità di questa tipologia di crimine. Lo sfruttamento delle risorse informatiche ha incrementato anche il numero di crimini e potenziali criminali: una grande sfida lanciata alla polizia investigativa che deve restare aggiornata su ogni tecnologia informatica e sui potenziali abusi. Da qui è nato un nuovo campo di specializzazione, l’informatica forense (forensic computing), ovvero l’applicazione della tecnologia informatica alle indagini sui reati informatici, che consiste nel processo di identificazione, conservazione, analisi e presentazione delle prove digitali in modo legalmente accettabile.

Tra le prove digitali, come abbiamo detto, ci sono per lo più testi scritti e qui entrano in gioco i linguisti forensi, che sono in grado di analizzare le minacce online, identificarne l’autore e il suo intento potenzialmente criminale. Analizzando caratteristiche come la lunghezza media delle parole e delle frasi, la frequenza delle parole, il numero di token, le scelte di punteggiatura, la densità lessicale, i confini sintattici e altri elementi linguistici e sociolinguistici, riescono a identificare delle strategie e dei pattern usati dai criminali informatici.

Per questo motivo, in alcuni paesi, le forze dell’ordine e di polizia investigativa sono state formate da linguisti forensi per aiutarli ad individuare meglio sospettati e criminali nel dark web. I corsi di tecniche di linguistica forense per gli agenti sotto copertura nel deep web e dark web nel Regno Unito stanno contribuendo a incastrare i criminali, soprattutto pedofili, proprio riconoscendo il linguaggio usato e le strutture ricorrenti durante le conversazioni con le vittime. Grazie a queste tecniche, i risultati si sono dimostrati soddisfacenti, diminuendo il rischio per gli agenti sotto copertura di essere scoperti e aumentando il numero di criminali consegnati alla giustizia. Non è facile infiltrarsi nel dark web senza destare sospetti: per questo, adottare le sfumature linguistiche proprie di questo luogo aumenta le possibilità di riuscire nelle investigazioni e proteggere le vittime. Ancora più complesso è l’atteggiamento e il modo di comunicare dei terroristi. Inoltre, le organizzazioni terroristiche sfruttano Internet per reclutare e diffondere la loro propaganda, e la loro comunicazione è difficile da tracciare. L’informatica forense, seppur messa alla prova, si può avvalere del fatto che i dati testuali – tutti i testi presenti su Internet – sono adattati alla lingua naturale. Di conseguenza, le tecniche di elaborazione del linguaggio naturale possono contribuire all’analisi delle minacce terroristiche online. La linguistica forense computazionale considera i testi come token e li divide in piccoli pezzi: questo porta ad un’analisi discriminante, con risultati accurati fino al 95% in alcuni casi. L’analisi delle minacce online, dunque, richiede la competenza sia di precisi criteri linguistici che di strumenti informatici. Tutte le tracce linguistiche che un criminale informatico lascia possono diventare indizi. La linguistica forense computazionale analizza la frequenza delle parole, la loro concordanza, il tono usato, le scelte grammaticali, la punteggiatura e soprattutto le scelte lessicali che definiscono lo stile di una persona. Questi elementi aiutano a risalire al criminale.

Questo tipo di analisi deve essere condotta sia sul piano qualitativo che quantitativo del linguaggio usato e dei temi trattati, avvalendosi anche della tecnica del data mining. Con lo scopo di garantire maggiore affidabilità, un approccio combinato tra textometry (la tecnica di analizzare grandi corpora di testi) e deep learning può portare ad ottimi risultati. Inoltre, la textometry può anche aiutare a comprendere meglio i risultati forniti dagli algoritmi di intelligenza artificiale, contestualizzandoli ed esemplificandoli.

Il futuro della linguistica forense computazionale

È scontato precisare che la linguistica non può da sola risolvere i crimini o essere sufficiente come strumento di investigazione, ma una comprensione dei dati linguistici approfondita, con l’ausilio degli strumenti informatici, può portare ulteriori indizi e informazioni utili alle indagini. Come ogni prova, anche le analisi linguistiche possono rivelarsi fallaci. Ad esempio, truffatori e criminali possono inserire appositamente degli errori grammaticali o determinate parole per depistare le indagini. Questo strumento, però, resta uno dei più validi alleati contro il cyber crime perché bisogna valutare ogni minimo dettaglio su cui il criminale può cadere. Ecco perché la mole di documenti da analizzare deve essere piuttosto ampia per trovare le più sottili informazioni e ottenere prove affidabili.

La linguistica forense computazionale è destinata ad avere maggior credito in futuro ed essere applicata in casi di diritto civile e diritto penale, perché i risultati delle indagini condotte in questi anni con l’ausilio di tecniche linguistiche forensi si sono mostrati soddisfacenti. In particolar modo, nel vasto mondo del cyber crime, l’analisi linguistica ha portato a nuovi campi di indagine che potranno essere sfruttati in futuro, anche addestrando software di apprendimento automatico e intelligenza artificiale.

Riferimenti

The Application of Forensic Linguistics in Cybercrime Investigations – Ria C. Perkins
Fighting Cybercrime through Linguistic Analysis – Patrizia Anesa
Linguistic Approaches to the Analysis of Online Terrorist Threats – J. Longhi in Language as evidence – doing forensic linguistics a cura di V.G. Nieto, D. Stein
Etaywe, A. (2024) Discursive pragmatics of justification in terrorist threat texts: Victim-blaming, denying, discrediting, legitimating, manipulating, and retaliation. Discourse & Society, 0(0). https://doi.org/10.1177/09579265241251480

Hai un articolo nel cassetto? Legal Tech Magazine è sempre alla ricerca di nuove voci attraverso cui raccontare l’evoluzione del settore. Puoi sottoporci la tua proposta attraverso il seguente form: avremo cura di leggerla e di valutarne la pubblicazione.

Non solo un Magazine, ma anche una Mappa, un Forum, un Report e un’Academy. Se ti interessano i progetti di Legal Tech Italy e desideri ricevere aggiornamenti sulle sue iniziative presenti e future, iscriviti alla newsletter e non perderti nessuna novità.