Quando la Giustizia dà i numeri!

“E’ la stessa voce, oppure sono due voci diverse?”

Tratto Vocalico

Partiamo dal principio che il riconoscimento della voce in ambito giudiziario serve a far emergere il grado di somiglianza fra una voce nota e la voce di un sospettato.

Il “peso” del compito è affidato alla scienza della comparazione vocale, ad oggi imperfetta, che non ha per le sue diverse molteplici criticità uno standard metodologico ben preciso e consolidato.

Esistono diversi approcci, spesso complementari, fra cui:

  • fonetico-linguistico, necessario a far evincere i tratti caratteristici del parlato di ogni individuo e eventuali difetti come la erre moscia, che mi caratterizza dalla nascita!
  • analitico/statistico, un po’ lunghetto, dove vengono misurate a mano le risonanze della voce, nello specifico delle vocali pronunciate. Tanta pazienza, ore, misure manuali e un buon foglio di calcolo dove immettere i valori.
  • semi-automatico e automatico, dove il confronto è affidato a software con tecnologia avanzata.

Vorrei raccontarvi della strada “facile” che ho provato a percorrere per le mie perizie di comparazione, quella dei software automatici e semi-automatici.
Parliamoci chiaro, caricare due file, schiacciare un bottone e mettere in bella copia il risultato mi avrebbe fatto risparmiare moltissime ore di lavoro.
Decido di contattare le software house più blasonate e importanti, supportate da articoli scientifici che ne decantano le caratteristiche comparative a livello globale.
Mi arriva in prova uno dei software a cui tanto avevo fatto la corte.
Non sto più nella pelle! Il costo è proibitivo ma mi toglierà tantissime ore di lavoro.
Raggiungo mia moglie registratore alla mano: “Ti voglio registrare la voce subito, finalmente ho una Ferrari fra le mani”.
Mia moglie parla imbarazzata mentre la registro. Dopo poco inizia a far ridere mia figlia facendo il cosiddetto baby talking, e la registro!
Vado nel mio studio. Seguo attentamente le istruzioni del software per la comparazione.
Faccio il test:
“Le due voci appartengono con buona probabilità a due persone distinte”!

Ho registrato io, la stessa persona, con lo stesso registratore, nello stesso ambiente!

Nella migliore delle ipotesi nella vita reale dovrò confrontare un’intercettazione rumorosa, con una telefonata od un saggio fonico.
E poi, anche se fa baby talking, il tratto vocalico non è lo stesso? Non ha cambiato le corde vocali e la laringe nel mentre, giusto?

Sono un docente esperto di software audio, sono molto metodico ma avrò sbagliato io qualcosa!

Come sempre mi rimetto in discussione, rileggo attentamente le istruzioni, rifaccio molteplici passaggi e faccio prove con file audio diversi.

La tecnologia nuova va imparata da zero, però, dopo un mese di prove i risultati eran sempre contrastanti, senza criteri di logica.

Non nego, ogni tanto ci beccava, diciamo al 50%, solo che non sapevo se era per “fortuna” statistica o per capacità; anche un orologio rotto ha l’ora giusta due volte al giorno.

Spesso il confronto del File 1 contro il File 2 mi dava un risultato,

se invertivo i file, File 2 contro File 1, me ne dava uno completamente diverso.
Fallimento.

Va bene, ma mica ci sono solo loro al mondo!

Me ne arriva un altro in prova da un’altra azienda concorrente.

Questo aveva un costo di licenza così alto che costava all’anno quanto la mia macchina full optional, da nuova!

Va beh, ma con tutti gli studiosi che ci sono dietro, ne varrà il costo!
Fallimento anche in questo caso.
Ai risultati negativi esposti via mail mi rispondono “I risultati errati possono effettivamente essere previsti sulla base non solo della nostra esperienza e delle nostre raccomandazioni, ma anche delle linee guida metodologiche ENFSI (European Network of Forensic Science Institutes). Sfortunatamente, al momento non esiste un modo perfetto per affrontare questa discrepanza… anche se ciò fosse raggiunto, gli utenti finali avrebbero probabilmente difficoltà a raccogliere un apposito Set di Popolazione da utilizzare in questi casi per conformarsi alla metodologia forense promossa dall’ENFSI”.

Che alle mie orecchie queste parole sono suonate più o meno come: “Lo sappiamo che potrebbe non andare, lo sanno anche quelli dell’ENFSI, massima autorità europea al riguardo”. Hai capito?

Nel mentre arriva un nuovo software, con un nuovo algoritmo di ultimissimissima generazione. Stiamo parlando del 2021, non del secolo scorso.

Qua gioco facile, non registro più mia moglie, che magari lo fa apposta per farmi tribulare.

Registro me stesso.

Mi auto-mando un messaggio vocale WhatsApp, e poi vado in studio e mi confronto la mia voce con la mia stessa voce registrata.
Risultati sconfortanti, non riesco a venirne a capo!

Io voglio solo un software funzionante che mi risolvi le perizie, e che mi eviti tutte quelle ore di lavoro sui fogli di calcolo. Sono una persona semplice con richieste semplici!

Questa volta cosa mi viene risposto?

“As to audio files recorded by Samsung or iPhone, it is necessary to take into account that these mobiles devices have a built-in noise cancellation function that is applied to an audio being recorded by default, however, such noise cancellation distorts a speech signal and affects the results of identification.”

Certo, gli dico a quelli che sto intercettando di non usare il telefono, perché le registrazioni potrebbero non essere idonee alla comparazione vocale automatica. Ma di cosa stiamo parlando?

E allora passiamo ai metodi semi-automatici!

Magari invece che schiacciare un bottone e leggere il risultato dovrò fare una Semi-fatica,

ma se funzionano…

Già! Peccato che anche qui i problemi non sono mancati.

I software semi-automatici, per essere “tarati” hanno bisogno di una corretta popolazione di riferimento. E’ come dire, la calcolatrice fa il calcolo giusto, però devo poi frazionarlo con un denominatore altrettanto corretto. La popolazione è questo denominatore, e se questo numero è sbagliato lo sarà tutto il calcolo!

E la popolazione italiana è un numero facile come denominatore, vero? No!

Perché:

  • E’ stato provato scientificamente che le misure cambiano confrontando due persone italiane della stessa regione, ma residenti in province diverse
  • E’ stato provato scientificamente che le misure cambiano confrontando due persone, una madrelingua italiana, e una straniera che parla italiano perfettamente

Per ogni comparazione avrei avuto bisogno di una popolazione diversa ad hoc, ad esempio una popolazione di piemontesi biellesi per confrontarli con la mia voce, perché i piemontesi torinesi hanno le “e” diverse; impossibile poi pensare di confrontare un torinese con un siciliano, e poi siciliano di che provincia; e se il siciliano di tale provincia non parla madrelingua ma è originario di un altro posto?

Ecco! I software di comparazione semi-automatica si basano su database con valori vocalici medi di popolazione italiana, che per la sua stessa generalità non può andar bene.
Anche con queste prove i risultati sono stati così contrastanti che non sapevo quando il software stesse dicendo il vero o stesse invece giocando ai dadi.

Tutto questo percorso mi ha fatto constatare l’inaffidabilità certa dei risultati di questi software.
Se chiedo ad un software di ultima generazione, oltretutto costoso, di farmi una comparazione, e mi restituisce un output, io non posso mettermi a controllare l’output e definire se ha preso una cantonata allucinante o no, perché altrimenti tanto vale che io faccia la comparazione manualmente.
La forza nell’usare un software è proprio il fatto di non fare le cose a mano, ma se il software non è affidabile allora è chiaro che non posso usarlo in casi forensi; non è certo della somiglianza della mia voce con la mia stessa voce, come faccio a sapere cosa combina quando il parlatore a me è sconosciuto?

Il concetto è semplice.

Giusto per gradire aggiungo un caso emblematico che affrontai dall’altra parte, dove venne utilizzato da un altro perito il risultato di un software automatico.

Per fare le controprove chiesi il software automatico in questione alla casa produttrice, tolto dal commercio da molti anni e in uso ancora oggi da diversi studi peritali italiani, che mi rispose:

We do not recommend using XXXX for forensic analysis of audio recordings that are used as evidence in legal trials or in other similar situations, because XXXX performs merely automatic comparison of speakers’ voices and does not allow carrying out a thorough analysis using other methods, e.g. auditory or formant, when the participation of a forensic expert is required.

Results of the comparisons made by XXXX cannot be used as a basis for expert findings and cannot be included in official forensic reports.

E allora come li giustifichiamo i casi giudiziari che si basano ancora su quei risultati? E tutti i casi che si sono risolti con quel software? Magari c’è ancora qualcuno dentro senza che…

Torniamo a ciò che dovremmo chiederci al di là di ogni ragionevole dubbio:

“è la stessa voce, oppure sono due voci diverse?”

Per esperienza personale, a parità di voci, senza un’applicazione corretta di metodologie complementari che includano anche analisi linguistico-fonetico-acustica, come suggerito dalla stessa ENFSI (che a mio avviso evidentemente ha capito che i software in questione un po’ di casino lo fanno), può essere “Molto Probabile” o “Molto Improbabile” a seconda del software utilizzato, e di come si vogliano leggere i risultati!
Ovviamente tutto ciò che ho scritto può essere fonte di opinioni discordanti, ricordiamoci, io sono soltanto uno che voleva avanzare ore di lavoro, sicuramente non il più “migliore”, e oltretutto fregato fin dal primo tentativo dalla voce della moglie, che se sapevo mi fidavo del demo!

Ma grazie a quella primissima prova, e a tutte le innumerevoli che ho fatto negli anni, io sono arrivato alla personale certezza che non condannerei mai una persona basandomi sui soli risultati di questi software, sia automatici che semi-automatici. Nessuno di loro mi ha mai dato certezza sull’appartenenza di una voce sospettata confrontata con una voce nota.
Han fallito pure con la mia, e non dimentichiamolo, ho anche la erre moscia!

Mi metto a disposizione per qualsiasi prova PRATICA, dove dimostro ciò che ho affermato in queste righe.

Marco Perino

#perito #fonico #perizia #fonica #perizie #foniche

Informazioni e Preventivi

Legal Mail (PEC): marcoperino@pec.it

WhatsApp

+390159526958