Nell'integrazione dei dati, la truth discovery (letteralmente "definizione della verità") è il processo di selezione del valore di verità di un determinato oggetto quando sorgenti di dati diverse forniscono informazioni contrastanti su di esso.
Diversi algoritmi sono stati proposti per risolvere questo problema. Il metodo più semplice è basato sulla selezione del valore più popolare come valore di verità, altri metodi più sofisticati danno una stima dell'attendibilità delle varie sorgenti di dati allo scopo di ottenere un risultato più accurato.[1]
I problemi di truth discovery possono essere suddivisi in due sottoclassi: single-truth discovery e multi-truth discovery. Nel primo caso ad ogni oggetto è associato un solo valore di verità (ad esempio il compleanno di una persona, o la capitale di un paese). Mentre nel secondo caso ad ogni oggetto sono associati più valori di verità (ad esempio il cast di un film o gli autori di un libro).[2][3]
In genere, la fase di truth discovery è l'ultimo passo da svolgere durante l'integrazione dei dati, quando gli schemi di diverse sorgenti di dati sono stati unificati e i record che si riferiscono allo stesso oggetto sono stati identificati.[4]
© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search