Komparasi Kinerja Algoritma Blocking Pada Proses Indexing Untuk Deteksi Duplikasi
Proses integrasi data dari heterogeneous data sources memerlukan kualitas data yang baik.Salah satu ciri kualitas data yang baik adalah terhindar dari terjadinya duplikasi data.Untuk melakukan deteksi duplikasi, langkah yang dapat dilakukan adalah membandingkan setiap record dalam sebuah dataset sehingga membentuk candidate record pair.Teknik block