Zamknij

Szybkie wykrywanie powielonych danych

Deduplikacja danych to proces pozwalający na uniknięcie niepotrzebnych kosztów finansowych i wizerunkowych wielokrotnego kontaktu z klientem w tej samej sprawie.

Zastosowanie pamięci asocjacyjnych w procesie wykrywania powielonych zapisów tych samych danych adresowych (tych samych firm lub osób), zwiększa liczbę wykrytych duplikatów – o przypadki bardzo trudne do wykrycia tradycyjnymi metodami eksploracji danych (opartych np. na regułach zdefiniowanych w języku SQL).

Deduplikacja przy pomocy przetwarzań asocjacyjnych nie wymaga uprzedniej normalizacji baz danych. Algorytmy asocjacyjne widzą wszystkie wzajemne podobieństwa w danych i „intuicyjnie” potrafią powiązać dane tych samych osób lub firm, pomimo znacznych różnic w formacie ich zapisu, bez konieczności definiowania złożonych reguł analitycznych.

Architektura procesu dedupilkacji (analogicznie jak normalizacji), dopuszcza możliwość podziału przetwarzań danych, na wiele równoległych zadań, wykonywanych w tym samym czasie, przy użyciu różnych rdzeni procesora lub na różnych komputerach. Dzięki temu, możliwa jest deduplikacja bazy dowolnej wielkości, nie w ciągu tygodni lub miesięcy, ale w czasie paru godzin.

Opowiedz o potrzebach biznesowych, a my znajdziemy rozwiązanie