Talend Data Quality. Нахождение похожих данных

Talend Data Quality. Нахождение похожих данных

Talend Data Quality - является инструментом предназначенным для очистки данных и повышения их качества.

С помощью Talend Data Quality в базе данных можно найти все похожие записи несмотря на шум в значениях. Для реализации такой возможности поиска используется нечеткая логика, а именно алгоритм Левенштейна.