6
ответов

Инструменты для соответствия [закрытому] имени/адресным сведениям

Вот интересная проблема. У меня есть база данных оракула с именем и адресной информацией, которая должна держаться в курсе. Мы получаем подачу данных от многих различных правительственных источников и должны...
вопрос задан: 30 April 2017 14:45
1
ответ

Использование compare.linkage из R для сравнения двух фреймов данных и создания пар для ввода данных

Я пытаюсь ввести некоторые данные в моем наборе данных, основанном на другом. Однако для этого мне нужно сравнить несколько переменных, и у каждой есть вес. Кроме того, мне нужно сформировать пары, используя переменные KEY, ...
вопрос задан: 5 March 2019 18:49
0
ответов

Пакет RecordLinkage в R - добавляет вес отдельным переменным связывания

Я следую прекрасному учебнику по RPubs (http://rpubs.com/ahmademad/RecordLinkage), в котором используется великолепный пакет RecordLinkage. Я применяю это к своим собственным данным, но я просто буду использовать ...
вопрос задан: 20 March 2019 14:44
0
ответов

Как выполнить иерархическую кластеризацию для набора данных в R?

Я пытаюсь выполнить иерархическую кластеризацию в наборе данных, где столбцы являются порядковыми в масштабе от 1 до 5. На основе иерархической кластеризации можно использовать функцию hclust (). Для проведения анализа ...
вопрос задан: 13 July 2018 09:50
0
ответов

Дедупликация с нечетким соответствием менее чем за экспоненциальное время?

У меня есть большая база данных (потенциально в миллионах записей) с относительно короткими строками текста (в порядке адреса, имен и т. Д.). Я ищу стратегию удаления неточных ...
вопрос задан: 28 April 2017 19:19