При объединении двух кадров данных с ~ 1 миллионом строк каждый, один с двумя столбцами, а другой с ~ 20, я неожиданно обнаружил, что merge(..., all.x = TRUE, all.y = TRUE)
будет быстрее, чем dplyr::full_join()
. Это с dplyr v0.4
Merge занимает ~ 17 секунд, full_join занимает ~ 65 секунд.
Некоторое питание, хотя, как правило, я использую dplyr для задач манипуляции.
Хорошо. Как это обычно бывает, я получил решение после публикации вопроса на SO.
Кредиты: https://blog.bigfont.ca/dotnet-restore-without-an-internet-connection/
Вот краткое изложение:
dotnet nuget locals all --list
blockquote>info : http-cache: C:\Users\bigfo\AppData\Local\NuGet\v3-cache info : global-packages: C:\Users\bigfo\.nuget\packages\ info : temp: C:\Users\bigfo\AppData\Local\Temp\NuGetScratch
Затем используйте один из этих источников во время восстановления dotnet
dotnet restore --source C:\Users\bigfo\.nuget\packages\ dotnet build --no-restore dotnet run --no-restore
Альтернативой найденному вами решению является создание файла nuget.config
, удаляющего все источники nuget:
<configuration>
<packageSources>
<clear />
</packageSources>
</configuration>
Таким образом, для восстановления не нужно использовать специальные аргументы командной строки или построить.