На оборудовании Intel это часто реализуется поверх аппаратной инструкции SQRT. Некоторые библиотеки просто используют результат этого сразу, некоторые могут подвергнуть его паре раундов оптимизации Ньютона, чтобы сделать его более точным в крайних случаях.