Это очень специфический вопрос для Delphi (возможно, даже для Delphi 2007). В настоящее время я пишу простой класс StringPool для интернирования строк. Как хороший маленький программист, я также добавил модульные тесты и нашел кое-что, что меня озадачило.
Это код для интернирования:
function TStringPool.Intern(const _s: string): string;
var
Idx: Integer;
begin
if FList.Find(_s, Idx) then
Result := FList[Idx]
else begin
Result := _s;
if FMakeStringsUnique then
UniqueString(Result);
FList.Add(Result);
end;
end;
Ничего особенного: FList - это TStringList, который отсортирован, поэтому весь код выполняет поиск строки в списке и, если она уже есть, возвращает существующую строку. Если его еще нет в списке, он сначала вызовет UniqueString, чтобы гарантировать, что счетчик ссылок равен 1, а затем добавит его в список. (Я проверил счетчик ссылок в Result, и он равен 3 после того, как 'hallo' был добавлен дважды, как и ожидалось.)
Теперь к коду тестирования:
procedure TestStringPool.TestUnique;
var
s1: string;
s2: string;
begin
s1 := FPool.Intern('hallo');
CheckEquals(2, GetStringReferenceCount(s1));
s2 := s1;
CheckEquals(3, GetStringReferenceCount(s1));
CheckEquals(3, GetStringReferenceCount(s2));
UniqueString(s2);
CheckEquals(1, GetStringReferenceCount(s2));
s2 := FPool.Intern(s2);
CheckEquals(Integer(Pointer(s1)), Integer(Pointer(s2)));
CheckEquals(3, GetStringReferenceCount(s2));
end;
Это добавляет строку 'hallo' в пул строк дважды и проверяет счетчик ссылок строки, а также то, что s1 и s2 действительно указывают на один и тот же дескриптор строки.
Каждый CheckEquals работает так, как ожидалось, но последний. Ошибка: «Ожидается: , но было: ».
Итак, почему здесь счетчик ссылок 4? Я ожидал 3:
Это Delphi 2007, поэтому строки являются AnsiStrings.
О да, функция StringReferenceCount реализована как:
function GetStringReferenceCount(const _s: AnsiString): integer;
var
ptr: PLongWord;
begin
ptr := Pointer(_s);
if ptr = nil then begin
// special case: Empty strings are represented by NIL pointers
Result := MaxInt;
end else begin
// The string descriptor contains the following two longwords:
// Offset -1: Length
// Offset -2: Reference count
Dec(Ptr, 2);
Result := ptr^;
end;
end;
В отладчике то же самое можно оценить как:
plongword(integer(pointer(s2))-8)^
Просто чтобы добавить к ответу Serg (который кажется правильным на 100%):
Если я заменю
s2 := FPool.Intern(s2);
на
s3 := FPool.Intern(s2);
s2 := '';
, а затем проверю счетчик ссылок s3 (и s1), как и ожидалось, равен 3. Это явление вызвано тем, что результат FPool.Intern (s2) снова присваивается s2 (s2 является одновременно параметром и местом назначения для результата функции). Delphi вводит скрытую строковую переменную для присвоения результата.
Кроме того, если я изменю функцию на процедуру:
procedure TStringPool.Intern(var _s: string);
счетчик ссылок будет 3, как и ожидалось, потому что скрытая переменная не требуется.
Если кто-то есть заинтересован в этой реализации TStringPool: это открытый исходный код в рамках MPL и доступен как часть dzlib, который, в свою очередь, является частью dzchart:
https://sourceforge.net/p/dzlib/code/HEAD/tree/dzlib/ trunk / src / u_dzStringPool.pas
Но, как сказано выше: это не совсем ракетостроение. ; -)