Рассмотрите следующий сжатый код:
/* Compile: gcc -pthread -m32 -ansi x.c */
#include
#include
#include
static volatile uint64_t v = 0;
void *func (void *x) {
__sync_add_and_fetch (&v, 1);
return x;
}
int main (void) {
pthread_t t;
pthread_create (&t, NULL, func, NULL);
pthread_join (t, NULL);
printf ("v = %"PRIu64"\n", v);
return 0;
}
У меня есть переменная uint64_t
, которую я хочу увеличить атомарно, потому что эта переменная является счетчиком в многопоточной программе.
Для достижения атомарности я использую атомарные встроенные функции GCC.
Если я компилирую для системы amd64 (-m64), полученный код на ассемблере легко понять.
Используя lock addq
, процессор гарантирует, что приращение будет атомарным.
400660: f0 48 83 05 d7 09 20 lock addq $0x1,0x2009d7(%rip)
Но тот же самый код C создает очень сложный код ASM в системе ia32 (-m32):
804855a: a1 28 a0 04 08 mov 0x804a028,%eax
804855f: 8b 15 2c a0 04 08 mov 0x804a02c,%edx
8048565: 89 c1 mov %eax,%ecx
8048567: 89 d3 mov %edx,%ebx
8048569: 83 c1 01 add $0x1,%ecx
804856c: 83 d3 00 adc $0x0,%ebx
804856f: 89 ce mov %ecx,%esi
8048571: 89 d9 mov %ebx,%ecx
8048573: 89 f3 mov %esi,%ebx
8048575: f0 0f c7 0d 28 a0 04 lock cmpxchg8b 0x804a028
804857c: 08
804857d: 75 e6 jne 8048565
Вот чего я не понимаю:
lock cmpxchg8b
гарантирует что измененная переменная записывается только в том случае, если ожидаемое значение все еще находится в целевом адресе. Сравнение и замена гарантированно происходят атомарно. Возможно, это не имеет значения, если было "грязное чтение", но кто-нибудь может кратко изложить доказательство, что проблемы нет?
Далее: Почему сгенерированный код возвращается к 0x8048565, а не к 0x804855a? Я уверен, что это правильно только в том случае, если другие писатели тоже только увеличивают переменную.Является ли это подразумеваемым требованием для функции __sync_add_and_fetch
?