std::atomic. Модель памяти C++ в примерах

    Для написания эффективных и корректных многопоточных приложений очень важно знать какие существуют механизмы синхронизации памяти между потоками исполнения, какие гарантии предоставляют элементы многопоточного программирования, такие как мьютекс, join потока и другие. Особенно это касается модели памяти C++, которая была создана сложной таковой, чтобы обеспечивать оптимальный многопоточный код под множество архитектур процессоров. Кстати, язык программирования Rust, будучи построенным на LLVM, использует модель памяти такую же, как в C++. Поэтому материал в этой статье будет полезен программистам на обоих языках. Но все примеры будут на языке C++. Я буду рассказывать про std::atomic, std::memory_order и на каких трех слонах стоят атомики.


    В стандарте C++11 появилась возможность писать многопоточные программы на C++, используя только стандартные средства языка. В то время многоядерные процессоры уже завоевали рынок. Особенность выполнения программы на многоядерном процессоре в том, что инструкции программы из разных потоков физически могут исполняться одновременно. Ранее многопоточность на одном ядре эмулировалась частым переключением контекста исполнения с одного потока на последующие. Для оптимизации работы с памятью у каждого ядра имеется его личный кэш памяти, над ним стоит общий кэш памяти процессора, далее оперативная память. Задача синхронизации памяти между ядрами - поддержка консистентного представления данных на каждом ядре (читай в каждом потоке). Очевидно, что если применить строгую упорядоченность изменений памяти, то операции на разных ядрах уже не будут выполнятся параллельно: остальные ядра будут ожидать, когда одно ядро выполнит инструкции изменения данных. Поэтому процессоры поддерживают работу с памятью с менее строгими гарантиями консистентности памяти. Более того, разработчику программы предоставляется выбор, какие гарантии по доступу к памяти из разных потоков требуются для достижения максимальной корректности и производительности многопоточной программы. Задача предоставить разные гарантии по памяти решалась по-разному для разных архитектур процессоров. Наиболее популярные архитектуры x86-64 и ARM имеют разные представления о том, как синхронизировать память.

    Язык C++ компилируется под множество архитектур, поэтому в вопросе синхронизации данных между потоками в С++11 была добавлена модель памяти, которая обобщает механизмы синхронизации различных архитектур, позволяя генерировать для каждого процессора оптимальных код с необходимой степенью синхронизации.

    Отсюда следует несколько важных выводов: модель синхронизации памяти C++ — это "искусственные" правила, которые учитывают особенности различных архитектур процессоров. В модели C++ некоторые конструкции, описанные стандартом как undefined behavior (UB), могут корректно работать на одной архитектуре, но приводить к ошибкам работы с памятью на других архитектурах.

    Наша задача, как разработчиков на языке C++, состоит в том, чтобы писать корректный с точки зрения стандарта языка код. В этом случае мы можем быть уверены, что для каждой платформы будет сгенерирован корректный машинный код.

    Код каждого потока компилируется и выполняется так, как будто он один в программе. Вся синхронизация данных между потоками возложена на плечи атомиков (std::atomic), т.к. именно они предоставляют возможность форсировать "передачу" изменений данных в другой поток. Далее я покажу, что мьютексы (std::mutex) и другие многопоточные примитивы либо реализованы на атомиках, либо предоставляют гарантии, семантически похожие на атомарные операции.  Поэтому ключом к написанию корректных многопоточных программ является понимание того, как конкретно работают атомики.

    Три слона

    На мой взгляд, основная проблема с атомиками в C++ состоит в том, что они несут сразу три функции. Так на каких же трех слонах держатся атомики?

    1. Атомики позволяют реализовать… атомарные операции.

    2. Атомики накладывают ограничения на порядок выполнения операций с памятью в одном потоке.

    3. Синхронизируют память в двух и более потоках выполнения.

    Атомарная операция — это операция, которую невозможно наблюдать в промежуточном состоянии, она либо выполнена либо нет. Атомарные операции могут состоять из нескольких операций. Если говорить про тип std::atomic, то он предоставляет ряд примитивных операций: load, store, fetch_add, compare_exchange_* и другие. Последние две операции — это read-modify-write операции, атомарность которых обеспечивается специальными инструкциями процессора.

    Рассмотрим простой пример read-modify-write операции, а именно прибавление к числу единицы. Пример 0, link:

    static int v1 = 0;
    static std::atomic<int> v2{ 0 };
    
    int add_v1() {
        return ++v1;
        /* Generated x86-64 assembly:
            mov     eax, DWORD PTR v1[rip]
            add     eax, 1
            mov     DWORD PTR v1[rip], eax
        */
    }
    
    int add_v2() {
        return v2.fetch_add(1);
        /* Generated x86-64 assembly:
            mov     eax, 1
            lock xadd       DWORD PTR _ZL2v2[rip], eax
        */
    }

    В случае с обычной переменной  v1 типа int имеем три отдельных операций: read-modify-write. Нет гарантий, что другое ядро процессора не выполняет другой операции над v1. Операция над v2 в машинных кодах представлена как одна операция с lock сигналом на уровне процессора, гарантирующим, что к кэш линии, в которой лежит v2, эксклюзивно имеет доступ только ядро, выполняющее эту инструкцию.

    Про ограничения на порядок выполнения операций. Когда мы пишем код программы, то предполагаем, что операторы языка будут выполнены последовательно. В реальности же компилятор и в особенности процессор могут переупорядочить команды программы с целью оптимизации. Они это делают с учетом ограничений на порядок записи и чтения в локацию памяти. Например, чтение из локации памяти должно происходить после записи, эти операции нельзя переупорядочить. Применение атомарных операций может накладывать дополнительные ограничения на возможные переупорядочивания операций с памятью.

    Про синхронизацию данных между потоками. Если мы хотим изменить данные в одном потоке и сделать так, чтобы эти изменения были видны в другом потоке, то нам необходимы примитивы многопоточного программирования. Фундаментальным таким примитивом являются атомики, остальные, например мьютексы, либо реализованы на основе атомиков, либо повторяют семантику атомиков. Все попытки записывать и читать одни и те же данные из разных потоков без примитивов синхронизации могут приводить к UB.

    Случаи, когда синхронизация памяти не требуется:

    1. Если все потоки, работающие с одним участком памяти, используют ее только на чтение

    2. Если разные потоки используют эксклюзивно разные участки памяти

    Далее будет рассмотрены более сложные случаи, когда требуется чтение и запись одного участка памяти из разных потоков. Язык C++ предоставляет три способа синхронизации памяти. По мере возрастания строгости: relaxed, release/acquire и sequential consistency. Рассмотрим их.

    Неделимый, но расслабленный

    Самый простой для понимания флаг синхронизации памяти — relaxed. Он гарантирует только свойство атомарности операций, при этом не может участвовать в процессе синхронизации данных между потоками. Свойства:

    • модификация переменной "появится" в другом потоке не сразу

    • поток thread2 "увидит" значения одной и той же переменной в том же порядке, в котором происходили её  модификации в потоке thread1

    • порядок модификаций разных переменных в потоке thread1 не сохранится в потоке thread2

    Можно использовать relaxed модификатор в качестве счетчика. Пример 1, link:

    std::atomic<size_t> counter{ 0 };
     
    // process can be called from different threads
    void process(Request req) {
    	counter.fetch_add(1, std::memory_order_relaxed);
    	// ...
    }
    
    void print_metrics() {
    	std::cout << "Number of requests = " << counter.load(std::memory_order_relaxed) << "\n";
    	// ...
    }

    Использование в качестве флага остановки. Пример 2, link:

    std::atomic<bool> stopped{ false };
     
    void thread1() {
    	while (!stopped.load(std::memory_order_relaxed)) {
    		// ...
    	}
    }
     
    void stop_thread1() {
    	stopped.store(true, std::memory_order_relaxed);
    }

    В данном примере не важен порядок в котором thread1 увидит изменения из потока, вызывающего stop_thread1. Также не важно то, чтобы thread1 мгновенно (синхронно) увидел выставление флага stopped в true.

    Пример неверного использования relaxed в качестве флага готовности данных. Пример 3, link:

    std::string data;
    std::atomic<bool> ready{ false };
     
    void thread1() {
    	data = "very important bytes";
    	ready.store(true, std::memory_order_relaxed);
    }
     
    void thread2() {
    	while (!ready.load(std::memory_order_relaxed));
    	std::cout << "data is ready: " << data << "\n"; // potentially memory corruption is here
    }

    Тут нет гарантий, что поток thread2 увидит изменения data ранее, чем изменение флага ready, т.к. синхронизацию памяти флаг relaxed не обеспечивает.

    Полный порядок

    Флаг синхронизации памяти "единая последовательность" (sequential consistency, seq_cst) дает самые строгие. Его свойства:

    • порядок модификаций разных атомарных переменных в потоке thread1 сохранится в потоке thread2

    • все потоки будут видеть один и тот же порядок модификации всех атомарных переменных. Сами модификации могут происходить в разных потоках

    • все модификации памяти (не только модификации над атомиками) в потоке thread1, выполняющей store на атомарной переменной, будут видны после выполнения load этой же переменной в потоке thread2

    Таким образом можно представить seq_cst операции, как барьеры памяти, в которых состояние памяти синхронизируется между всеми потоками программы.

    Этот флаг синхронизации памяти в C++ используется по-умолчанию, т.к. с ним меньше всего проблем с точки зрения корректности выполнения программы. Но seq_cst является дорогой операцией для процессоров, в которых вычислительные ядра слабо связаны между собой в плане механизмов обеспечения консистентности памяти. Например, для x86-64 seq_cst дешевле, чем для ARM архитектур.

    Продемонстрируем второе свойство. Пример 4, из книги [1], link:

    std::atomic<bool> x, y;
    std::atomic<int> z;
     
    void thread_write_x() {
    	x.store(true, std::memory_order_seq_cst);
    }
     
    void thread_write_y() {
    	y.store(true, std::memory_order_seq_cst);
    }
     
    void thread_read_x_then_y() {
    	while (!x.load(std::memory_order_seq_cst));
    	if (y.load(std::memory_order_seq_cst)) {
    		++z;
    	}
    }
     
     
    void thread_read_y_then_x() {
    	while (!y.load(std::memory_order_seq_cst));
    	if (x.load(std::memory_order_seq_cst)) {
    		++z;
    	}
    }

    После того, как все четыре потока отработают, значение переменной z будет равно 1 или 2, потому что потоки thread_read_x_then_y и thread_read_y_then_x "увидят" изменения x и y в одном и том же порядке. От запуска к запуску это могут быть: сначала x = true, потом y = true, или сначала y = true, потом x = true.

    Модификатор seq_cst всегда может быть использован вместо relaxed и acquire/release, еще и поэтому он является модификатором по-умолчанию. Удобно использовать seq_cst для отладки проблем, связанных с гонкой данных в многопоточной программе: добиваемся корректной работы программы и далее заменяем seq_cst на менее строгие флаги синхронизации памяти. Примеры 1 и 2 также будут корректно работать, если заменить relaxed на seq_cst, а пример 3 начнет работать корректно после такой замены.

    Синхронизация пары. Acquire/Release

    Флаг синхронизации памяти acquire/release является более тонким способом синхронизировать данные между парой потоков. Два ключевых слова: memory_order_acquire и memory_order_release работают только в паре над одним атомарным объектом. Рассмотрим их свойства:

    • модификация атомарной переменной с release будет видна видна в другом потоке, выполняющим чтение этой же атомарной переменной с acquire

    • все модификации памяти в потоке thread1, выполняющей запись атомарной переменной с release, будут видны после выполнения чтения той же переменной с acquire в потоке thread2

    • процессор и компилятор не могут перенести операции записи в память раньше release операции в потоке thread1, и нельзя перемещать выше операции чтения из памяти позже acquire операции в потоке thread2

    Важно понимать, что нет полного порядка между операциями над разными атомиками, происходящих в разных потоках. Например, в примере 4 если все операции store заменить на memory_order_release, а операции load заменить на memory_order_acquire, то значение z после выполнения программы может быть равно 0, 1 или 2. Это связано с тем, что, независимо от того в каком порядке по времени выполнения выполнены store для x и y, потоки thread_read_x_then_y и thread_read_y_then_x могут увидеть эти изменения в разных порядках. Кстати, такими же изменениями для load и store можно исправить пример 3. Такое изменение будет корректным и производительными, т.к. тут нам не требуется единый порядок изменений между всеми потоками (как в случае с seq_cst ), а требуется синхронизировать память между двумя потоками.

    Используя release, мы даем инструкцию, что данные в этом потоке готовы для чтения из другого потока. Используя acquire, мы даем инструкцию "подгрузить" все данные, которые подготовил для нас первый поток. Но если мы делаем release и acquire на разных атомарных переменных, то получим UB вместо синхронизации памяти.

    Рассмотрим реализацию простейшего мьютекса, который ожидает в цикле сброса флага, для того, чтобы получить lock. Такой мьютекс называют spinlock. Это не самый эффективный способ реализации мьютекса, но он обладает всеми нужными свойствами, на которые я хочу обратить внимание. Пример 5, link

    class mutex {
    public:
    	void lock() {
    		bool expected = false;
    		while(!_locked.compare_exchange_weak(expected, true, std::memory_order_acquire)) {
    			expected = false;
    		}
    	}
     
    	void unlock() {
    		_locked.store(false, std::memory_order_release);
    	}
     
    private:
    	std::atomic<bool> _locked;
    };

    Функция lock() непрерывно пробует сменить значение с false на true с модификатором синхронизации памяти acquire. Разница между compare_exchage_weak и strong незначительна, про нее можно почитать на cppreference. Функция unlock() выставляет значение в false с синхронизацией release. Обратите внимание, что мьютекс не только обеспечивает эксклюзивным доступ к блоку кода, который он защищает. Он так же делает доступным те изменения памяти, которые были сделаны до вызова unlock() в коде, который будет работать после вызова lock(). Это важное свойство. Иногда может сложиться ошибочное мнение, что мьютекс в конкретном месте не нужен.

    Рассмотрим такой пример, называемый Double Checked Locking Anti-Pattern из [2]. Пример 6, link:

    struct Singleton {
    	// ...
    };
     
    static Singleton* singleton = nullptr;
    static std::mutex mtx;
    static bool initialized = false;
     
    void lazy_init() {
    	if (initialized) // early return to avoid touching mutex every call
    		return;
     
    	std::unique_lock l(mtx); // `mutex` locks here (acquire memory)
    	if (!initialized) {
    		singleton = new Singleton();
    		initialized = true;
    	}
    	// `mutex` unlocks here (release memory)
    }

    Идея проста: хотим единожды в рантайме инициализировать объект Singleton. Это нужно сделать потокобезопасно, поэтому имеем мьютекс и флаг инициализации. Т.к. создается объект единожды, а используется singleton указатель в read-only режиме всю оставшуюся жизнь программы, то кажется разумным добавить предварительную проверку if (initialized) return. Данный код будет корректно работать на архитектурах процессора с более строгими гарантиями консистентности памяти, например в x86-64. Но данный код неверный с точки зрения стандарта C++. Давайте рассмотрим такой сценарий использования:

    void thread1() {
    	lazy_init();
    	singleton->do_job();
    }
     
    void thread2() {
    	lazy_init();
    	singleton->do_job();
    }

    Рассмотрим следующую последовательность действий во времени:

    1. сначала отрабатывает thread1 -> выполняет инициализацию под мьютексом:

    • lock мьютекса (acquire)

    • singleton = ..

    • initialized = true

    • unlock мьютекса (release)

    2. далее в игру вступает thread2:

    • if(initalized) возвращает true (память, где содержится initialized могла быть неявно синхронизирована между ядрами процессора)

    • singleton->do_job() приводит к segmentation fault (указатель singleton не обязан был быть синхронизирован с потоком thread1)

    Этот случай интересен тем, что наглядно показывает роль мьютекса не только как примитива синхронизации потока выполнения, но и синхронизации памяти.

    Семантика acquire/release классов стандартной библиотеки

    Механизм acquire/release поможет понять гарантии синхронизации памяти, которые предоставляют классы стандартной библиотеки для работы с потоками. Ниже приведу список наиболее часто используемых операций.

    std::thread::(constructor) vs функция потока

    Вызов конструктора объекта std::thread (release) синхронизирован со стартом работы функции нового потока (acquire). Таким образом функция потока будет видеть все изменения памяти, которые произошли до вызова конструктора в исходном потоке.

    std::thread::join vs владеющий поток

    После успешного вызова join поток, в котором был вызван join, "увидит" все изменения памяти, которые были выполнены завершившимся потоком.

    std::mutex::lock vs std::mutex::unlock

    успешный lock синхронизирует память, которая была изменена до вызова предыдущего unlock.

    std::promise::set_value vs std::future::wait

    set_value синхронизирует память с успешным wait.

    И так далее. Полный список можно найти в книге [1].

    Что это все значит? Повторю эту важную мысль еще раз: это значит, на примере std::promise::set_value и std::future::wait, что тут мы не только получили данные, которые содержатся в примитиве синхронизации, но и нам доступны все изменения памяти, которые были в потоке до того, как он выполнил set_value. Это маленькое чудо нам кажется само собой разумеющееся с нашим бытовым, последовательным причинно-следственным, взглядом на мир. Но в мире многоядерного процессора, законы которого больше похожи на квантовую физику, которую никто до конца не понимает, нет единого последовательно порядка изменения памяти в разных ядрах процессора, если это не затребовано разработчиком явно, или неявно через многопоточные примитивы.

    Заключение

    Сложно представить современную C++ программу, которая была бы однопоточной. Опасно писать многопоточные программы, не имея представления о правилах синхронизации памяти. Я считаю, что нужно знать как работают атомики в C++. Чтобы не совершать ошибок типа volatile bool, чтобы понимать какие изменения в каких потоках будут видны после использования того или иного многопоточного примитива, чтобы использовать read-modify-write атомарные операции вместо мьютекса, там где это возможно. Данная статья помогла мне систематизировать материал, который я находил в разных источниках и освежить знания в памяти. Надеюсь, она поможет и вам!

    Источники

    [1] Anthony Williams. C++ Concurrency in Action. https://www.amazon.com/C-Concurrency-Action-Practical-Multithreading/dp/1933988770

    [2] Tony van Eerd. C++ Memory Model & Lock-Free Programming. https://www.youtube.com/watch?v=14ntPfyNaKE

    Комментарии 16

      +1
      На самом деле, интереснее каноничный пример с синглтоном:
      static Singleton* singleton = nullptr;
      static std::mutex mtx;
       
      Singleton *instance() {
      	if (singleton ) // early return to avoid touching mutex every call
      		return singleton;
       
      	std::unique_lock l(mtx); // `mutex` locks here (acquire memory)
      	if (!singleton)
      		singleton = new Singleton();
              return singleton;
      	// `mutex` unlocks here (release memory)
      }


      Казалось бы, тут всё хорошо? Но нет, Александреску в своей статье пишет что всё плохо.
      singleton = new Singleton();

      может развернуться в что-то типа такого
      
      // выделили память и записали указатель,
      singleton = (Singleton*)malloc(sizeof(Singleton)); 
      // если второй тред прочитает указатель в этом месте, то всё упадет
      // а вот теперь создали объект (тут еще куча операций)
      new (singleton) Singleton();
      

      Мы же хотим что-то типа такого
      
      auto tmp = (Singleton*)malloc(sizeof(Singleton)); // выделили память
      new (tmp) Singleton(); // создали объект
      singleton = tmp; // записали указатель
      

      Но, понятное дело, гарантий что будет выбран вариант 2 нам никто не дает (скорее всего, не будет, потому что это медленнее). Если же руками написать этот код, то компилятор также может соптимизировать в вариант 1.
      К счастью, начиная с С++11 не должна больше болеть голова о синглтонах=)
        +4
        Самый простой для понимания флаг синхронизации памяти — relaxed.

        Флаг синхронизации памяти «единая последовательность» (sequential consistency, seq_cst) самый строгий и понятный


        Хорошо, когда самых понятных флагов два. Лучше бы, конечно, три.
          0
          Спасибо, что заметили. Поменяю слова. Вообще «понятный», «простой для понимания» — это слишком субъективно.
          0

          Ооо, спасибо за статью! Как раз сейчас дорешиваю https://leetcode.com/problemset/concurrency/ (можно сдавать решения и на С++).

            0
            Пожалуйста, Хорошего кодинга на leetcode!
            0
            Можно ли использовать std::atomic с разделяемой памятью? Насколько это безопасно?
              0

              IPC всмысле? Это платформозависимо всегда. В Linux(pthread) есть специальный флаг делающий мьютексы и тд "межпроцесными". Конкретно std::atomic не работает(нет такой гарантии) в IPC.

                0
                Можете, пожалуйста, пояснить свою мысль? Мне казалось, PTHREAD_PROCESS_SHARED даёт возможность ОС правильно обрабатывать ситуацию, если заблокировать spinlock не получилось и пришлось воспользоваться futex() (который иначе будет вызван с FUTEX_PRIVATE_FLAG). А shared memory в архитектуре абстрактной машины ничем не отличается, используется ли в 1 или разных процессах.
                  0

                  Почему нет гарантий? std::atomic — это про память и инструкции процессора. И, насколько мне известно, стандарт не регламентирует в какой именно памяти должна быть расположена atomic переменная. Кмк тут все зависит от конкретной имплементации std::atomic.

                0
                Классная статья, подписался!
                  +3
                  Статья весьма хорошая и интересная, но пара неточностей несколько снижает, на мой взгляд, её полезность.
                  1. Выполнение нескольких потоков на одном процессоре в режиме разделения времени не дает гарантии того, что выполнение оператором C++ операции вида read-modify-write будет защищено от вмешательства со стороны другого потока. Потому что эта операция транслируется в несколько машинных команд. Выполнение потока может быть прервано после одной из команд середине операции, и управление после этого может быть передано другому потоку, который внесет конфликтующие изменения.
                  В однопроцессорной системе есть только гарантия того, что данные не будут изменены другим потоком во время выполнения одной машинной команды, а в многопроцессорной — нет и этой гарантии. Однако с точки зрения программы на языке высокого уровня это мало что меняет.
                  2. Мьютекс не реализуется через атомарные операции. Для его работы требуется обращение к ядру ОС. Потому что при возникновении состояния ожидания потока необходимо обратиться к планировщику в ядре ОС, чтобы он запустил на выполнение другой поток (варианты планировщиков пользовательского режима, в которых единицей исполнения является не поток режима ядра, а другие конструкции, аналогичные promise или Task в других языках, я не тут не рассмартриваю). Ядро ОС же может использовать для синхронизации доступа к общим для нескольких процессоров структурам данных другие механизмы (например, спин-блокировки или межпроцессорные прерывания).
                  Да, существуют «легкие» варианты реализации мьютекса (в Windows — критическая секция), в которых обращение к ядру откладывается, насколько это возможно, чтобы не вызывать ядро, когда блокировка с передачей управления другому потоку не происходит либо состояние блокировки очень быстро проходит. И для реализации такого поведения действительно используются атомарные операции. Но для осуществления передачи процессора для выполнения другого потока обращение к ядру неизбежно.
                  Полную семантику мьютексов — с перепланированием потоков — на атомарных операциях реализовать невозможно, максимум что возможно — это реализовать семантику спин-блокировки, которая захватывает процессор вместо того, чтобы передать его другому потоку для выполнения.

                  Впрочем, в большинстве практических применений эти неточности существенной роли не играют.
                  И ещё. Я считаю, что, говоря о разнице между compare_exchange_strong и compare_exchange_weak, следовало бы уделить ей больше внимания хотя бы в практическом аспекте: что для надежного использования compare_exchange_weak необходимо организовывать циклическую поверку при неудачном сравнении, а вариант compare_exchange_strong этого не требует, но зато он обходится дороже (потому как требует немедленной синхронизации кэшей процессоров, что в некоторых архитектурах является весьма дорогой операцией) — в статье по приведенной ссылке все это, естественно, есть, но далеко не в первых ее словах.
                    +1
                    Спасибо за ваши развернутые замечания!

                    По 1. Полностью с вами согласен. Я подправлю текст статьи.

                    По 2. Все таки не соглашусь с вами. Атомарные операции (инструкции процессора) — более фундаментальное понятие, чем мьютекс в операционной системе. Реализация мьютексов в OS реализованы на атомиках (по крайней мере в linux).

                    Вот кусок из mutex.c из исходных кодов линукс:
                    /*
                     * Optimistic trylock that only works in the uncontended case. Make sure to
                     * follow with a __mutex_trylock() before failing.
                     */
                    static __always_inline bool __mutex_trylock_fast(struct mutex *lock)
                    {
                    	unsigned long curr = (unsigned long)current;
                    	unsigned long zero = 0UL;
                    
                    	if (atomic_long_try_cmpxchg_acquire(&lock->owner, &zero, curr))
                    		return true;
                    
                    	return false;
                    }
                    
                    static __always_inline bool __mutex_unlock_fast(struct mutex *lock)
                    {
                    	unsigned long curr = (unsigned long)current;
                    
                    	if (atomic_long_cmpxchg_release(&lock->owner, curr, 0UL) == curr)
                    		return true;
                    
                    	return false;
                    }
                    


                    Вы правы, что мьютекс в OS более «умный», чем спин лок и взаимодействует с планировщиком потоков, но это не убирает с него обязанностей атомарно «включить» или «выключить» блокировку, что реализована на атомиках, как показывает исходный код выше.

                    3. Про compare_exchange_weak vs strong. Я с вами согласен. Но этот вопрос достаточно внятно описан в документации этих методов. Мне не хотелось тратить время читателя на «простые вещи», описанные в документации. В том числе на такие, как std::atomic::is_lock_free и std::atomic_flag.
                  0

                  Поясните, пожалуйста. Когда в примере с мьютексом вы пишете: "Он так же делает доступным те изменения памяти, которые были сделаны до вызова unlock() в коде, который будет работать после вызова lock()" — дело касается всех модифицированных переменных, не только атомиков?


                  Или другим потокам будут гарантированно видны только все изменённые атомики? Или всё-таки для получения актуального значения атомика надо вызвать load или acquire-операцию? В чём заключается роль мьютекса по синхронизации изменений памяти?

                    0
                    К моему стыду я не понимаю как «ожидание» реализовано на процессоре (пусть 86, например), поэтому задам вопрос здесь, вроде тематика подходит. Для простоты — пусть у нас есть всего один поток, есть какой-то код, который захватил мьютекс, и есть второй, который его ждет. Что именно (на уровне байткода, наверное?) происходит в момент «ожидания»? Можно просто ссылку что «покурить», буду благодарен.

                    Ну и второй вопрос, который как по мне схож. Вот у меня есть ядро процессора, оно выполняет 100 операций в секунду. Но в данный момент у меня есть ему предложить только 50. Понятное дело что там есть какое-то квантование по времени. Но что делает ядро в те кванты, когда делать нечего? Молотит nop'ы? Думаю что сейчас врятли, энергоэффективность же. Считаем что частоту снижать уже некуда (я сейчас про всякие «base clock 1.2, boost clock 100500 GHz». Или оно все равно снижает ниже, просто юзер не в курсе?
                      0
                      Программист: *хочет синхронизировать данные между двумя потоками*.
                      Язык программирования: вот вам конструкция для синхронизации.
                      Программист: спасибо.
                      Язык программирования: только помните, что есть нюансы для разных архитектур
                      Язык программирования: и 5 флагов, меняющих алгоритм работы, не синхронизируя то одно, то другое.
                      Программист:
                      Язык программирования: а если сделать вот так (*с виду логичная и непротиворечивая конструкция*), то всё упадет в самый неожиданный момент!
                      Программист:
                      Язык программирования: в следующей версии стандарта будет ещё удобнее, добавим ещё десяток флагов и способов синхронизации (с нюансами, как вы любите), не благодарите!

                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                      Самое читаемое