Использование SIMD регистров в многопоточном коде
я запускаю 4 потока в своем коде, каждый поток в определенный момент выполняет функцию, в которой используются 512-битные регистры. Всего есть 32 регистра, а в каждом потоке в функции объявляется 8 переменных типа __m512. Вроде все хорошо, но что если потоков будет 8, как компьютер будет справляться? И все ли правильно в моем рассуждении выше?
Источник: Stack Overflow на русском