Не уверен на 100%, но я думаю, что это тоже можно сделать. Если у вас открыт порт jtag, вы можете подключиться к Trace32 и проверить максимальное использование стека. Хотя для этого вам придется дать начальный довольно большой произвольный размер стека.
Конкретно для i386 я бы попробовал:
bjam toolset = darwin architecture = x86 address-model = 32