Ассемблерный код для sin (x) с помощью расширения Taylor

Question

Ассемблерный код для sin (x) с помощью расширения Taylor

Мое личное мнение - то, что использование require_once (или include_once) является плохой практикой, потому что require_once проверяет на Вас, если Вы уже включали тот файл, и подавите ошибки двойных включенных файлов, приводящих к фатальным ошибкам (как двойное объявление функций/классов/и т.д.).

необходимо знать, необходимо ли включать файл.

10

assembly x86 trigonometry

задан Michael Petch 2 September 2019 в 19:14

3 ответа

Вы не указываете, какая архитектура ЦП, поэтому я предполагаю, что x86.

Более простой (и, возможно, самый неэффективный) способ - написать формулу в RPN, которая может быть отображена почти напрямую к инструкциям FPU.

Пример,

алгебраическая формула: x - (x ^ 3/3!) + (x ^ 5/5!)

RPN: xxx * x * 3 2 * / - xx * x * x * x * 5 4 * 3 * 2 * / +

, который становится:

fld x
fld x
fld x
fmul
fld x
fmul
fild [const_3]
fild [const_2]
fmul
fdiv
fsub
fld x
fld x
fmul 
fld x
fmul
fld x
fmul
fld x
fmul
fild [const_5]
fild [const_4]
fmul
fild [const_3]
fmul
fild [const_2]
fmul
fdiv
fadd

Есть несколько очевидных стратегий оптимизации -

вместо вычисления x, x x x , x x x x x и т. д. для каждого термина, сохраните "бегущий продукт" и просто умножить на x * x каждый раз
вместо вычисление факториала для каждого термин, сделайте тот же «запущенный продукт»

Вот некоторый закомментированный код для x86 FPU, комментарии после каждой инструкции FPU показывают состояние стека после выполнения этой инструкции, с вершиной стека (st0) слева, например:

fldz ; 0
fld1 ; 1, 0

- snip -

bits 32

section .text

extern printf
extern atof
extern atoi
extern puts
global main

taylor_sin:
  push eax
  push ecx

  ; input :
  ;  st(0) = x, value to approximate sin(x) of
  ;  [esp+12] = number of taylor series terms

  ; variables we'll use :
  ; s = sum of all terms (final result)
  ; x = value we want to take the sin of
  ; fi = factorial index (1, 3, 5, 7, ...)
  ; fc = factorial current (1, 6, 120, 5040, ...)
  ; n = numerator of term (x, x^3, x^5, x^7, ...)

  ; setup state for each iteration (term)
  fldz ; s x
  fxch st1 ; x s
  fld1 ; fi x s
  fld1 ; fc fi x s
  fld st2 ; n fc fi x s

  ; first term
  fld st1 ; fc n fc fi x s
  fdivr st0,st1 ; r n fc fi x s
  faddp st5,st0 ; n fc fi x s

  ; loop through each term
  mov ecx,[esp+12] ; number of terms
  xor eax,eax ; zero add/sub counter

loop_term:
  ; calculate next odd factorial
  fld1 ; 1 n fc fi x s
  faddp st3 ; n fc fi x s
  fld st2 ; fi n fc fi x s
  fmulp st2,st0
  fld1 ; 1 n fc fi x s
  faddp st3 ; n fc fi x s
  fld st2 ; fi n fc fi x s
  fmulp st2,st0 ; n fc fi x s

  ; calculate next odd power of x
  fmul st0,st3 ; n*x fc fi x s
  fmul st0,st3 ; n*x*x fc fi x s

  ; divide power by factorial
  fld st1 ; fc n fc fi x s
  fdivr st0,st1 ; r n fc fi x s

  ; check if we need to add or subtract this term
  test eax,1
  jnz odd_term
  fsubp st5,st0 ; n fc fi x s
  jmp skip
odd_term:
  ; accumulate result
  faddp st5,st0 ; n fc fi x s
skip:
  inc eax ; increment add/sub counter
  loop loop_term

  ; unstack work variables
  fstp st0
  fstp st0
  fstp st0
  fstp st0

  ; result is in st(0)

  pop ecx
  pop eax

  ret

main:

  ; check if we have 2 command-line args
  mov eax, [esp+4]
  cmp eax, 3
  jnz error

  ; get arg 1 - value to calc sin of
  mov ebx, [esp+8]
  push dword [ebx+4]
  call atof
  add esp, 4

  ; get arg 2 - number of taylor series terms
  mov ebx, [esp+8]
  push dword [ebx+8]
  call atoi
  add esp, 4

  ; do the taylor series approximation
  push eax
  call taylor_sin
  add esp, 4

  ; output result
  sub esp, 8
  fstp qword [esp]
  push format
  call printf
  add esp,12

  ; return to libc
  xor eax,eax
  ret

error:
  push error_message
  call puts
  add esp,4
  mov eax,1
  ret

section .data

error_message: db "syntax: <x> <terms>",0
format: db "%0.10f",10,0

запуск программы:

$ ./taylor-sine 0.5 1
0.4791666667
$ ./taylor-sine 0.5 5
0.4794255386
$ echo "s(0.5)"|bc -l
.47942553860420300027

11

ответ дан 3 December 2019 в 16:30

Почему? Код операции FCOS и FSIN уже существует с процессора 80387 (около 1987 г.)

источник:

http://ref.x86asm.net/coder32.html

Википедия

Личный друг из демонстрационной сцены

7

ответ дан 3 December 2019 в 16:30

Другие вопросы по тегам:

assembly x86 trigonometry

Ассемблерный код для sin (x) с помощью расширения Taylor

3 ответа

Похожие вопросы: