Algorisme del gradient descendent

L'algorisme del gradient descendent és un mètode iteratiu d'optimització de primer ordre per a trobar el mínim d'una funció. S'anomena descendent perquè el prenen els increments proporcionals al negatiu del gradient de la funció. Si es prenen increments positius al gradient, s'anomena gradient ascendent.^[1]^[2]^[3]

Aquest mètode s'empra sovint com una extensió de l'algorisme de retropropagació usat en l'entrenament de xarxes neuronals artificials.

Descripció

El gradient descendent es basa en el fet que si la funció multivariable $F(x)$ està definida i és derivable al voltant d'un punt $a$ , llavors $F(x)$ decreix de la manera més ràpida si es va des del punt $a$ en direcció del gradient negatiu de $F$ en $a$ , o sigui $-\nabla F(\mathbf {a} )$ . Aleshores la seqüència de punts és: