Search Results for author: R Srikant

The Dynamics of Gradient Descent for Overparametrized Neural Networks

We consider the dynamics of gradient descent (GD) in overparameterized single hidden layer neural networks with a squared loss function.

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.