Cargando…

Mutual Information Based Learning Rate Decay for Stochastic Gradient Descent Training of Deep Neural Networks

This paper demonstrates a novel approach to training deep neural networks using a Mutual Information (MI)-driven, decaying Learning Rate (LR), Stochastic Gradient Descent (SGD) algorithm. MI between the output of the neural network and true outcomes is used to adaptively set the LR for the network,...

Descripción completa

Detalles Bibliográficos
Autor principal:	Vasudevan, Shrihari
Formato:	Online Artículo Texto
Lenguaje:	English
Publicado:	MDPI 2020
Materias:	Article
Acceso en línea:	https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7517082/ https://www.ncbi.nlm.nih.gov/pubmed/33286332 http://dx.doi.org/10.3390/e22050560

Ejemplares similares

Stochastic gradient descent optimisation for convolutional neural network for medical image segmentation
por: Nagendram, Sanam, et al.
Publicado: (2023)

Dynamics of stochastic gradient descent for two-layer neural networks in the teacher–student setup
por: Goldt, Sebastian, et al.
Publicado: (2020)

Stochastic gradient descent for optimization for nuclear systems
por: Williams, Austin, et al.
Publicado: (2023)

On Scalable Deep Learning and Parallelizing Gradient Descent
por: Hermans, Joeri
Publicado: (2017)

Complexity control by gradient descent in deep networks
por: Poggio, Tomaso, et al.
Publicado: (2020)

Iterative deep neural networks based on proximal gradient descent for image restoration
por: Lv, Ting, et al.
Publicado: (2022)

Pangenome graph layout by Path-Guided Stochastic Gradient Descent
por: Heumos, Simon, et al.
Publicado: (2023)

Parameter inference for discretely observed stochastic kinetic models using stochastic gradient descent
por: Wang, Yuanfeng, et al.
Publicado: (2010)

An Improvised Sentiment Analysis Model on Twitter Data Using Stochastic Gradient Descent (SGD) Optimization Algorithm in Stochastic Gate Neural Network (SGNN)
por: Vidyashree, K. P., et al.
Publicado: (2023)

A Geometric Interpretation of Stochastic Gradient Descent Using Diffusion Metrics
por: Fioresi, Rita, et al.
Publicado: (2020)

Implicit Stochastic Gradient Descent Method for Cross-Domain Recommendation System
por: Vo, Nam D., et al.
Publicado: (2020)

Using the Stochastic Gradient Descent Optimization Algorithm on Estimating of Reactivity Ratios
por: Fazakas-Anca, Iosif Sorin, et al.
Publicado: (2021)

Efficient neural codes naturally emerge through gradient descent learning
por: Benjamin, Ari S., et al.
Publicado: (2022)

A Scalable Bayesian Sampling Method Based on Stochastic Gradient Descent Isotropization
por: Franzese, Giulio, et al.
Publicado: (2021)

Dissecting Deep Learning Networks—Visualizing Mutual Information
por: Fang, Hui, et al.
Publicado: (2018)

Optimization by Adaptive Stochastic Descent
por: Kerr, Cliff C., et al.
Publicado: (2018)

Sentiment classification for employees reviews using regression vector- stochastic gradient descent classifier (RV-SGDC)
por: Gaye, Babacar, et al.
Publicado: (2021)

Mutual information density of stochastic integrate-and-fire models
por: Bernardi, Davide, et al.
Publicado: (2013)

Correspondence between neuroevolution and gradient descent
por: Whitelam, Stephen, et al.
Publicado: (2021)

Gradient-Descent-like Ghost Imaging
por: Yu, Wen-Kai, et al.
Publicado: (2021)

Learning Domain-Independent Deep Representations by Mutual Information Minimization
por: Wang, Ke, et al.
Publicado: (2019)

Mutual Information Rate and Bounds for It
por: Baptista, Murilo S., et al.
Publicado: (2012)

Gradient Descent Optimization in Gene Regulatory Pathways
por: Das, Mouli, et al.
Publicado: (2010)

Online Learning for DNN Training: A Stochastic Block Adaptive Gradient Algorithm
por: Liu, Jianghui, et al.
Publicado: (2022)

FB-CCNN: A Filter Bank Complex Spectrum Convolutional Neural Network with Artificial Gradient Descent Optimization
por: Xu, Dongcen, et al.
Publicado: (2023)

A Novel Framework for Abnormal Risk Classification over Fetal Nuchal Translucency Using Adaptive Stochastic Gradient Descent Algorithm
por: Verma, Deepti, et al.
Publicado: (2022)

Multi-Depth Computer-Generated Hologram Based on Stochastic Gradient Descent Algorithm with Weighted Complex Loss Function and Masked Diffraction
por: Quan, Jiale, et al.
Publicado: (2023)

XGANDALF – extended gradient descent algorithm for lattice finding
por: Gevorkov, Yaroslav, et al.
Publicado: (2019)

BioGD: Bio-inspired robust gradient descent
por: Kulikovskikh, Ilona, et al.
Publicado: (2019)

Beyond convexity—Contraction and global convergence of gradient descent
por: Wensing, Patrick M., et al.
Publicado: (2020)

Suspicion Distillation Gradient Descent Bit-Flipping Algorithm
por: Ivaniš, Predrag, et al.
Publicado: (2022)

Optimization of Gradient Descent Parameters in Attitude Estimation Algorithms
por: Sever, Karla, et al.
Publicado: (2023)

Gradient Descent Provably Solves Nonlinear Tomographic Reconstruction
por: Fridovich-Keil, Sara, et al.
Publicado: (2023)

Stochastic Mirror Descent Dynamics and Their Convergence in Monotone Variational Inequalities
por: Mertikopoulos, Panayotis, et al.
Publicado: (2018)

Stochastic Control for Bayesian Neural Network Training
por: Winkler, Ludwig, et al.
Publicado: (2022)

Inference of financial networks using the normalised mutual information rate
por: Goh, Yong Kheng, et al.
Publicado: (2018)

The gradient clusteron: A model neuron that learns to solve classification tasks via dendritic nonlinearities, structural plasticity, and gradient descent
por: Moldwin, Toviah, et al.
Publicado: (2021)

Reference-shaping adaptive control by using gradient descent optimizers
por: Alagoz, Baris Baykant, et al.
Publicado: (2017)

Online Gradient Descent for Kernel-Based Maximum Correntropy Criterion
por: Wang, Baobin, et al.
Publicado: (2019)

Correction: Beyond convexity—Contraction and global convergence of gradient descent
Publicado: (2020)

Cannot write session to /tmp/vufind_sessions/sess_cm56h4ibnp6sjea1d6lnjet6ud