david
/
flash-attention
Mirror von https://github.com/Dao-AILab/flash-attention


			
				
					
						
						
							123
							# @package train.optimizer
_target_: apex.optimizers.FusedAdam
adam_w_mode: True