david
/
flash-attention
miroir de https://github.com/Dao-AILab/flash-attention


			
				
					
						
						
							12
							# @package train.optimizer
_target_: apex.optimizers.FusedLAMB