david
/
flash-attention
mirror of https://github.com/Dao-AILab/flash-attention


			
				
					
						
						
							123456
							# @package _global_
model:
  config:
    n_embd: 1600
    n_head: 25
    n_layer: 48