Historie revizí

Autor SHA1 Zpráva Datum
  AlpinDale f8dfac6372 chore: attention refactor and upstream sync apr01 (#365) před 11 měsíci
  AlpinDale 9810daa699 feat: INT8 KV Cache (#298) před 1 rokem
  AlpinDale 23389d0108 zero out a variable instead of vector in kernels před 1 rokem
  AlpinDale 081545bde6 fix: various CUDA kernel tweaks před 1 rokem
  AlpinDale 05d0a7e763 feat: adapt the attention kernels před 1 rokem
  AlpinDale 3c3944153c feat: add generic attention and FP32 dtype kernels před 1 rokem