koboldcpp-1.57 - CUDA 12.3 build

kalomaze released this 08 Feb 23:31

· 102 commits to concedo since this release

22a4d84

I have merged the (currently unmerged) llama.cpp PR for Mixtral prompt processing to be faster. Should be about a ~1.25x prompt processing speed improvement for all CPU layers.

Assets 3

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

koboldcpp-1.57 - CUDA 12.3 build