@@ -322,6 +322,54 @@ int main(int argc, char ** argv) {
322
322
} else {
323
323
usage (argv[0 ]);
324
324
}
325
+ } else if (strcmp (argv[arg_idx], " --attn-q-type" ) == 0 ) {
326
+ if (arg_idx < argc-1 ) {
327
+ params.attn_q_type = parse_ggml_type (argv[++arg_idx]);
328
+ } else {
329
+ usage (argv[0 ]);
330
+ }
331
+ } else if (strcmp (argv[arg_idx], " --attn-k-type" ) == 0 ) {
332
+ if (arg_idx < argc-1 ) {
333
+ params.attn_k_type = parse_ggml_type (argv[++arg_idx]);
334
+ } else {
335
+ usage (argv[0 ]);
336
+ }
337
+ } else if (strcmp (argv[arg_idx], " --attn-v-type" ) == 0 ) {
338
+ if (arg_idx < argc-1 ) {
339
+ params.attn_v_type = parse_ggml_type (argv[++arg_idx]);
340
+ } else {
341
+ usage (argv[0 ]);
342
+ }
343
+ } else if (strcmp (argv[arg_idx], " --attn-qkv-type" ) == 0 ) {
344
+ if (arg_idx < argc-1 ) {
345
+ params.attn_qkv_type = parse_ggml_type (argv[++arg_idx]);
346
+ } else {
347
+ usage (argv[0 ]);
348
+ }
349
+ } else if (strcmp (argv[arg_idx], " --attn-output-type" ) == 0 ) {
350
+ if (arg_idx < argc-1 ) {
351
+ params.attn_output_type = parse_ggml_type (argv[++arg_idx]);
352
+ } else {
353
+ usage (argv[0 ]);
354
+ }
355
+ } else if (strcmp (argv[arg_idx], " --ffn-gate-type" ) == 0 ) {
356
+ if (arg_idx < argc-1 ) {
357
+ params.ffn_gate_type = parse_ggml_type (argv[++arg_idx]);
358
+ } else {
359
+ usage (argv[0 ]);
360
+ }
361
+ } else if (strcmp (argv[arg_idx], " --ffn-down-type" ) == 0 ) {
362
+ if (arg_idx < argc-1 ) {
363
+ params.ffn_down_type = parse_ggml_type (argv[++arg_idx]);
364
+ } else {
365
+ usage (argv[0 ]);
366
+ }
367
+ } else if (strcmp (argv[arg_idx], " --ffn-up-type" ) == 0 ) {
368
+ if (arg_idx < argc-1 ) {
369
+ params.ffn_up_type = parse_ggml_type (argv[++arg_idx]);
370
+ } else {
371
+ usage (argv[0 ]);
372
+ }
325
373
} else if (strcmp (argv[arg_idx], " --override-kv" ) == 0 ) {
326
374
if (arg_idx == argc-1 || !string_parse_kv_override (argv[++arg_idx], kv_overrides)) {
327
375
usage (argv[0 ]);
0 commit comments