Support n_batch to improve inference performance

2025-12-22 07:40:12 +01:00 · 2023-06-11 21:33:35 +02:00 · 2023-06-11 21:33:35 +02:00 · ad661933cb
commit ad661933cb
parent 52eb020256
3 changed files with 5 additions and 2 deletions
--- a/example.env
+++ b/example.env
@ -3,4 +3,5 @@ MODEL_TYPE=GPT4All
 MODEL_PATH=models/ggml-gpt4all-j-v1.3-groovy.bin
 EMBEDDINGS_MODEL_NAME=all-MiniLM-L6-v2
 MODEL_N_CTX=1000
+MODEL_N_BATCH=8
 TARGET_SOURCE_CHUNKS=4