70
70
no_proxy : " "
71
71
LOGFLAG : " "
72
72
vLLM_ENDPOINT : " insert-your-remote-inference-endpoint"
73
- LLM_MODEL : " meta-llama/Meta-Llama-3.1-8B-Instruct"
74
- LLM_MODEL_ID : " meta-llama/Meta-Llama-3.1-8B-Instruct"
75
- MODEL_ID : " meta-llama/Meta-Llama-3.1-8B-Instruct"
73
+ LLM_MODEL : " meta-llama/Meta-Llama-3.1-70B-Instruct"
74
+ MODEL_ID : " meta-llama/Meta-Llama-3.1-70B-Instruct"
76
75
CLIENTID : " "
77
76
CLIENT_SECRET : " "
78
77
TOKEN_URL : " "
@@ -216,6 +215,10 @@ data:
216
215
proxy_set_header X-Real-IP $remote_addr;
217
216
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
218
217
proxy_set_header X-Forwarded-Proto $scheme;
218
+ proxy_buffering off;
219
+ proxy_cache off;
220
+ proxy_request_buffering off;
221
+ gzip off;
219
222
}
220
223
221
224
location /v1/dataprep {
@@ -552,6 +555,9 @@ spec:
552
555
{}
553
556
containers :
554
557
- name : chatqna-ui
558
+ env :
559
+ - name : MODEL_ID
560
+ value : " meta-llama/Meta-Llama-3.1-70B-Instruct"
555
561
securityContext :
556
562
{}
557
563
image : " opea/chatqna-ui:latest"
@@ -691,7 +697,7 @@ spec:
691
697
seccompProfile :
692
698
type : RuntimeDefault
693
699
image : " opea/embedding-tei:latest"
694
- imagePullPolicy : IfNotPresent
700
+ imagePullPolicy : Always
695
701
ports :
696
702
- name : embedding-usvc
697
703
containerPort : 6000
@@ -769,7 +775,7 @@ spec:
769
775
seccompProfile :
770
776
type : RuntimeDefault
771
777
image : " opea/llm-vllm:latest"
772
- imagePullPolicy : IfNotPresent
778
+ imagePullPolicy : Always
773
779
ports :
774
780
- name : llm-uservice
775
781
containerPort : 9000
@@ -919,7 +925,7 @@ spec:
919
925
seccompProfile :
920
926
type : RuntimeDefault
921
927
image : " opea/reranking-tei:latest"
922
- imagePullPolicy : IfNotPresent
928
+ imagePullPolicy : Always
923
929
ports :
924
930
- name : reranking-usvc
925
931
containerPort : 8000
@@ -1257,7 +1263,7 @@ spec:
1257
1263
- name : EMBEDDING_SERVICE_HOST_IP
1258
1264
value : chatqna-embedding-usvc
1259
1265
- name : MODEL_ID
1260
- value : " meta-llama/Meta-Llama-3.1-8B -Instruct"
1266
+ value : " meta-llama/Meta-Llama-3.1-70B -Instruct"
1261
1267
securityContext :
1262
1268
allowPrivilegeEscalation : false
1263
1269
capabilities :
@@ -1269,7 +1275,7 @@ spec:
1269
1275
seccompProfile :
1270
1276
type : RuntimeDefault
1271
1277
image : " opea/chatqna-wrapper:latest"
1272
- imagePullPolicy : IfNotPresent
1278
+ imagePullPolicy : Always
1273
1279
volumeMounts :
1274
1280
- mountPath : /tmp
1275
1281
name : tmp
0 commit comments