opea-project
diff --git a/‎CodeGen/README.md
Lines changed: 1 addition & 7 deletions b/‎CodeGen/README.md
Lines changed: 1 addition & 7 deletions
diff --git a/‎CodeGen/kubernetes/intel/README_gmc.md renamed to ‎CodeGen/kubernetes/gmc/README.md b/‎CodeGen/kubernetes/intel/README_gmc.md renamed to ‎CodeGen/kubernetes/gmc/README.md
diff --git a/‎CodeGen/kubernetes/intel/hpu/gaudi/gmc/codegen_gaudi.yaml renamed to ‎CodeGen/kubernetes/gmc/codegen_gaudi.yaml b/‎CodeGen/kubernetes/intel/hpu/gaudi/gmc/codegen_gaudi.yaml renamed to ‎CodeGen/kubernetes/gmc/codegen_gaudi.yaml
diff --git a/‎CodeGen/kubernetes/intel/cpu/xeon/gmc/codegen_xeon.yaml renamed to ‎CodeGen/kubernetes/gmc/codegen_xeon.yaml b/‎CodeGen/kubernetes/intel/cpu/xeon/gmc/codegen_xeon.yaml renamed to ‎CodeGen/kubernetes/gmc/codegen_xeon.yaml
diff --git a/‎CodeGen/kubernetes/helm/README.md
Lines changed: 18 additions & 0 deletions b/‎CodeGen/kubernetes/helm/README.md
Lines changed: 18 additions & 0 deletions
diff --git a/‎CodeGen/kubernetes/helm/cpu-values.yaml
Lines changed: 9 additions & 0 deletions b/‎CodeGen/kubernetes/helm/cpu-values.yaml
Lines changed: 9 additions & 0 deletions
diff --git a/‎CodeGen/kubernetes/helm/gaudi-values.yaml
Lines changed: 28 additions & 0 deletions b/‎CodeGen/kubernetes/helm/gaudi-values.yaml
Lines changed: 28 additions & 0 deletions
diff --git a/‎CodeGen/kubernetes/intel/README.md
Lines changed: 0 additions & 48 deletions b/‎CodeGen/kubernetes/intel/README.md
Lines changed: 0 additions & 48 deletions
diff --git a/‎CodeGen/kubernetes/intel/cpu/xeon/manifest/README_react_ui.md
Lines changed: 0 additions & 38 deletions b/‎CodeGen/kubernetes/intel/cpu/xeon/manifest/README_react_ui.md
Lines changed: 0 additions & 38 deletions
@@ -145,15 +145,9 @@ docker compose up -d
 
 Refer to the [Xeon Guide](./docker_compose/intel/cpu/xeon/README.md) for more instructions on building docker images from source.
 
-### Deploy CodeGen using Kubernetes
-
-Refer to the [Kubernetes Guide](./kubernetes/intel/README.md) for instructions on deploying CodeGen into Kubernetes on Xeon & Gaudi.
-
 ### Deploy CodeGen into Kubernetes using Helm Chart
 
-Install Helm (version >= 3.15) first. Refer to the [Helm Installation Guide](https://helm.sh/docs/intro/install/) for more information.
-
-Refer to the [CodeGen helm chart](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts/codegen/README.md) for instructions on deploying CodeGen into Kubernetes on Xeon & Gaudi.
+Refer to the [CodeGen helm chart](./kubernetes/helm/README.md) for instructions on deploying CodeGen into Kubernetes on Xeon & Gaudi.
 
 ## Consume CodeGen Service
 
 
@@ -0,0 +1,18 @@
+# Deploy CodeGen on kubernetes cluster
+
+- You should have Helm (version >= 3.15) installed. Refer to the [Helm Installation Guide](https://helm.sh/docs/intro/install/) for more information.
+- For more deploy options, refer to [helm charts README](https://github.com/opea-project/GenAIInfra/tree/main/helm-charts#readme).
+
+## Deploy on Xeon
+
+```
+export HFTOKEN="insert-your-huggingface-token-here"
+helm install codegen oci://ghcr.io/opea-project/charts/codegen  --set global.HUGGINGFACEHUB_API_TOKEN=${HFTOKEN} -f cpu-values.yaml
+```
+
+## Deploy on Gaudi
+
+```
+export HFTOKEN="insert-your-huggingface-token-here"
+helm install codegen oci://ghcr.io/opea-project/charts/codegen  --set global.HUGGINGFACEHUB_API_TOKEN=${HFTOKEN} -f gaudi-values.yaml
+```
@@ -0,0 +1,9 @@
+# Copyright (C) 2024 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
+image:
+  repository: opea/codegen
+  tag: "latest"
+
+tgi:
+  LLM_MODEL_ID: Qwen/Qwen2.5-Coder-7B-Instruct
@@ -0,0 +1,28 @@
+# Copyright (C) 2024 Intel Corporation
+# SPDX-License-Identifier: Apache-2.0
+
+tgi:
+  accelDevice: "gaudi"
+  LLM_MODEL_ID: Qwen/Qwen2.5-Coder-7B-Instruct
+  image:
+    repository: ghcr.io/huggingface/tgi-gaudi
+    tag: "2.0.6"
+  resources:
+    limits:
+      habana.ai/gaudi: 1
+  MAX_INPUT_LENGTH: "1024"
+  MAX_TOTAL_TOKENS: "2048"
+  CUDA_GRAPHS: ""
+  livenessProbe:
+    initialDelaySeconds: 5
+    periodSeconds: 5
+    timeoutSeconds: 1
+  readinessProbe:
+    initialDelaySeconds: 5
+    periodSeconds: 5
+    timeoutSeconds: 1
+  startupProbe:
+    initialDelaySeconds: 5
+    periodSeconds: 5
+    timeoutSeconds: 1
+    failureThreshold: 120