From a180a69f6e1a8b2836159871fd37c1926f11abef Mon Sep 17 00:00:00 2001 From: Logan Zou <74288839+logan-zou@users.noreply.github.com> Date: Sun, 29 Dec 2024 22:58:40 +0800 Subject: [PATCH] =?UTF-8?q?Update=202.=E4=BD=BF=E7=94=A8=20Embedding=20API?= =?UTF-8?q?.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- "docs/C3/2.\344\275\277\347\224\250 Embedding API.md" | 11 ++++------- 1 file changed, 4 insertions(+), 7 deletions(-) diff --git "a/docs/C3/2.\344\275\277\347\224\250 Embedding API.md" "b/docs/C3/2.\344\275\277\347\224\250 Embedding API.md" index 771164c..eaaf398 100644 --- "a/docs/C3/2.\344\275\277\347\224\250 Embedding API.md" +++ "b/docs/C3/2.\344\275\277\347\224\250 Embedding API.md" @@ -4,13 +4,10 @@ ## 一、使用OpenAI API GPT有封装好的接口,我们简单封装即可。目前GPT embedding mode有三种,性能如下所示: -|模型 | 每美元页数 | [MTEB](https://github.com/embeddings-benchmark/mteb)得分 | [MIRACL](https://github.com/project-miracl/miracl)得分| -| --- | --- | --- | --- | -|text-embedding-3-large|9,615|54.9|64.6| -|text-embedding-3-small|62,500|62.3|44.0| -|text-embedding-ada-002|12,500|61.0|31.4| -* MTEB得分为embedding model分类、聚类、配对等八个任务的平均得分。 -* MIRACL得分为embedding model在检索任务上的平均得分。 +![image](https://github.com/user-attachments/assets/a7b3f731-3411-48f0-8316-0a4ae57a7bc0) + +* [MTEB](https://github.com/embeddings-benchmark/mteb)得分为embedding model分类、聚类、配对等八个任务的平均得分。 +* [MIRACL](https://github.com/project-miracl/miracl)得分为embedding model在检索任务上的平均得分。 从以上三个embedding model我们可以看出`text-embedding-3-large`有最好的性能和最贵的价格,当我们搭建的应用需要更好的表现且成本充足的情况下可以使用;`text-embedding-3-small`有着较好的性能跟价格,当我们预算有限时可以选择该模型;而`text-embedding-ada-002`是OpenAI上一代的模型,无论在性能还是价格都不如及前两者,因此不推荐使用。