Skip to content

Commit

Permalink
Update 2.使用 Embedding API.md
Browse files Browse the repository at this point in the history
  • Loading branch information
logan-zou authored Dec 29, 2024
1 parent d3a4b39 commit a180a69
Showing 1 changed file with 4 additions and 7 deletions.
11 changes: 4 additions & 7 deletions docs/C3/2.使用 Embedding API.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,13 +4,10 @@
## 一、使用OpenAI API
GPT有封装好的接口,我们简单封装即可。目前GPT embedding mode有三种,性能如下所示:

|模型 | 每美元页数 | [MTEB](https://github.com/embeddings-benchmark/mteb)得分 | [MIRACL](https://github.com/project-miracl/miracl)得分|
| --- | --- | --- | --- |
|text-embedding-3-large|9,615|54.9|64.6|
|text-embedding-3-small|62,500|62.3|44.0|
|text-embedding-ada-002|12,500|61.0|31.4|
* MTEB得分为embedding model分类、聚类、配对等八个任务的平均得分。
* MIRACL得分为embedding model在检索任务上的平均得分。
![image](https://github.com/user-attachments/assets/a7b3f731-3411-48f0-8316-0a4ae57a7bc0)

* [MTEB](https://github.com/embeddings-benchmark/mteb)得分为embedding model分类、聚类、配对等八个任务的平均得分。
* [MIRACL](https://github.com/project-miracl/miracl)得分为embedding model在检索任务上的平均得分。

从以上三个embedding model我们可以看出`text-embedding-3-large`有最好的性能和最贵的价格,当我们搭建的应用需要更好的表现且成本充足的情况下可以使用;`text-embedding-3-small`有着较好的性能跟价格,当我们预算有限时可以选择该模型;而`text-embedding-ada-002`是OpenAI上一代的模型,无论在性能还是价格都不如及前两者,因此不推荐使用。

Expand Down

0 comments on commit a180a69

Please sign in to comment.