Skip to content

Commit 88a69c8

Browse files
authored
Fix YDB Import 799 (#17901)
1 parent 136dec6 commit 88a69c8

File tree

10 files changed

+32
-32
lines changed

10 files changed

+32
-32
lines changed

ydb/docs/en/core/concepts/_includes/vector_search_exact.md

Lines changed: 0 additions & 9 deletions
This file was deleted.

ydb/docs/en/core/concepts/vector_search.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -24,13 +24,13 @@ The choice of a method depends on the number of vectors and the nature of the wo
2424

2525
## Exact vector search {#vector-search-exact}
2626

27-
{% include [vector_search_exact.md](_includes/vector_search_exact.md) %}
27+
{% include [vector_search_exact.md](../yql/reference/_includes/vector_search_exact.md) %}
2828

2929
Learn more about [exact vector search](../yql/reference/udf/list/knn.md#exact-vector-search-examples).
3030

3131
## Approximate vector search without index {#vector-search-approximate}
3232

33-
{% include [vector_search_approximate.md](_includes/vector_search_approximate.md) %}
33+
{% include [vector_search_approximate.md](../yql/reference/_includes/vector_search_approximate.md) %}
3434

3535
Learn more about [approximate vector search without index](../yql/reference/udf/list/knn.md#approximate-vector-search-examples).
3636

Original file line numberDiff line numberDiff line change
@@ -1,14 +1,14 @@
11
Approximate methods do not perform a complete enumeration of the initial data. This allows significantly speeding up the search process, although it might lead to some reduction in the quality of the results.
22

3-
[Scalar Quantization](../../yql/reference/udf/list/knn.md#approximate-vector-search-scalar-quantization) is a method of reducing vector dimensionality, where a set of coordinates is mapped into a space of smaller dimensions.
3+
[Scalar Quantization](../udf/list/knn.md#approximate-vector-search-scalar-quantization) is a method of reducing vector dimensionality, where a set of coordinates is mapped into a space of smaller dimensions.
44

55
{{ ydb-short-name }} supports vector searching for vector types `Float`, `Int8`, `Uint8`, and `Bit`. Consequently, it is possible to apply scalar quantization to transform data from `Float` to any of these types.
66

77
Scalar quantization reduces the time required for reading and writing data by decreasing the number of bytes. For example, when quantizing from `Float` to `Bit`, each vector is reduced by 32 times.
88

9-
[Approximate vector search without an index](../../yql/reference/udf/list/knn.md#approximate-vector-search-examples) uses a very simple additional data structure - a set of vectors with other quantization. This allows the use of a simple search algorithm: first, a rough preliminary search is performed on the compressed vectors, followed by refining the results on the original vectors.
9+
[Approximate vector search without an index](../udf/list/knn.md#approximate-vector-search-examples) uses a very simple additional data structure - a set of vectors with other quantization. This allows the use of a simple search algorithm: first, a rough preliminary search is performed on the compressed vectors, followed by refining the results on the original vectors.
1010

1111
Main advantages:
1212

13-
* Full support for [transactions](../../concepts/glossary.md#transactions), including in strict consistency mode.
13+
* Full support for [transactions](../../../concepts/glossary.md#transactions), including in strict consistency mode.
1414
* Instant application of data modification operations: insertion, update, deletion.
Lines changed: 9 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,9 @@
1+
The foundation of the exact method is the calculation of the distance from the query vector to all the vectors in the dataset. This algorithm, also known as the naive approach or brute force method, has a runtime of `O(dn)`, where `n` is the number of vectors in the dataset, and `d` is their dimensionality.
2+
3+
[Exact vector search](../udf/list/knn.md#exact-vector-search-examples) is best utilized if the complete enumeration of the vectors occurs within acceptable time limits. This includes cases where they can be pre-filtered based on some condition, such as a user identifier. In such instances, the exact method may perform faster than the current implementation of [vector indexes](../../../dev/vector-indexes.md).
4+
5+
Main advantages:
6+
7+
* No need for additional data structures, such as specialized [vector indexes](../../../concepts/glossary.md#vector-index).
8+
* Full support for [transactions](../../../concepts/glossary.md#transactions), including in strict consistency mode.
9+
* Instant execution of data modification operations: insertion, update, deletion.

ydb/docs/en/core/yql/reference/udf/list/knn.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -8,11 +8,11 @@ The k-NN problem solution is divided into two major subclasses of methods: exact
88

99
### Exact method {#exact-method}
1010

11-
{% include [vector_search_exact.md](../../../../concepts/_includes/vector_search_exact.md) %}
11+
{% include [vector_search_exact.md](../../_includes/vector_search_exact.md) %}
1212

1313
### Approximate methods {#approximate-methods}
1414

15-
{% include [vector_search_approximate.md](../../../../concepts/_includes/vector_search_approximate.md) %}
15+
{% include [vector_search_approximate.md](../../_includes/vector_search_approximate.md) %}
1616

1717
{% note info %}
1818

ydb/docs/ru/core/concepts/_includes/vector_search_exact.md

Lines changed: 0 additions & 9 deletions
This file was deleted.

ydb/docs/ru/core/concepts/vector_search.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -24,13 +24,13 @@
2424

2525
## Точный векторный поиск {#vector-search-exact}
2626

27-
{% include [vector_search_exact.md](_includes/vector_search_exact.md) %}
27+
{% include [vector_search_exact.md](../yql/reference/_includes/vector_search_exact.md) %}
2828

2929
Подробнее о [точном векторном поиске](../yql/reference/udf/list/knn.md#exact-vector-search-examples).
3030

3131
## Приближенный векторный поиск без индекса {#vector-search-approximate}
3232

33-
{% include [vector_search_approximate.md](_includes/vector_search_approximate.md) %}
33+
{% include [vector_search_approximate.md](../yql/reference/_includes/vector_search_approximate.md) %}
3434

3535
Подробнее о [приближенном векторном поиске без индекса](../yql/reference/udf/list/knn.md#approximate-vector-search-examples).
3636

Original file line numberDiff line numberDiff line change
@@ -1,14 +1,14 @@
11
Приближенные методы не осуществляют полный перебор исходных данных. Это позволяет значительно ускорить процесс поиска, хотя и может привести к некоторому снижению качества результатов.
22

3-
[Скалярное квантование](../../yql/reference/udf/list/knn.md#approximate-vector-search-scalar-quantization) — это метод уменьшения размерности векторов, при котором множество координат отображается в пространство меньшей размерности.
3+
[Скалярное квантование](../udf/list/knn.md#approximate-vector-search-scalar-quantization) — это метод уменьшения размерности векторов, при котором множество координат отображается в пространство меньшей размерности.
44

55
{{ ydb-short-name }} поддерживает векторный поиск по векторам типов `Float`, `Int8`, `Uint8`, `Bit`. Следовательно, возможно применение скалярного квантования для преобразования данных из `Float` в любой из этих типов.
66

77
Скалярное квантование сокращает время, необходимое для чтения и записи данных, за счёт уменьшения числа байт. Например, при квантовании из `Float` в `Bit` каждый вектор сокращается в 32 раза.
88

9-
[Приближенный векторный поиск без индекса](../../yql/reference/udf/list/knn.md#approximate-vector-search-examples) использует очень простую дополнительную структуру данных - множество векторов с другими квантованием. Это позволяет использовать простой алгоритм поиска: сначала грубый предварительный поиск по сжатым векторам, а затем уточнять результаты по исходным векторам.
9+
[Приближенный векторный поиск без индекса](../udf/list/knn.md#approximate-vector-search-examples) использует очень простую дополнительную структуру данных - множество векторов с другими квантованием. Это позволяет использовать простой алгоритм поиска: сначала грубый предварительный поиск по сжатым векторам, а затем уточнять результаты по исходным векторам.
1010

1111
Основные преимущества:
1212

13-
* полная поддержка [транзакций](../../concepts/glossary.md#transactions),в том числе в режиме строгой согласованности;
13+
* полная поддержка [транзакций](../../../concepts/glossary.md#transactions),в том числе в режиме строгой согласованности;
1414
* мгновенное применение операций модификации данных: вставка, обновление, удаление.
Lines changed: 9 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,9 @@
1+
В основе точного метода лежит вычисление расстояния от вектора запроса до всех векторов в наборе данных. Этот алгоритм, также известный как наивный подход или метод грубой силы, имеет время выполнения `O(dn)`, где `n` — количество векторов в наборе данных, а `d` — их размерность.
2+
3+
[Точный векторный поиск](../udf/list/knn.md#exact-vector-search-examples) лучше использовать, если полный перебор искомых векторов происходит за приемлемое время. В том числе, когда их можно предварительно отфильтровать по некоторому условию, например, по идентификатору пользователя. В таких случаях точный метод может работать быстрее, чем текущая реализация [векторных индексов](../../../dev/vector-indexes.md)
4+
5+
Основные преимущества:
6+
7+
* отсутствие необходимости в дополнительных структурах данных, таких как специализированные [векторные индексы](../../../concepts/glossary.md#vector-index);
8+
* полная поддержка [транзакций](../../../concepts/glossary.md#transactions), в том числе в режиме строгой согласованности;
9+
* мгновенное применение операций модификации данных: вставка, обновление, удаление.

ydb/docs/ru/core/yql/reference/udf/list/knn.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -8,11 +8,11 @@
88

99
### Точный метод {#exact-method}
1010

11-
{% include [vector_search_exact.md](../../../../concepts/_includes/vector_search_exact.md) %}
11+
{% include [vector_search_exact.md](../../_includes/vector_search_exact.md) %}
1212

1313
### Приближенные методы {#approximate-methods}
1414

15-
{% include [vector_search_approximate.md](../../../../concepts/_includes/vector_search_approximate.md) %}
15+
{% include [vector_search_approximate.md](../../_includes/vector_search_approximate.md) %}
1616

1717
{% note info %}
1818

0 commit comments

Comments
 (0)