Warning: preg_grep(): Compilation failed: quantifier does not follow a repeatable item at offset 142 in /var/www/tg-me/post.php on line 75
Библиотека собеса по Data Science | вопросы с собеседований | Telegram Webview: ds_interview_lib/230 -
Telegram Group & Telegram Channel
Что такое Local Sensitive Hash (LSH) и где он используется?

Это алгоритм, предназначенный для поиска ближайших соседей в больших наборах данных. Основывается на идее использования хеш-функции, которая переводит близкие объекты в один бакет (корзину).

У подходящих хеш-функций вероятность коллизии на близких объектах должна быть высокая, а на далёких — низкая. Иными словами, одинаковые хеш-значения должны с более высокой вероятностью присваиваться близким по некоторой метрике объектам.

При поиске ближайшего соседа для нового объекта сначала вычисляется его хеш-значение, а затем поиск ограничивается объектами в соответствующем бакете. Это позволяет значительно сократить объём данных, по которым необходимо провести поиск, а значит увеличить скорость обработки запросов.

LSH можно использовать в задачах, где требуется быстро находить похожие элементы в больших объёмах данных, например при поиске дубликатов документов или изображений в большом корпусе данных.

#машинное_обучение



tg-me.com/ds_interview_lib/230
Create:
Last Update:

Что такое Local Sensitive Hash (LSH) и где он используется?

Это алгоритм, предназначенный для поиска ближайших соседей в больших наборах данных. Основывается на идее использования хеш-функции, которая переводит близкие объекты в один бакет (корзину).

У подходящих хеш-функций вероятность коллизии на близких объектах должна быть высокая, а на далёких — низкая. Иными словами, одинаковые хеш-значения должны с более высокой вероятностью присваиваться близким по некоторой метрике объектам.

При поиске ближайшего соседа для нового объекта сначала вычисляется его хеш-значение, а затем поиск ограничивается объектами в соответствующем бакете. Это позволяет значительно сократить объём данных, по которым необходимо провести поиск, а значит увеличить скорость обработки запросов.

LSH можно использовать в задачах, где требуется быстро находить похожие элементы в больших объёмах данных, например при поиске дубликатов документов или изображений в большом корпусе данных.

#машинное_обучение

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/230

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

Telegram is riding high, adding tens of million of users this year. Now the bill is coming due.Telegram is one of the few significant social-media challengers to Facebook Inc., FB -1.90% on a trajectory toward one billion users active each month by the end of 2022, up from roughly 550 million today.

Библиотека собеса по Data Science | вопросы с собеседований from us


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA