Tag: LSH

Przewodnik po implementacji Minhash LSH: Deduplikacja

Implementacja Minhash LSH MinHash Locality Sensitive Hashing (LSH) to technika wykorzystywana do przybliżonego wyszukiwania najbliższych sąsiadów w przestrzeniach wielowymiarowych. Jest ona powszechnie stosowana w zadaniach takich jak wykrywanie bliskich duplikatów, systemy rekomendacji i grupowanie ogromnych ilości danych, podczas gdy algorytmy dokładnego najbliższego sąsiada mogą zapewnić wyższą dokładność, ale obliczeniowo są dość ciężkie i czasochłonne. Jako […]