Sziasztok, https://github.com/damesek/hnsw-clj native implementacioja a HNSW algoritmusnak, ha erdekes nektek. Python HNSW lib-et veri a gepemen.. persze sok minden van hatra. Pl vektor torles, update, GPU. WIP. Regi almom volt, ez.. mert most testre tudom majd szabni majd teljesen.. hiarchical-chunking-hoz
Csak leforditottam nekik. Az Interaktiv teszt részt szimplan egy meglévő szó szerint kikeres egy verset> a vershez hasonló top5 verset adja vissza. Hiearchikus chunkinggal tudnal majd jó eredményeket elérni pooled-embeddinggel. Ez nem a hnsw algoritmus implementalasanak a része
Nekem vizuális recall-nak kellett.
De 1-2 hét és egy library-va alakítom.. és úgy egyszerűbb lesz tesztelni .. rakok bele vlmi bert transformerszt is h embeddinget hozzon létre stb
Egyelőre a build a bottle neck, meg lehet szegmentalt architektúra kene oda mint pl elasticsearch.. Pff
Sajnos annyira nem triviális .. örülök h működik 😅 🙄
en nem nagyon ertek az llm kerdeshez olyan szinten, h mi az az embedding, de jo nez ki.
viszont a pelda output kicsit meglepo, mert semelyik idezet a talalati listaban nem tartalmazza a keresett szot, mivel le van roviditve.
valami link legalabb a bibliara jo lenne, h az ember ra birjon keresni a teljes mondatra a [2Sam 16:19] alapjan pl.
azt se ertem h miert angol idezetek vannak a peldaban, mikor azt irtad h "karoli bible"-t hasznaltal.
az nem magyar forditas?