Gomorron!
God morgon! Jag har skrivit en server för ett AI-startup i clojure senaste veckorna. När jag började programmera så skulle servern svara på <50 ms nu är man glad om det tar < 3 s. Inte det hållet jag förväntade mig att saker skulle utvecklas.
Vanskelig å si noe som helst med så lite info. Men, hva gjør serberen når den starter opp? Tok det 50ms å få repl’et opp når du startet prosjektet og det tar nå 3 sek? Hvor mange linjer kode snakker vi om? Er det en helt kald start på en maskin som ikke har dependenciene liggende?
Jag menar den tiden för en request! Förr: request in -> db call -> svara. Nu: Request in -> LLM -> db call -> llm -> svar 🙂
Right 🙂
Hur är tiden fördelad?
Man behöver lösa det bra med Ux, så att det syns hur snabbt servern svarar och vad man egentligen väntar på. Om man vet att det är en LLM som är inblandad och det snurrar en sån spinner där svaret skall komma så känns 3s snabbt. Ibland är bästa Ux att strömma svaret, eller “tänkandet”.
Ledsen för torrt och furnumstigt inlägg. Håller med om att mycket med utvecklingen av saker är förvånande.
Ja! det är det vi tittar på nu, bara så att användare kan få något att göra under tiden allt snurrar.
I VS Code Copilot har de lyckats få det så att man känner sig som en superdirgent medan man egentligen bara är en vänta-på-kod-användare.
@emil0r mycket bildanalys! Det är det som tar mest tid.
God morgon
Morron!