Šta je RAG? (Kratki odgovor)
RAG (Retrieval-Augmented Generation) je tehnika u kojoj AI model, prije nego što generiše odgovor, pretražuje vašu privatnu bazu znanja i koristi pronađene informacije kao kontekst. Rezultat: tačni, relevantni odgovori bazirani na vašim podacima — ne samo na treningu modela.
Problem koji RAG rješava
Standardni LLM modeli imaju tri kritična ograničenja za poslovnu upotrebu:
- Datum treninga: model ne zna šta se desilo nakon njegovog posljednjeg treninga
- Nedostaje vaše znanje: model ne poznaje vaše interne procese, politike ili katalog
- Halucinacije: kada ne zna, model može izmisliti uvjerljiv ali netačan odgovor
RAG eliminiše sva tri problema.
Kako RAG funkcioniše — korak po korak
1. Indeksiranje (jednom)
Vaši dokumenti (PDF, Word, baze podataka, web stranice) se dijele na segmente i pretvaraju u vektore — matematičke reprezentacije značenja teksta.
2. Dohvatanje (u realnom vremenu)
Kada korisnik postavi pitanje, sistem pronalazi semantički najsličnije segmente — ne po ključnoj riječi, nego po značenju upita.
3. Generisanje s kontekstom
LLM generiše odgovor koristeći pronađene segmente kao kontekst. Odgovor je utemeljen u vašim podacima i može citirati izvor.
Što možete staviti u RAG bazu znanja?
Praktično sve što postoji kao tekst:
- Interni pravilnici i procedure
- Katalog proizvoda i cjenik
- Prethodni ugovori i tender dokumentacija
- FAQ i historija support tiketa
- Finansijski izvještaji i prezentacije
- Email arhiva (selektivno)
RAG vs. fine-tuning: što odabrati?
Česta greška je pokušati "naučiti" model vašem znanju kroz fine-tuning. RAG je u većini poslovnih slučajeva bolji izbor:
- Troškovi: RAG je znatno jeftiniji od fine-tuninga
- Ažurnost: RAG baza se ažurira odmah; fine-tuning zahtijeva ponovni trening
- Transparentnost: RAG može citirati izvor; fine-tuning ne može
- Kontrola: lakše je upravljati što ulazi u RAG nego u fine-tuning dataset
Fine-tuning ima smisla samo kada trebate fundamentalno promijeniti stil ili ponašanje modela.
Napredne RAG tehnike u 2026.
Hybrid search
Kombinacija semantičkog pretraživanja i klasičnog full-text searcha — poboljšava recall za specifične termine i akronime koji su bitni u vašoj domeni.
Re-ranking
Nakon inicijalnog dohvatanja, sekundarni model rangira rezultate po relevantnosti — značajno povećava preciznost odgovora.
Agentic RAG
Kombinacija Agentic AI arhitekture i RAG-a: agent odlučuje kada i kako pretraživati bazu, može postavljati potpitanja i iterativno refinirati odgovor za kompleksne upite.
Primjeri iz prakse
Pravna firma: paralegal koji pretražuje 10.000 ugovora — od 4 sata na 3 minute.
Distributivna kompanija: prodajni tim dobija instantne odgovore o dostupnosti, cijenama i rokovima isporuke bez čekanja na back-office.
Javna uprava: građani dobijaju tačne odgovore na regulatorna pitanja 24/7, bez preopterećenja šalterskog osoblja.
Za automatizovanu obradu dokumenata koji ulaze u RAG bazu, pogledajte vodič o IDP tehnologiji.
Česta pitanja
Koliko dokumenata može RAG obraditi?
Nema gornje granice. Sistemi s kojima radimo sežu od nekoliko stotina do miliona dokumenata.
Koji jezici su podržani?
Bosanski, srpski i hrvatski su u potpunosti podržani kroz multilingual embedding modele.
Koliko traje implementacija?
Bazični RAG sistem za jednu domenu može biti operativan za 2–4 tjedna. Kompleksne integracije s legacy sistemima traju 2–3 mjeseca.
Šta s povjerljivim podacima?
RAG može raditi u potpunosti on-premise ili u privatnom cloud okruženju — bez slanja vaših podataka eksternim LLM provajderima.
