Šta je RAG? (Kratki odgovor)

RAG (Retrieval-Augmented Generation) je tehnika u kojoj AI model, prije nego što generiše odgovor, pretražuje vašu privatnu bazu znanja i koristi pronađene informacije kao kontekst. Rezultat: tačni, relevantni odgovori bazirani na vašim podacima — ne samo na treningu modela.

Problem koji RAG rješava

Standardni LLM modeli imaju tri kritična ograničenja za poslovnu upotrebu:

Datum treninga: model ne zna šta se desilo nakon njegovog posljednjeg treninga
Nedostaje vaše znanje: model ne poznaje vaše interne procese, politike ili katalog
Halucinacije: kada ne zna, model može izmisliti uvjerljiv ali netačan odgovor

RAG eliminiše sva tri problema.

Kako RAG funkcioniše — korak po korak

1. Indeksiranje (jednom)

Vaši dokumenti (PDF, Word, baze podataka, web stranice) se dijele na segmente i pretvaraju u vektore — matematičke reprezentacije značenja teksta.

2. Dohvatanje (u realnom vremenu)

Kada korisnik postavi pitanje, sistem pronalazi semantički najsličnije segmente — ne po ključnoj riječi, nego po značenju upita.

3. Generisanje s kontekstom

LLM generiše odgovor koristeći pronađene segmente kao kontekst. Odgovor je utemeljen u vašim podacima i može citirati izvor.

Što možete staviti u RAG bazu znanja?

Praktično sve što postoji kao tekst:

Interni pravilnici i procedure
Katalog proizvoda i cjenik
Prethodni ugovori i tender dokumentacija
FAQ i historija support tiketa
Finansijski izvještaji i prezentacije
Email arhiva (selektivno)

RAG vs. fine-tuning: što odabrati?

Česta greška je pokušati "naučiti" model vašem znanju kroz fine-tuning. RAG je u većini poslovnih slučajeva bolji izbor:

Troškovi: RAG je znatno jeftiniji od fine-tuninga
Ažurnost: RAG baza se ažurira odmah; fine-tuning zahtijeva ponovni trening
Transparentnost: RAG može citirati izvor; fine-tuning ne može
Kontrola: lakše je upravljati što ulazi u RAG nego u fine-tuning dataset

Fine-tuning ima smisla samo kada trebate fundamentalno promijeniti stil ili ponašanje modela.

Napredne RAG tehnike u 2026.

Hybrid search

Kombinacija semantičkog pretraživanja i klasičnog full-text searcha — poboljšava recall za specifične termine i akronime koji su bitni u vašoj domeni.

Re-ranking

Nakon inicijalnog dohvatanja, sekundarni model rangira rezultate po relevantnosti — značajno povećava preciznost odgovora.

Agentic RAG

Kombinacija Agentic AI arhitekture i RAG-a: agent odlučuje kada i kako pretraživati bazu, može postavljati potpitanja i iterativno refinirati odgovor za kompleksne upite.

Primjeri iz prakse

Pravna firma: paralegal koji pretražuje 10.000 ugovora — od 4 sata na 3 minute.

Distributivna kompanija: prodajni tim dobija instantne odgovore o dostupnosti, cijenama i rokovima isporuke bez čekanja na back-office.

Javna uprava: građani dobijaju tačne odgovore na regulatorna pitanja 24/7, bez preopterećenja šalterskog osoblja.

Za automatizovanu obradu dokumenata koji ulaze u RAG bazu, pogledajte vodič o IDP tehnologiji.

Česta pitanja

Koliko dokumenata može RAG obraditi?

Nema gornje granice. Sistemi s kojima radimo sežu od nekoliko stotina do miliona dokumenata.

Koji jezici su podržani?

Bosanski, srpski i hrvatski su u potpunosti podržani kroz multilingual embedding modele.

Koliko traje implementacija?

Bazični RAG sistem za jednu domenu može biti operativan za 2–4 tjedna. Kompleksne integracije s legacy sistemima traju 2–3 mjeseca.

Šta s povjerljivim podacima?

RAG može raditi u potpunosti on-premise ili u privatnom cloud okruženju — bez slanja vaših podataka eksternim LLM provajderima.

RAG revolucija: pretraživanjem prošireno generisanje