5. maj 2026

Derfor gik vi videre fra runtime RAG

Runtime RAG knækker agent-arbejdsbyrder: gentagen retrieval spilder compute. Hvorfor Copyl Knowledge Briefs flytter ræsonnement væk fra forespørgselstid.

Den arkitektur de fleste teams bruger til at forankre AI-agenter blev bygget til et andet problem. Sådan ændrede ting sig, da vi stoppede med at ræsonnere på forespørgselstid.

Mønsteret der virkede — indtil det ikke gjorde det

I to år var retrieval-augmented generation standardmetoden til at give et sprogmodel adgang til private data. Opdel dokumenter, embed dem, gem dem i en vektordatabase, hent top-k ved forespørgselstid, indsæt dem i prompten. Det virkede. Det virker stadig til engangsspørgsmål over statiske dokumenter.

Agentiske workloads bryder mønsteret.

En agent stiller ikke ét spørgsmål. Den kører gennem dusinvis af tool-kald, og ved hvert genopdages samme kontekst fra bunden. Hver session starter tom. Hver retrieval fortolker de samme chunks på ny. Hvert svar er et frisk ræsonnement over råtekst, modellen allerede har behandlet tusind gange.

Ifølge brancheanslag går 80–85 % af agent-compute til genopdagelse frem for opgavefuldførelse. Vi kan diskutere det præcise tal, men mønsteret er reelt: samme vidensbase, spurgt af samme agent, strukturelt lignende spørgsmål, samme fortolkningsarbejde igen og igen.

Det er ikke et retrieval-problem. Det er et arkitekturproblem.

Hvad runtime RAG ikke kan ved skala

Tre ting knækker i stor skala.

Determinisme. Kør samme opgave to gange mod samme dokumenter, og en agent kan give forskellige svar uden spor af hvilken kilde der drev hvilket resultat. For workflows der berører compliance, revision, finans eller HR er det en strukturel diskvalifikation. I kan ikke levere en agent der giver et andet tal på tirsdag end på mandag.

Omkostning. Ræsonnement på forespørgselstid betyder inferens-tokens for arbejde der ikke behøvede at ske på forespørgselstid. Hvad et policy-afsnit betyder ændrer sig ikke mellem sessioner. At udlede det ved hvert kald er en skat på hver bruger.

Citation ærlighed. Dokumentniveau-citationer — “dette svar kom fra denne PDF” — er ikke nok når agentens påstand bygges fra tre sætninger på tværs af to kapitler. Købere i regulerede brancher vil have proveniens på påstands-niveau med konfidens-scorer. Vektor-lighed alene giver ikke det.

Skiftet: flyt ræsonnement til kompileringstid

Et klart arkitektonisk skifte er undervejs. Kort sagt:

Stop med at fortolke kildedata på forespørgselstid. Fortolk én gang ved kompileringstid og gem resultatet.

Vektorindekset forsvinder ikke. Det bliver fallback til long-tail-spørgsmål, ikke hoveddøren. Foran ligger et lag af præ-kompilerede artefakter: destillerede resumer, entitetsindekser, strukturkort, grafer med påstande og citationer, konfliktregistre. Agenten læser kompileret viden først og falder tilbage til rå retrieval kun når spørgsmålet ikke passer til nogen artefakt.

Det er ikke en ny idé i software. Materialiserede views, build-pipelines, ahead-of-time-kompilering — hver moden platform flytter før eller siden dyr fortolkning ud af den varme sti. AI-infrastrukturen indhenter endelig.

Sådan håndterer Copyl det — nativt

Et kompileret videnslag kan samles af forskellige dele: vektorlager her, orchestrering der, en custom pipeline som lim. Det virker — indtil det skal skaleres på tværs af tenants, agenter, politikker, sprog og krav til revision på én gang. Så bliver samlingerne arbejdet.

I Copyl er kompilering en førsteklasses del af platformen, ikke et påklæbet tilbyg.

Vidensbasen — Bøger, Kapitler og Docs i markdown — kompileres til Knowledge Briefs: opgaveoptimerede repræsentationer bundet til en specifik Agentprofil. En Brief indeholder:

Et destilleret resumé tilpasset agentens omfang og persona
Et entitetsindeks udtrukket én gang, ikke genafledt per forespørgsel
Et strukturkort over de underliggende Bøger og Kapitler
En citationsgraf der binder hver påstand til kildeafsnit med konfidens-score
Et konfliktregister hvor modsigelser mellem Docs opdages og løses med agentens egne politikker og SOP’er

Det der gør det holdbart er ikke kompileringstrinnet isoleret — det er integrationen omkring det.

Agentprofiler er opgavespecifikationen. Hver Copyl-agent erklærer allerede omfang, persona og mål. Briefs kompileres direkte mod den profil. Der er ikke et separat opgavelag at vedligeholde.

Politikker og SOP’er driver konfliktløsning. Når to Docs modsiger hinanden, er reglen ikke ad hoc — den kommer fra kundens allerede skrevne politikker og SOP’er. Compliance er ikke påklæbet til sidst; det er sandheden kompilatoren kører mod.

CIP gør invalidation automatisk. Når et Dokument, Kapitel eller Bog ændres, invaliderer platformens event-bus berørte Briefs og sætter rekompilering i kø. Intet eksternt orchestreringsværktøj, ingen manuel cache-flush.

“Fork, ikke ødelæg” gælder også kompileret viden. Skabelon-agenter har skabelon-Briefs. Når en kunde tilpasser agent eller KB, fork’es Brief per tenant — originalen ødelægges ikke, og én kunds kompilerede viden lækker ikke ind i en andens runtime.

Versionsstyret og revisionsklar som standard. Hver Brief er versioneret, hver påstand har kilde, hver konfliktløsning registreres. Revisionssporet er artefaktet, ikke noget rekonstrueret bagefter.

Hvad købere rent faktisk bekymrer sig om

Den tekniske historie er interessant. Køberhistorien er kortere.

Samme svar to gange. Reproducerbarhed ophører med at være ønskeliste.

Lavere omkostning per forespørgsel. Kompilerede artefakter er mindre og mere fokuserede end rå retrieval-payloads.

Revisionssikre citationer. Hver påstand knyttes til kildeafsnit med konfidens-score. Compliance og juridiske teams kan godkende.

Multi-tenant sikkerhed uden ekstra rør. Tenant-isolation håndhæves i kompileringsslaget, ikke improviseret ved runtime.

Flere sprog uden oversættelse ved runtime. Kompilering producerer Briefs på de sprog vidensbasen og brugeren faktisk taler — ingen oversættelsesskat i flyvet.

Det er ikke features. Det er forskellen mellem en agent I kan demo’e og en agent I kan deploy’e.

Hvad vi ikke siger

Kompilerede videnslag er ikke en sølvkugle. Der er overhead: kompileringsjobs koster tokens på forhånd, Briefs bliver forældede hvis invalidation ikke er korrekt tilsluttet, og arkitekturen betaler først tilbage ved meningsfuld forespørgselsvolumen. Teams med få forespørgsler pr. dag pr. agent bør først forbedre hybrid retrieval og reranking.

Vi tror heller ikke runtime RAG forsvinder. Den bliver et fallback-lag frem for det primære — hvilket i bakspejlet altid var dens rette plads.

Hvor det går hen

Teams der leverer produktions-agenter gennem 2026 vil ligne teams der kører disciplineret datainfrastruktur mere end teams der kører smarte prompt-pipelines. Novelty-premien for “vi har en AI-agent” er væk. Premien fremover er agenter der er billige, reproducerbare, revisionsklare og forankret i viden byggerne faktisk kan forsvare.

Det er barren.

I Copyl er Knowledge Compilation Layer hvordan vi møder den — og fordi den er bygget ind i samme platform der allerede ejer agenter, politikker, data og events, behøver I ikke samle den selv.

Alle indlæg