Blogi

Miksi siirryimme runtime-RAG:in tuolle puolen

Runtime-RAG hajoaa agenttikuormissa: toistuva nouto kuluttaa laskentaa ja rikkoo determinismin. Miksi käännetty tieto ja Copyl Knowledge Briefs siirtävät päättelyn pois kyselyajasta.

Useimpien tiimien käyttämä arkkitehtuuri AI-agenttien ankkurointiin rakennettiin eri ongelmaa varten. Näin muuttui kaikki, kun lopetimme päättelyn kyselyhetkellä.


Toiminut malli — kunnes ei enää

Kaksi vuotta retrieval-augmented generation oli oletustapa antaa kielimallille pääsy yksityiseen dataan. Pilko dokumentit, upota ne, tallenna vektoritietokantaan, nouda top-k osumat kyselyhetkellä ja liitä ne kehotteeseen. Se toimi. Se toimii yhä kertaluonteisiin kysymyksiin staattisten dokumenttien yli.

Agenttikuormat rikkovat mallin.

Agentti ei esitä yhtä kysymystä. Se ajaa kymmeniä työkalukutsuja, joissa jokainen palaa samaan kontekstiin alusta. Jokainen istunto alkaa tyhjästä. Jokainen nouto tulkitsee samat palaset uudelleen. Jokainen vastaus on tuore päättelykierros raakatekstistä, jonka malli on jo käsitellyt tuhansia kertoja.

Alan arvioiden mukaan 80–85 % agenttilaskennasta menee uudelleen löytämiseen tehtävän suorittamisen sijaan. Tarkasta luvusta voidaan väitellä, mutta kuvio on totta: sama tietopohja, sama agentti, rakenteeltaan samankaltaiset kysymykset, sama tulkintatyö yhä uudelleen.

Se ei ole nouto-ongelma. Se on arkkitehtuuri-ongelma.

Mitä runtime-RAG ei skaalassa kestä

Kolme asiaa pettää mittakaavassa.

Determinismi. Suorita sama tehtävä kahdesti samoja dokumentteja vasten, ja agentti voi palauttaa eri vastaukset ilman jäljitystä siitä, mikä lähde ohjasi kumpaakin tulosta. Työnkulussa, jossa on compliance, auditointi, talous tai HR, se on rakenteellinen diskvalifikaatio. Et voi toimittaa agenttia, joka antaa eri luvun tiistaina kuin maanantaina.

Kustannus. Päättely kyselyhetkellä maksaa inferenssitokeneita työstä, jota ei olisi tarvinnut tehdä kyselyhetkellä. Mitä käytännön kohta tarkoittaa, ei vaihdu istuntojen välillä. Sen uudelleen johtaminen jokaisella kutsulla on vero jokaiselle käyttäjälle.

Lainausten rehellisyys. Dokumenttitason lainaukset — “vastaus tuli tästä PDF:stä” — eivät riitä, kun väite rakentuu kolmesta lauseesta kahden luvun yli. Säännellyillä aloilla ostajat haluavat väitetason provenienssin luottamuslukuineen. Pelkkä vektorin samankaltaisuus ei tuota sitä.

Siirtymä: siirrä päättely käännösaikaan

Selkeä arkkitehtoninen siirtymä on käynnissä. Lyhyesti:

Lopeta lähdedatan tulkinta kyselyhetkellä. Tulkitse kerran käännösaikaan ja tallenna tulos.

Vektori-indeksi ei katoa. Siitä tulee pitkähäntäisten kysymysten varasuunnitelma, ei pääovi. Sen eteen tulee esikäännettyjen artefaktien kerros: tiivistetyt yhteenvedot, entiteetti-indeksit, rakennekartat, väite–lainaus -graafit, konfliktirekisterit. Agentti lukee ensin käännetyn tiedon ja turvautuu raakaan noutoon vain, jos kysymys ei sovi mihinkään artefaktiin.

Tämä ei ole uusi ajatus ohjelmistoissa. Materialisoidut näkymät, build-putket, ahead-of-time-käännös — kypsät alustat siirtävät ennen pitkää kalliin tulkinnan pois kuumalta polulta. AI-infrastruktuuri vihdoin saavuttaa.

Miten Copyl hoitaa tämän — natiivisti

Käännetty tietokerros voidaan koota erilaisista osista: vektorivarasto täällä, orkestrointityökalu tuolla, oma pipeline liimaamaan. Se toimii — kunnes täytyy skaalata tenanttien, agenttien, käytäntöjen, kielten ja auditointivaatimusten yli kerralla. Silloin saumat ovat työtä.

Copylissa käännös on alustan ensiluokkainen osa, ei jälkiistutettu lisä.

Tietopohja — kirjat, luvut ja markdown-dokumentit — käännetään Knowledge Briefseiksi: tehtäväoptimoituja esityksiä, sidottuina tiettyyn Agenttiprofiiliin. Brief sisältää:

  • Tiivistetyn yhteenvedon, joka on viritetty agentin laajuuteen ja personaan
  • Entiteetti-indeksin, joka poimitaan kerran, ei johdeta uudelleen per kysely
  • Rakennekartan pohjana olevista kirjoista ja luvuista
  • Lainausten graafin, joka linkittää väitteen lähdekohtaan luottamusluvulla
  • Konfliktirekisterin, jossa dokumenttien ristiriidat havaitaan ja ratkaistaan agentin omilla käytännöillä ja SOP:illa

Ratkaisevaa ei ole käännösaskel erillään — vaan integraatio sen ympärillä.

Agenttiprofiilit ovat tehtäväspesifikaatio. Jokainen Copyl-agentti ilmoittaa jo laajuutensa, personansa ja tavoitteensa. Briefit käännetään suoraan tätä profiilia vasten. Erillistä tehtävänmäärittelykerrosta ei tarvitse ylläpitää.

Käytännöt ja SOP:t ohjaavat konfliktien ratkaisua. Kun kaksi dokumenttia on ristiriidassa, ratkaisusääntö ei ole ad hoc — se tulee asiakkaan jo kirjoittamista käytännöistä ja SOP:eista. Compliance ei ole liimattu loppuun; se on totuus, jota kääntäjä käyttää.

CIP tekee mitätöinnistä automaattisen. Kun dokumentti, luku tai kirja muuttuu, alustan tapahtumaväylä mitätöi Briefit ja jonottaa uudelleenkäännöksen. Ei ulkoista orkestrointia, ei manuaalista välimuistin tyhjennystä.

“Haarauta, älä riko” pätee käännettyyn tietoon. Malliagenteilla on malli-Briefejä. Kun asiakas muokkaa agenttia tai tietopohjaa, Brief haarautuu tenantille — alkuperä ei korruptoidu, eikä yhden asiakkaan käännetty tieto vuoda toisen ajonaikaiseen ympäristöön.

Versioitu ja auditointivalmis oletuksena. Jokainen Brief on versioitu, jokainen väite lähteellinen, jokainen konfliktin ratkaisu kirjattu. Auditointijälki on artefakti, ei jälkikäteen rekonstruoitu.

Mistä ostajat todella välittävät

Tekninen tarina on kiinnostava. Ostajatarina on lyhyempi.

Sama vastaus kahdesti. Toistettavuus ei ole enää toivelista.

Alempi kustannus per kysely. Käännetty artefakti on pienempi ja kohdennetumpi kuin raaka noutokuorma.

Auditoinnin kestävät lainaukset. Jokainen väite kytketään lähdekohtaan luottamusluvulla. Compliance- ja lakitiimit voivat hyväksyä.

Moniasiakasturvallisuus ilman ylimääräistä putkitusta. Tenant-erottelu toteutuu käännöskerroksessa, ei improvisoiden ajonaikaisesti.

Monikielisyys ilman käännöstä ajonaikaisesti. Käännös tuottaa Briefejä kielillä, joilla tietopohja ja käyttäjä todella kommunikoivat — ei lennossa käännöksen veroa.

Nämä eivät ole ominaisuuksia. Ne ovat erotus agentin välillä, jonka voi demonstroida, ja agentin välillä, jonka voi ottaa tuotantoon.

Mitä emme sano

Käännetty tiedon kerros ei ole hopealuoti. Siinä on overhead: käännös työt kuluttavat tokeneita etukäteen, Brief vanhenee jos mitätöinti ei ole kytketty oikein, ja arkkitehtuuri maksaa itsensä takaisin vasta merkittävällä kyselyvolyymilla. Tiimit, joilla on vain muutama kysely päivässä agenttia kohden, kannattaa ensin korjata hybridinouto ja uudelleenjärjestys.

Emme myöskään usko runtime-RAG:n katoavan. Siitä tulee varakerros ensisijaisen sijaan — mikä jälkikäteen oli aina sen luontainen paikka.

Mihin tämä johtaa

Tuotantoagentteja toimittavat tiimit vuonna 2026 näyttävät enemmän kurinalaiselta datainfrastruktuurilta kuin älykkäiltä prompt-putkilta. Uutuusarvopremiumille “meillä on AI-agentti” on ohi. Premium jatkossa on agenteissa, jotka ovat halpoja, toistettavia, auditointivalmiita ja ankkuroituja tietoon, jota rakentajat voivat puolustaa.

Se on rimataso.

Copylissa Knowledge Compilation Layer on tapamme ylittää se — ja koska se on rakennettu samaan alustaan, joka jo omistaa agentit, käytännöt, datan ja tapahtumat, sinun ei tarvitse koota sitä itse.

Ota yhteyttä

Varaa demo, ota yhteyttä tukeen tai tutustu kumppanuumahdollisuuksiin. Autamme rakentamaan, integroimaan ja automatisoida nopeammin.

Lähetä viesti

Täytä lomake alla, niin palaamme asiaan 24 tunnin kuluessa.

Required fields are marked with *. Do not send passwords, card numbers, or other sensitive data through this form.