5 مايو 2026

لماذا تجاوزنا RAG وقت التشغيل

RAG وقت التشغيل يتعثر مع أعباء الوكلاء: الاسترجاع المتكرر يهدر الموارد ويهدم الحتمية. لماذا Knowledge Briefs من Copyl تنقل الاستدلال خارج وقت الاستعلام.

البنية التي يستخدمها معظم الفرق لتثبيت وكلاء الذكاء الاصطناعي بُنيت لمشكلة مختلفة. إليك ما تغيّر عندما توقفنا عن الاستدلال وقت الاستعلام.

النمط الذي نجح — حتى لم يعد

لسنتين، كانت التوليد المعزز بالاسترجاع الطريقة الافتراضية لإعطاء نموذج لغوي إمكانية الوصول إلى بيانات خاصة. قسّم المستندات، ضمّنها، خزّنها في قاعدة متجهات، استرجع أفضل النتائج وقت الاستعلام، والصقها في الموجّه. نجح الأمر. ما يزال ينجح للأسئلة المنعزلة فوق مستندات ثابتة.

أعباء الوكلاء «الوكيلية» تكسر النمط.

الوكيل لا يطرح سؤالاً واحداً. يمرّ بعشرات استدعاءات الأدوات، وفي كل مرة يُعاد اكتشاف السياق نفسه من الصفر. كل جلسة تبدأ فارغة. كل استرجاع يُعيد تفسير القطع نفسها. كل إجابة هي مرور استدلال جديد على نص خام سبق أن عالجه النموذج آلاف المرّات.

بحسب تقديرات القطاع، يذهب 80–85٪ من حساب الوكيل إلى إعادة الاكتشاف بدلاً من إنجاز المهمة. يمكن الجدل حول الرقم، لكن النمط حقيقي: قاعدة المعرفة نفسها، يستعلمها الوكيل نفسه، بأسئلة متشابهة بنيوياً، يعيد العمل التفسيري مراراً.

هذه ليست مشكلة استرجاع. إنها مشكلة بنية.

ما لا يستطيع RAG وقت التشغيل فعله على نطاق واسع

ثلاثة أمور تنكسر عند التوسّع.

الحتمية. نفّذ المهمّة مرتين على المستندات نفسها وقد يعيد الوكيل إجابات مختلفة، دون سجل يبيّن أي مصدر قاد كل نتيجة. لأي سير عمل يمس الامتثال أو التدقيق أو المالية أو الموارد البشرية، هذا استبعاد بنيوي. لا يمكنك شحن وكيل يعطي رقماً مختلفاً يوم الثلاثاء عمّا أعطاه يوم الاثنين.

التكلفة. الاستدلال وقت الاستعلام يعني دفع رموز استدلال لعمل لم يكن يجب أن يحدث وقت الاستعلام. معنى قسم سياسة لا يتغيّر بين الجلسات. إعادة استخلاصه في كل استدعاء هي ضريبة على كل مستخدم.

صدق الاستشهاد. الاستشهاد على مستوى المستند — «هذه الإجابة جاءت من هذا PDF» — لا يكفي عندما يُبنى ادّعاء الوكيل من ثلاث جمل عبر فصلين. المشترون في قطاعات خاضعة للتنظيم يريدون مصدراً على مستوى الادّعاء مع درجات ثقة. تشابه المتجهات وحده لا ينتج ذلك.

التحوّل: نقل الاستدلال إلى وقت التجميع

تحوّل بنيوي واضح قيد التبلور. باختصار:

توقّفوا عن تفسير البيانات المصدر وقت الاستعلام. فسّروها مرة واحدة وقت التجميع، واحفظوا النتيجة.

لا يختفي الفهرس المتجه. يصبح شبكة أمان للأسئلة ذات الذيل الطويل، لا الباب الأمامي. أمامه طبقة من القطع المجمّعة مسبقاً: ملخصات مقطّرة، فهارس كيانات، خرائط بنية، رسوم بيانية لادّعاءات مع استشهادات، سجلات تعارض. يقرأ الوكيل المعرفة المجمّعة أولاً، ويعود إلى الاسترجاع الخام فقط عندما لا تناسب الأسئلة أي قطعة مجمّعة.

ليست فكرة جديدة في البرمجيات. العروض المادّية، خطوط البناء، التجميع المسبق — كل منصّة ناضجة تنقل أخيراً العمل التفسيري المُكلّف خارج المسار الساخن. بنية الذكاء الاصطناعي تلحق أخيراً.

كيف تعالج Copyl ذلك — أصلياً

يمكن تجميع طبقة معرفة من أجزاء متفرّعة: مخزن متجهات هنا، أداة تنسيق هناك، خط أنابيب مخصّص يلصق الأجزاء. يعمل ذلك — حتى يحين التوسّع عبر المستأجرين والوكلاء والسياسات واللغات ومتطلبات التدقيق دفعة واحدة. عندها تصبح الوصلات هي العمل.

في Copyl، التجميع جزء أصيل من المنصّة، لا ملحقاً.

قاعدة المعرفة — كتب وفصول ومستندات بصياغة Markdown — تُجمَّع إلى Knowledge Briefs: تمثيلات مُحسّنة للمهمة، مرتبطة بملف وكيل محدّد. يحتوي الـ Brief على:

ملخص مقطّر مضبوط على نطاق الوكيل وشخصيّته
فهرس كيانات يُستخرج مرة واحدة، لا يُعاد اشتقاقه لكل استعلام
خريطة بنية للكتب والفصول الأساسية
رسّ بياني استشهادي يربط كل ادّعاء بقسم المصدر مع درجة ثقة
سجل تعارض تُكتشف فيه التناقضات بين المستندات وتُحلّ بسياسات وإجراءات تشغيل قياسية خاصة بالوكيل

ما يجعل هذا يعمل ليس خطوة التجميع وحدها — بل التكامل حولها.

ملفات الوكيل هي مواصفات المهمة. كل وكيل Copyl يصرّح أصلاً بنطاقه وشخصيّته وأهدافه. تُجمَّع الـ Briefs مباشرة ضد ذلك الملف. لا طبقة منفصلة لتعريف المهام لتؤلفها وتصونها.

السياسات وإجراءات التشغيل القياسية تقود حلّ التعارض. عندما يتعارض مستندان، القاعدة ليست عشوائية — تأتي من السياسات وإجراءات التشغيل التي كتبها العميل أصلاً. الامتثال ليس ملحقاً في النهاية؛ إنه مصدر الحقيقة الذي يعمل عليه المُجمّع.

CIP يجعل الإبطال تلقائياً. عندما يتغيّر مستند أو فصل أو كتاب، يُبطّل حافلة أحداث المنصّة الـ Briefs المتأثّرة وتُصفّ إعادة التجميع. لا أداة تنسيق خارجية، لا مسح يدوي للذاكرة المؤقتة.

«انسخ بالتفرّع، لا تكسر» ينطبق على المعرفة المجمّعة أيضاً. وكلاء القوالب يأتون مع Briefs قالبية. عندما يخصّص العميل وكيله أو قاعدة معرفته، يُفرَّع الـ Brief لكل مستأجر — الأصل لا يفسد، ومعرفة عميل مجمّعة لا تتسرّب إلى وقت تشغيل عميل آخر.

إصدارات وجاهزية تدقيق افتراضياً. كل Brief مُصدَّر، كل ادّعاء له مصدر، كل حل تعارض مسجَّل. مسار التدقيق هو القطعة نفسها، لا شيء يُعاد بناؤه لاحقاً.

ما يهمّ المشترين فعلاً

القصة التقنية مثيرة. قصة المشتري أقصر.

نفس الإجابة مرتين. التكرار يتوقّف عن كونه أمنية.

تكلفة أقل لكل استعلام. القطع المجمّعة أصغر وأكثر تركيزاً من حمولات الاسترجاع الخام.

استشهادات قابلة للتدقيق. كل ادّعاء يرتبط بقسم مصدر مع درجة ثقة. فرق الامتثال والقانون يمكنها الموافقة فعلاً.

أمان متعدد المستأجرين دون أنابيب إضافية. عزل المستأجر يُفرَّض طبقة التجميع، لا يُرتجل وقت التشغيل.

تعدد لغات دون ترجمة وقت التشغيل. التجميع ينتج Briefs باللغات التي تتحدّثها قاعدة المعرفة والمستخدم فعلاً — دون ضريبة ترجمة أثناء الطيران.

هذه ليست ميزات. إنها الفارق بين وكيل يمكن عرضه ووكيل يمكن نشره.

ما لا نقوله

طبقات المعرفة المجمّعة ليست رصاصة فضية. هناك عبء: مهام التجميع تستهلك رموزاً مسبقاً، وتهرم الـ Briefs إذا لم يُربَط الإبطال صحيحاً، والبنية تعود بالفائدة فقط حجم استعلام معنوي. الفرق التي تشغّل استعلامات قليلة يومياً لكل وكيل يجب أن تحسّن أولاً الاسترجاع الهجين وإعادة الترتيب.

لا نعتقد أيضاً أن RAG وقت التشغيل سيختفي. يصبح طبقة احتياط بدلاً من الأساسية — وهو في الواقع حيث كان ينبغي أن يكون دائماً.

إلى أين يتجه الأمر

الفرق التي تشحن وكلاء إنتاجاً خلال 2026 ستبدو أشبه بفرق بنية بيانات منضبطة منها بفرق خطوط موجّهات ذكية. انتهى علاوة الجدة على «لدينا وكيل ذكاء اصطناعي». العلاوة القادمة لوكلاء رخيصة، قابلة للتكرار، جاهزة للتدقيق، ومثبتة في معرفة يستطيع بناؤها الدفاع عنها فعلاً.

هذا هو الشريط.

في Copyl، طبقة تجميع المعرفة هي كيف نصل إليه — ولأنها مدمجة في المنصّة نفسها التي تملك الوكلاء والسياسات والبيانات والأحداث أصلاً، لا تحتاج إلى تجميعها بنفسك.

جميع المنشورات