ثلاثة أنماط لتثبيت وكلاء الذكاء الاصطناعي في البيانات الخاصة — ولماذا لم يعد «استخدم RAG» جوابًا كاملاً.

السؤال الذي تطرحه كل فرقة عاجلاً أم آجلاً
كيف يجب أن يصل وكيل الذكاء الاصطناعي إلى بياناتكم الخاصة؟
لسنتين كان الجواب الافتراضي «استخدم RAG.» تقسيم المستندات وتضمينها واسترداد أفضل التطابقات وقت الاستعلام ولصقها في الموجّه. يعمل لأسئلة لمرة واحدة فوق مستندات ثابتة، ولا يزال نقطة انطلاق معقولة للنماذج الأولية.
ليس جوابًا كاملاً لوكلاء الإنتاج.
القرار الحقيقي ليس RAG أو لا RAG. بل اختيار بين ثلاثة أنماط — كل منها يناسب شكل عمل مختلفًا. الخطأ يعني دفع ثمن قدرات لا تحتاجونها، أو طلب من أداة حل مشكلة لم تُبنَ من أجلها.
الخريطة أعلاه تعرض الأثلاثة.
النمط 1 — الاسترجاع المحادثاتي
هذا هو المألوف: سؤال واحد، جواب واحد، مثبت في مجموعة معرفة. معظم الوكلاء القائمة على الدردشة يعيشون هنا.
لكن «طريقة الاسترجاع الصحيحة» تعتمد على متغيرين قلما تجعلهما الفرق صريحة: حجم البيانات، ووتيرة تغيّرها.
ارسموا المحورين — وتظهر ثماني خانات:
حجم صغير، بيانات ثابتة — حقن في الموجّه. عندما تتسع البيانات ذات الصلة في نافذة السياق للنموذج ولا تتغير أثناء الجلسة، أبسط جواب هو تضمينها. تقترب الدقة من 99٪ لأن النموذج لا يخمّن — يرى كل شيء. الثمن: تدفعون تلك الرموز في كل استعلام. مناسب للمواصفات القصيرة، مكلف لغير ذلك.
حجم صغير، بيانات ديناميكية — استدعاء API. سعر السهم الحالي، عدد التذاكر المفتوحة، آخر تسجيل دخول. البيانات صغيرة بما يكفي للموجه لكن يجب أن تكون حديثة. استدعاء API أو دالة مباشرة هو المعيار الصحيح. لا حاجة لبنية استرجاع.
حجم متوسط، بيانات ثابتة — ملخص مُجمَّع (compiled brief). هنا انتقل الحديث في 2026. بدل إعادة تفسير المستندات نفسها في كل استعلام، تفسّرونها مرة عند وقت التجميع وتخزّنون النتيجة كأثر محسّن للمهمة. الوكيل يقرأ الملخص لا المستندات الخام. دقة بين 85–95٪، حتمية عالية، وتكلفة أقل لكل استعلام لأنكم ترسلون ملخصات مقطرة لا قطعًا خام.
حجم متوسط، بيانات ديناميكية — ملخص + إثراء عبر API. نفس الأسلوب المجمَّع مع استدعاء API فوري يحقن قيمًا حالية في السياق المفسَّر مسبقًا. مناسب لـ «اشرح سياسة الإرجاع لدينا وأخبرني كم إرجاعًا عالجنا اليوم.»
حجم كبير، بيانات ثابتة — RAG المتجهي. الكلاسيكي. عندما لديكم غيغابايت من المستندات الثابتة ولا يمكنكم تجميعها كلها، ارجعوا إلى الاسترجاع المتجهي. الدقة عادة 60–80٪، الحتمية منخفضة إلى متوسطة (نفس الاستعلام قد يسترجع قطعًا مختلفة)، وتعودون لتفسير النص الخام وقت الاستعلام. مفيد، لكن لم يعد الافتراض لمعظم عمل الوكلاء.
حجم كبير، بيانات ديناميكية — استعلام SQL. عندما تكون البيانات كبيرة وديناميكية لكنها في قاعدة منظمة، اكتبوا الاستعلام. لا تضمّنوا السجلات المعاملاتية. SQL يعطي دقة 100٪ لأن لا خطوة تفسير — الجواب هو الحقل.
غير محدود، ثابت — ملخص + احتياط متجهي. عندما يتجاوز الم corpus ما يمكن تجميعه بالكامل، جمّعوا النواة عالية الزيارة إلى ملخصات ودعوا الاسترجاع المتجهي يتولى الذيل الطويل. دقة بين 80–92٪. نقطة مثالية لمعظم مساعدي المعرفة في الإنتاج.
غير محدود، ديناميكي — حلقة وكيل متعددة الأدوات. الحالة الأصعب: كبير جدًا للتجميع، متنوع جدًا للاستعلام المباشر، سريع التغيير للتخزين المؤقت. يجب أن يخطط الوكيل ويستدعي أدوات متعددة ويقيّم النتائج الوسيطة ويكرر. دقة متغيرة، حتمية منخفضة، تكلفة عالية. فقط عندما لا يكفي ما هو أبسط.
الخلايا ذات الإطار البرتقالي تمثل المسار المركز على الملخص — الخلايا التي تنقل التفكير من وقت الاستعلام إلى وقت التجميع. هذا هو التكوين الذي نوصي به افتراضيًا لوكلاء المحادثة في الإنتاج على Copyl.
النمط 2 — تحليل على شكل مصفوفة
مصفوفة 2×4 تجيب على سؤال واحد جيدًا. وهي الأداة الخاطئة لسؤال آخر يطرأ بنفس التكرار: «حلّل 200 مستندًا مقابل 15 بُعدًا وأعطني مقارنة منظمة.»
هذا ليس استرجاعًا محادثاتيًا. إنه شكل مختلف من العمل.
محلل BOM يقارن عروض الموردين، فريق اندماج واستحواذ يراجع 50 عقدًا مقابل 20 بُعد مخاطر، مدير مالي يراجع موازنات عبر 12 شركة تابعة — سير عمل على شكل مصفوفة. الصفوف مصادر. الأعمدة أسئلة. الخلايا هي التقاطع: كل خلية مهمة وكيل صغيرة تستخرج وتستدل على ذلك المصدر مقابل ذلك السؤال مع اقتباسات.
هذا ما يفعله Matrix Agent. الواجهة جدول بيانات لا محادثة. يضيف المستخدم صفوفًا بالإشارة إلى مصادر (مستندات، موردون، شركات تابعة، مقالات قاعدة معرفة، سجلات API) وأعمدة بنص موجّه قصير يحدد ما تستخرجه أو تقيّمه كل خلية. الوكيل يملأ الشبكة بالتوازي؛ لكل خلية ثقتها واقتباساتها.
العمود الأوسط في الرسم يوضح الممارسة: مستندات وموردون كصفوف؛ زمن التسليم والتكلفة والاعتماد والبدائل كأعمدة؛ بعض الخلايا ممتلئة وبعضها لا يزال قيد المعالجة. مؤشر «قيد التنفيذ» في خليتين له معنى — Matrix Agents صراحةً لكل خلية؛ خلية بطيئة أو فاشلة لا تعطل باقي الشبكة.
إن بنيتم يومًا جدولًا لمرة واحدة لمقارنة بيانات مستخرجة من مستندات كثيرة، فقد فعلتم يدويًا ما يفعله Matrix Agent على نطاق واسع.
النمط 3 — الاستخراج الحتمي
النمط الثالث هو الأقل احتفاءً والأسهل نسيانه عندما يكون الذكاء الاصطناعي في كل مكان: لا تستخدموا نموذج لغة كبير إطلاقًا.
إذا كانت القيمة التي تريدونها بالفعل حقلًا في قاعدة بيانات أو في استجابة API منظمة أو في CSV أو في JSON منسّق — لا تحتاجون استرجاعًا ولا ملخصًا ولا Matrix Agent. تحتاجون SELECT.
الاستخراج الحتمي يعطي دقة 100٪، إعادة إنتاج مثالية، وتكلفة شبه صفر لكل استعلام. تصعيدكم إلى نهج قائم على LLM فقط إذا لم تكن البيانات منظمة أو لا يمكن الإجابة بدمج حقول منظمة ومنطق بسيط.
كم مفاجئ مما يُبنى كـ«ميزات ذكاء اصطناعي» يجب أن يكون SQL.
كيف تختارون — نسخة مختصرة
تذييل الرسم يقولها في سطر — إليكم التفصيل:
- الاسترجاع المحادثاتي (النمط 1) عندما يطرح المستخدم سؤالًا ويتوقع جوابًا نثريًا، مثبتًا في مجموعتكم الخاصة.
- Matrix Agent (النمط 2) عندما العبء شبكة: مصادر كثيرة وأبعاد كثيرة والمستخدم يريد مقارنة منظمة لا محادثة.
- SQL أو استعلام منظم (النمط 3) عندما القيمة بالفعل حقل. لا تفسير مطلوب، لا LLM مطلوب.
الأخطاء المكلفة تحدث عندما تفرض فرق نمطًا ليقوم بنمط آخر. الاسترجاع المحادثاتي يتعثر مع تحليل الشبكة — المستخدم ينفّذ 200 استعلامًا منفصلًا. Matrix Agents مبالغ لـ«ما هي سياسة الإرجاع لدينا» — هذا مجرد ملخص. طلب من LLM استخراج قيمة وهي بالفعل عمود يعني دفع تفسير لم يكن ضروريًا.
أين يترك نقاش «RAG أم لا»
RAG المتجهي خلية واحدة على الخريطة، ليست الخريطة كلها. هو الأداة المناسبة لشكل واحد من المشكلة: أحجام كبيرة من بيانات غير منظمة ثابتة لا يمكنكم تجميع الم corpus كاملًا والسؤال محادثاتي.
للباقي هناك أداة أنسب. الفرق التي تشحن وكلاء إنتاج خلال 2026 ستتوقف عن جعل RAG افتراضيًا وتطابق النمط مع العبء.
هذا هو المعيار. الرسم يجعل الاختيار مرئيًا.
أين يقع Copyl
في Copyl، الأثلاثة أنماط موجودة كبدائيات أصلية:
- الاسترجاع المحادثاتي يعمل على Knowledge Briefs مجمّعة من قاعدة المعرفة (Books، Chapters، Docs) مع احتياط متجهي لأسئلة الذيل الطويل.
- Matrix Agents وكلاء من الدرجة الأولى (مخزنة بنفس نمط User-and-properties كالوكلاء المحادثين) فوق شبكة ثنائية الأبعاد مصادر × أبعاد تحليل.
- الاستخراج الحتمي مدعوم عبر IntegrationApps والوصول المباشر SQL/API، مع نتائج متاحة للنمطين الآخرين عند الحاجة لتفسيرًا في المصب.
لأن الأثلاثة على نفس المنصة، تنطبق نفس Agent Profile وPolicies وSOPs عبر الأنماط — وكيل يجري أسئلة وأجوبة محادثاتية يومًا وتحليل شبكي يومًا آخر يستخدم نفس ضبط الامتثال، ونفس أثر التدقيق، ونفس قواعد عزل المستأجر.
الرسم أعلاه هو الخريطة. المنصة هي ما يتيح التحرك بين الخلايا دون إعادة بناء من الصفر.