إشراف الوكلاء 😎: لماذا صار “التشغيل” أهم من “النموذج”؟ 😪

12 فبراير 2026 بواسطة نشرة الذكاء الاصطناعي #العدد 27 عرض في المتصفح
خميسكم سعيد ياأصدقاء 👋

بدايات 2026 تؤكد أن المنافسة تجاوزت سباق النماذج إلى سؤال أعمق: كيف تُدار الوكالات (Agents)، وكيف تُراقَب نتائجها، وكيف تُربَط ببيانات موثوقة.
في هذا العدد نتتبع ثلاثة محاور:
(1) إطلاقات كبرى حوّلت الوكيل من "مساعد" إلى "زميل عمل" يُدار عبر تطبيقات ومهارات قابلة لإعادة الاستخدام
(2) أدوات تقييم تحاول سد الفجوة بين الأرقام المعلنة والأداء الفعلي عبر شفافية المجتمع
(3) موجة جديدة لتحسين الاسترجاع من المستندات والواجهات ، نقطة الاختناق في كثير من تطبيقات الشركات.

***

الأخبار العالمية

***

OpenAI تطلق GPT-5.3-Codex: نموذج برمجي وكيل أسرع ب25%

أعلنت OpenAI عن GPT-5.3-Codex كنموذج مخصص للبرمجة “الوكيلية”، مع تحسين سرعة يصل إلى 25% مقارنة بالإصدارات السابقة. التركيز لم يعد على كتابة مقطع كود جيد، بل على تنفيذ سلسلة مهام كاملة تشمل البحث، استخدام الأدوات، إدارة الملفات، وتشغيل الأوامر.

اللافت أن الشركة أشارت إلى أن نسخًا مبكرة من النموذج استُخدمت لدعم تطويره وتحسين نتائجه، في خطوة تعكس نضج بيئات الاختبار الداخلية. كما سجل أداءً قويًا على SWE-Bench Pro وTerminal-Bench.

لماذا يهم؟

لأن البرمجة تتجه نحو “إدارة إنتاج”، حيث يعمل النموذج كوكيل تحت إشراف بشري، لا كمساعد محادثة.

المصدر

***

 إطلاق تطبيق Codex على macOS لإدارة عدة وكلاء

قدمت OpenAI تطبيق Codex على macOS لإدارة عدة Agents بالتوازي. يمكن تشغيل وكلاء منفصلين حسب المشاريع، مراجعة التغييرات كـ diff، وفتحها مباشرة في المحرر.

يدعم التطبيق worktrees بحيث يعمل كل وكيل في نسخة مستقلة لتقليل التعارضات.

لماذا يهم؟

لأن إدارة الوكيل أصبحت منتجًا بحد ذاته: متابعة، مراجعة، وتوجيه. هذه هي البنية التي تحتاجها فرق التطوير.

المصدر

***

Anthropic تطلق Claude Opus 4.6 بسياق يصل إلى مليون Token

أعلنت Anthropic تحديث Claude Opus 4.6 مع تحسينات في التخطيط ومهام الوكلاء طويلة الأمد، ودعم سياق يصل إلى مليون توكن (بيتا).

التركيز هنا على استقرار الأداء عند العمل داخل قواعد كود كبيرة ومشاريع ممتدة.

لماذا يهم؟

لأن فقدان السياق هو سبب رئيسي للأخطاء في المشاريع الضخمة. السياق الطويل يقلل “تقطيع العمل”.

المصدر

***

Gemini يتجاوز 750 مليون مستخدم شهريًا

بحسب تقارير نقلتها TechCrunch، تجاوز تطبيق Gemini 750 مليون مستخدم نشط شهريًا.

لماذا يهم؟

لأن التبني الواسع هو ما يحسم سباق المنصات. الأرقام تعني أن المنافسة انتقلت من المقارنات التقنية إلى ساحة الاستخدام الفعلي.

المصدر 

***

Gemini يعيد تصميم قائمة Tools على Android وiOS

بدأت Google بطرح تحديث لقائمة الأدوات في تطبيق Gemini على Android وiOS والويب. التحديث يضيف قسم "Experimental features" بشارة "Labs" لفصل الميزات التجريبية عن المستقرة، ويقدم خيار "Personal Intelligence" لمشتركي Google AI في أمريكا يتيح التحكم باستخدام البيانات الشخصية في كل محادثة. كما أُعيد تنظيم قسم "My stuff" ليصبح أبسط وأنظف.

لماذا يهم؟ إعادة تصميم قائمة الأدوات عادة ما تكون مقدمة لتوسيع ميزات أكثر تعقيدًا، وقسم Labs يشير إلى تسارع التجريب داخل التطبيق.

المصدر

***

 Transformers.js v4 (Preview) على NPM: دفعة لتطبيقات AI المحلية على الويب

أعلنت Hugging Face في 9 فبراير عن توفر Transformers.js v4 (Preview) على NPM عبر npm i @huggingface/transformers@next بعد عام كامل من التطوير.

أبرز التغييرات: محرك WebGPU جديد مكتوب بالكامل بلغة C++ بالتعاون مع فريق ONNX Runtime، يدعم أكثر من 200 بنية نموذج.

حجم الحزمة الأساسية (transformers.web.js) انخفض بنسبة 53%، ومكتبة tokenizers الجديدة بحجم 8.8 كيلوبايت فقط. كما تدعم النسخة نماذج متقدمة مثل Mamba وMoE تعمل مباشرة عبر WebGPU.

لماذا يهم؟ تشغيل النماذج محليًا في المتصفح يقلل التكلفة والتعقيد ويزيد الخصوصية — وهذا الإصدار يجعل ذلك أقرب للبناء العملي والسريع.

المصدر

***

Hugging Face تطلق Community Evals

أطلقت HF نظامًا يُلامس مشكلة حقيقية في 2026: "الأرقام متضاربة والواقع لا يطابق اللوحات". النظام يربط Benchmarks (مثل MMLU-Pro وGPQA وHLE) بصفحات البيانات، ويخزن النتائج داخل مستودعات النماذج في ملفات .eval_results/*.yaml تظهر على صفحة النموذج ولوحات المعايير. أي مستخدم يستطيع إرسال نتائج عبر Pull Request، مع شارات مثل "verified" ومصادر يمكن تتبعها (أوراق بحثية، منصات تقييم، سجلات Inspect).

 لماذا يهم؟ أي قرار تبنٍّ لنموذج يحتاج أرقامًا يمكن تتبعها لا أرقامًا دعائية. هذا لن يحل تشبع المعايير، لكنه يجعل اللعبة مرئية: ماذا قُيّم، وكيف، ومتى، ومن قام بذلك.

المصدر

***

NVIDIA تطلق Nemotron ColEmbed V2 لتحسين الاسترجاع

أعلنت NVIDIA عن عائلة Nemotron ColEmbed V2 بثلاثة أحجام (3B و4B و8B) مصممة للاسترجاع الدقيق من وثائق بصرية تحتوي نصًا وجداول ورسومًا. تستخدم آلية late-interaction (بأسلوب ColBERT) الممتدة لبيئة متعددة الوسائط. النموذج الأكبر (8B) تصدّر لوحة ViDoRe V3 بنتيجة NDCG@10 تبلغ 63.42 (اعتبارًا من 3 فبراير 2026)، متقدمًا على المركز الثاني بنسبة 3%. وتُرخّص النماذج ترخيصًا تجاريًا مفتوحًا.

 لماذا يهم؟ أغلب مشاريع RAG في الشركات تفشل عند نقطة واحدة: الاسترجاع الخاطئ من ملفات PDF والمستندات المعقدة بصريًا. هذه النماذج تستهدف تحديدًا هذه الفجوة.

المصدر

***

Google/langextract: استخراج منظم مع إسناد للمصدر

LangExtract مكتبة Python من Google لاستخلاص معلومات منظمة من نصوص طويلة غير منظمة، مع ربط كل استخراج بموقعه الدقيق في النص الأصلي وإنتاج HTML للمراجعة البشرية. التركيز واضح: المستندات الطويلة التي تضيع فيها المعلومات عند الاستخلاص التقليدي.

 لماذا يهم؟ طبقة "الإسناد" ترفع قابلية التدقيق وتقلل الاعتماد على الثقة العمياء في مخرجات النماذج — وهذا جوهري في المستندات القانونية والمالية والتنظيمية.

المصدر

***

UI‑TARS: وكلاء يتعاملون مع واجهات المستخدم (GUI)

UI‑TARS مشروع لوكلاء بصريين ينفذون مهام داخل واجهات رسومية بالاعتماد على رؤية الشاشة والإحداثيات، مع مسار تشغيل وأدوات تحويل المخرجات إلى أوامر تنفيذ.

لماذا يهم؟ لأنه يحول الوكيل من “كاتب” إلى “مُشغّل” يستطيع تنفيذ خطوات داخل التطبيقات.

المصدر

***

Shannon: اختبار اختراق ذاتي يركز على إثبات الاستغلال

Shannon أداة اختبار اختراق white-box تنتج تقارير مع PoC (إثبات مفهوم) قابل للتكرار بدل تنبيهات عامة. تركز على ثغرات شائعة مثل Injection وXSS وSSRF ومشكلات المصادقة.

لماذا يهم؟ سرعة شحن الميزات — خصوصًا مع أدوات AI — تحتاج اختبارًا أمنيًا بنفس الإيقاع: سريعًا ومؤتمتًا وقابلًا للتحقق.

المصدر

***

openai/skills: كتالوج Skills للوكلاء

مستودع يجمع Skills — تعليمات وأدوات وقوالب — لتوحيد طريقة تنفيذ الوكيل لمهام متكررة وفق معايير محددة وقابلة للمشاركة داخل الفرق.

 لماذا يهم؟ المؤسسات تحتاج "قابلية تكرار" قبل "إبداع". المهارات هي ما يحوّل الوكلاء من تجارب فردية إلى أنظمة قابلة للتشغيل المؤسسي.

المصدر

***

الأخبار المحلية

***

وزارة الداخلية: توظيف الذكاء الاصطناعي ضمن معرض الدفاع العالمي 2026

يشير الخبر إلى استعراض توظيف تقنيات الذكاء الاصطناعي ضمن تطوير منظومة الأمن الداخلي، مع حلول للمدن الآمنة وتأمين الحدود وإدارة الأزمات.

لماذا يهم؟ لأنه يعكس انتقال الذكاء الاصطناعي إلى الاستخدام التشغيلي في قطاعات حساسة.

المصدر

***

"الصحافة المعززة بالذكاء الاصطناعي" و"المذيع الافتراضي" ضمن معسكر الابتكار الإعلامي

المصدر يذكر مسارًا يركز على توظيف التقنيات الذكية في تحليل البيانات وكشف الزيف الإعلامي.

يتضمن معسكر الابتكار الإعلامي مسارين تقنيين: الأول يركز على توظيف الذكاء الاصطناعي في تحليل البيانات وكشف الزيف الإعلامي، والثاني يتناول تطوير مذيع افتراضي يقدم محتوى مرئيًا وسمعيًا.

 لماذا يهم؟ يضع "التحقق" في قلب أدوات الذكاء الاصطناعي الإعلامية لا التوليد فقط، ويوضح اتجاهًا نحو أتمتة متعددة الوسائط في قطاع المحتوى.

المصدر

***

المنتدى السعودي للإعلام يُسجَّل في غينيس كأكبر حدث إعلامي عالميًا

سُجّل المنتدى السعودي للإعلام في موسوعة غينيس، وشهد إطلاق عدة مبادرات من بينها "سعوديبيديا" بخمس لغات وإتاحة 100 مقعد لبرامج ابتعاث إعلام.

 لماذا يهم؟ المنتدى يتحول إلى منصة إطلاق مبادرات مؤسسية، وبناء المحتوى والمهارات البشرية شرط لتعظيم أثر التقنية.

المصدر

***

إطلاق “سعوديبيديا” بخمس لغات + ابتعاث إعلام (100 مقعد)

تذكر HBR العربية إطلاق سعوديبيديا بخمس لغات وإتاحة 100 مقعد لبرامج ابتعاث إعلام.

لماذا يهم؟ لأن بناء المحتوى والمهارات البشرية شرط أساسي لتعظيم أثر التقنية.

المصدر

***

مايكروسوفت تؤكد تشغيل منطقة Azure السحابية في السعودية نهاية 2026

أكدت مايكروسوفت أن منطقة مراكز بيانات Azure في المنطقة الشرقية ستبدأ تشغيل أعباء العمل السحابية في الربع الرابع من 2026. المنطقة تضم 3 مناطق إتاحة مستقلة لكل منها بنية تحتية منفصلة للطاقة والتبريد والشبكات. وأكد براد سميث رئيس مايكروسوفت أن الاستثمار يعكس التزامًا ببناء أسس رقمية جاهزة للسيادة تمكّن المملكة من تبني الذكاء الاصطناعي بثقة. عدة جهات سعودية (أكوا باور، القدية، سدايا) تستفيد فعليًا من خدمات مايكروسوفت السحابية.

لماذا يهم؟ السحابة المحلية السيادية هي الأساس الذي يُبنى عليه التوسع الآمن لتطبيقات الذكاء الاصطناعي. هذا الإعلان ينقل المشروع من "قيد الإنشاء" إلى "موعد تشغيل محدد".

المصدر

***

تقنيات الأسبوع

***

RD‑Agent — أتمتة جزء من عملية البحث والتطوير

المشروع يطرح نموذجًا لأتمتة مسارات R&D، أي أن الوكيل لا ينفذ مهمة واحدة بل يشارك في سير عمل بحثي/تطويري.ل

ماذا يهم؟ لأنه يمثل انتقال الوكلاء إلى أعمال ذات قيمة أعلى من المهام السطحية

المصدر

***

 gh-aw — Agentic Workflows داخل GitHub

هذا المشروع يدور حول ربط الوكيل بسياق GitHub نفسه (Workflows/عمليات)، أي إدخال الأتمتة الوكيلية في المكان الذي تعمل فيه الفرق فعليًا.

لماذا يهم؟ لأن أفضل مكان للوكيل هو “سير العمل” وليس “واجهة منفصلة”.

المصدر

***

ركن التعلم 

***

 توثيق Transformers.js: من Pipeline إلى WebGPU

الوثائق تشرح تشغيل نماذج داخل المتصفح عبر ONNX Runtime، مع أمثلة JavaScript وخيارات تشغيل WebGPU ونصائح للأداء.

لماذا يهم؟ لأنها أسرع نقطة دخول لبناء تجربة AI تعمل محليًا.

المصدر

***

gh-aw: كيف تفكر في مسارات عمل وكيلية داخل GitHub

محتوى المشروع يساعد على تصور Workflows تقودها الوكالات داخل منصة التطوير نفسها.

لماذا يهم؟ لأنه يربط الوكيل مباشرة بمكان التنفيذ والمتابعة.

المصدر

***

 برومبت الأسبوع (Prompt of the Week)

***

برومبت تعديل صور لعيد الحب (اValentine Couple Portrait)

“A romantic couple standing in a rose-lined garden walkway… 85mm lens… shallow depth of field… ultra-realistic…”

 قالب يعطي نتيجة “سينمائية” بسرعة، لذلك صار ترند هذا الأسبوع. استخدمه من نموذج جيميناي لانشاء الصور

***

النسخة السعودية — الدرعية/الطريف

نسخة سعودية من البرومبت السابق لزوجين في وسط احياء الدرعية

نص انجليزي

“Ultra-realistic cinematic couple portrait in Diriyah (At‑Turaif)… golden hour… 85mm…”

نص عربي

“بورتريه سينمائي شديد الواقعية في الدرعية (حي الطريف)… إضاءة الغروب… عدسة 85mm…”لماذا يهم؟ لأنه يحافظ على روح الترند مع طابع محلي واضح.

***

برومبت لانتاج صورة احترافيه لصفحتك في لينكدان

النص الانجليزي

Turn this photo into an ultra-realistic editorial studio portrait. Keep the face identity exactly the same…

النص العربي

“حوّل هذه الصورة إلى بورتريه استوديو احترافي شديد الواقعية… حافظ على هوية الوجه كما هي…”لماذا يهم؟ لأنه شائع جدًا لصناعة صور شخصية احترافية بسرعة.

***

خاتمة 

بهذا نصل لختام عدد هذا الأسبوع. إذا أعجبتك النشرة، مررها لشخص مهتم، وارسل لنا أي خبر يستحق “تفكيك” أعمق الأسبوع الجاي؟

مشاركة
نشرة الذكاء الاصطناعي البريدية

نشرة الذكاء الاصطناعي البريدية

كل أسبوع نأخذك في جولة سريعة بين أحدث الابتكارات، أبرز الأخبار، وأذكى التطبيقات التي ترسم ملامح الغد. نقدم لك المعلومة جاهزة، موثوقة، ومختصرة، لتبقى دائمًا في مقدمة من يفهمون ويواكبون ثورة الذكاء الاصطناعي.

التعليقات

جارٍ جلب التعليقات ...

المزيد من نشرة الذكاء الاصطناعي البريدية