أداة جديدة من مايكروسوفت لمراقبة سلوك النماذج الذكية
شركة مايكروسوفت تطلق أداة ASSERT لاختبار موثوقية أنظمة الذكاء الاصطناعي
- تاريخ النشر: منذ يوم زمن القراءة: 3 دقائق قراءة
كشفت شركة مايكروسوفت الأمريكية عن إطار عمل جديد مفتوح المصدر يحمل اسم ASSERT، في خطوة تهدف إلى تعزيز موثوقية أنظمة الذكاء الاصطناعي، ومساعدة المطورين والمؤسسات على التحقق من مدى التزام هذه الأنظمة بالقواعد والسياسات المحددة لكل تطبيق أو خدمة.
شركة مايكروسوفت تطلق أداة ASSERT لاختبار موثوقية أنظمة الذكاء الاصطناعي
وبحسب ما ذكرته تقارير تقنية، يحمل المشروع اسم Adaptive Spec-driven Scoring for Evaluation and Regression Testing، وقد جاء استجابة للتحديات المتزايدة التي تواجه الشركات عند تقييم أنظمة الذكاء الاصطناعي الحديثة.
فمع توسع استخدام هذه التقنيات في مختلف القطاعات، لم يعد التركيز مقتصراً على قياس دقة النموذج أو كفاءته العامة، بل أصبح من الضروري التأكد من أن سلوكه يتوافق مع المتطلبات التشغيلية والتنظيمية الخاصة بكل مؤسسة.
وتعتمد الأداة الجديدة على تقنيات الذكاء الاصطناعي لتحويل التعليمات والأوصاف المكتوبة بلغة طبيعية، إلى مجموعة متكاملة من الاختبارات والمعايير القابلة للقياس.
وبمجرد أن يحدد المطور أو فريق العمل الأهداف المطلوبة والسياسات التي يجب على النظام الالتزام بها، تتولى ASSERT تحليل هذه المتطلبات وتحويلها إلى قائمة واضحة تضم السلوكيات المقبولة وغير المقبولة.
وبعد ذلك، تقوم المنصة بإنشاء مجموعة متنوعة من السيناريوهات وحالات الاختبار التي تهدف إلى قياس مدى التزام النظام بالقواعد المحددة.
ويتم تنفيذ هذه الاختبارات بشكل آلي على النموذج المستهدف، ثم تنتج تقارير تفصيلية تساعد المطورين على اكتشاف المشكلات المحتملة أو الانحرافات السلوكية التي قد تؤثر على أداء النظام أو موثوقيته.
وبينت التقارير أنه من بين أبرز الخصائص التي توفرها ASSERT، قدرتها على تتبع الخطوات الداخلية التي يتخذها النظام أثناء تنفيذ المهام المختلفة، بما يشمل العمليات الوسيطة واستدعاءات الأدوات والخدمات المساندة.
ويساعد ذلك الفرق التقنية على فهم الأسباب الحقيقية وراء الأخطاء والإخفاقات، بدلاً من الاكتفاء بملاحظة النتائج النهائية فقط.
كما توفر الأداة إمكانية إدخال معلومات إضافية تتعلق ببيئة التشغيل، والأدوات المتاحة للنظام، والضوابط التنظيمية المفروضة عليه، وهو ما يتيح تخصيص عملية التقييم بما يتناسب مع احتياجات كل مؤسسة وطبيعة التطبيقات المستخدمة لديها.
وترى مايكروسوفت أن هذا النهج يعالج جانباً مهماً لا تغطيه اختبارات الذكاء الاصطناعي التقليدية، حيث تختلف متطلبات السلوك المقبول من تطبيق إلى آخر، وتتأثر بعوامل عديدة مثل سياسات الشركة، والقوانين المنظمة، والأهداف التشغيلية الخاصة بكل منتج.
ونقلت التقارير تصريحات منسوبة إلى سارة بيرد، رئيسة المنتجات في قطاع الذكاء الاصطناعي المسؤول لدى مايكروسوفت، التي أكدت أن التقييم الدقيق أصبح جزء أساسياً من عملية اتخاذ القرار عند تطوير أنظمة الذكاء الاصطناعي ونشرها.
وأوضحت أن بناء أنظمة موثوقة يتطلب فهماً عميقاً لسلوكها الفعلي، وقياس عدد كبير من المؤشرات المرتبطة مباشرة بطبيعة الاستخدام.
وأشارت الشركة إلى أن ASSERT لا تقتصر فائدتها على مرحلة التطوير فقط، بل يمكن استخدامها أيضاً بعد إطلاق المنتجات للمستخدمين، بالإضافة إلى دورها في المراقبة المستمرة وتحليل الأداء على المدى الطويل، ما يجعلها أداة شاملة لدعم تطوير وتشغيل أنظمة ذكاء اصطناعي أكثر أماناً وشفافية وموثوقية.

