استكشاف تكوين أنظمة المجموعات باستخدام مصمم Azure Machine Learning

ملاحظة لإكمال هذا النشاط المعملي، ستحتاج إلى اشتراك Azure الذي لديك فيه حق الوصول الإداري.

إنشاء مساحة عمل “التعلم الآلي من Azure”

  1. سجل الدخول إلى مدخل Azure باستخدام بيانات اعتماد Microsoft الخاصة بك.

  2. حدد + Create a resource، وابحث عن Machine Learning، وأنشئ مورد Azure Machine Learning جديد باستخدام خطة Azure Machine Learning. استخدم الإعدادات التالية:
    • الاشتراك: اشتراك Azure الخاص بك.
    • Resource group: أنشئ مجموعة موارد أو حددها.
    • Workspace name: أدخل اسم فريد لمساحة العمل الخاصة بك.
    • Region: حدد أقرب منطقة جغرافية لك.
    • Storage account: لاحظ حساب التخزين الجديد الافتراضي الذي سيتم إنشاؤه لمساحة العمل الخاصة بك.
    • Key vault: لاحظ الحاوية الرئيسية الجديدة الافتراضية التي سيتم إنشاؤها لمساحة العمل الخاصة بك.
    • Application insights: لاحظ مورد application insights الجديد الافتراضي الذي سيتم إنشاؤه لمساحة العمل الخاصة بك.
    • Container registry: لا شيء (سيتم إنشاء سجل واحد تلقائياً عند أول مرة تقوم فيها بنشر نموذج في حاوية)
  3. حدد Review + create، ثم حدد Create. انتظر حتى يتم إنشاء مساحة العمل الخاصة بك (قد يستغرق الأمر بضع دقائق)، ثم انتقل إلى المورد الموزع.

  4. حدد Launch studio (أو افتح علامة تبويب جديدة في مستعرض الويب، وانتقل إلى https://ml.azure.com، وسجل الدخول إلى Azure Machine Learning studio باستخدام حساب Microsoft).

  5. في Azure Machine Learning studio، يجب أن تشاهد مساحة العمل التي تم إنشاؤها حديثًا. إذا لم يكن الأمر كذلك، فحدد دليل Azure في القائمة اليسرى. ثم من القائمة اليسرى الجديدة، حدد مساحات العمل، حيث يتم سرد جميع مساحات العمل المقترنة باشتراكك، وقم بتحديد مسحة العمل التي أنشأتها لتمرينك.

ملاحظة تعد هذه الوحدة هي واحدة من العديد من الوحدات التي تستخدم Azure Machine Learning workspace، بما في ذلك الوحدات الأخرى في مسار التعليم أساسيات Microsoft Azure AI: استكشاف الأدوات المرئية للتعلم الآلي. إذا كنت تستخدم اشتراكك على Azure، فيمكنك إنشاء مساحة العمل مرة واحدة وإعادة استخدامها في وحدات أخرى. سيتم تحصيل مبلغ صغير من اشتراكك على Azure لتخزين البيانات طالما أن مساحة عمل التعلم الآلي من Azure موجودة في اشتراكك، لذا نوصي بحذف مساحة عمل التعلم الآلي من Azure عندما لا تكون مطلوبة.

إنشاء حساب

  1. في استوديو التعليم الآلي من Microsoft Azure، حدد أيقونة (الأيقونة التي تشبة الثلاثة أسطر فوق بعضها) في أعلى اليسار لعرض الصفحات المختلفة في الواجهة (قد تحتاج إلى زيادة حجم الشاشة إلى أقصى حد). يمكنك استخدام هذه الصفحات في الجزء الأيسر لإدارة الموارد في مساحة العمل. حدد صفحة Compute (ضمن Manage).

  2. في صفحة Compute، حدد علامة التبويب Compute clusters، وأضف نظام مجموعة حساب جديد بالإعدادات التالية. ستستخدمه لتدريب أحد نماذج التعلم الآلي:

    • Location: اختر نفس مساحة العمل التي تعمل فيها. إذا لم يكن هذا الموقع مدرجًا، فاختر أقرب موقع إليك.
    • Virtual machine tier: Dedicated
    • Virtual machine type: معالج
    • Virtual machine size:
      • اختر Select from all options
      • ابحث عن Standard_DS11_v2 وحدده
    • حدد التالي
    • Compute name: أدخل اسمًا فريدًا.
    • الحد الأدنى من عدد العقد: 0
    • الحد الأقصى من عدد العقد: 2
    • ثواني الخمول قبل تقليص الحجم: 120
    • Enable SSH access: غير محدد
    • حدد إنشاء.

ملاحظة تستند مثيلات الحساب ومجموعاته إلى صور جهاز Azure الظاهري القياسية. في هذه الوحدة، ينصح باستخدام صورة Standard_DS11_v2 لتحقيق التوازن الأمثل بين التكلفة والأداء. إذا كان اشتراكك يحتوي على حصة نسبية لا تتضمن هذه الصورة، فاختر صورة بديلة؛ ولكن ضع في اعتبارك أن الصورة الأكبر قد تنطوي على تكلفة أعلى وقد لا تكون الصورة الأصغر كافية لإكمال المهام. بدلاً من ذلك، اطلب من مسؤول Azure توسيع الحصة النسبية.

سيستغرق إنشاء نظام مجموعة الحساب بعض الوقت. يمكنك الانتقال إلى الخطوة التالية في أثناء الانتظار.

إنشاء مسار وإضافة مجموعة بيانات

للبدء مع مصمم التعلم الآلي من Azure، يجب أولاً إنشاء بنية أساسية لبرنامج ربط العمليات التجارية.

  1. في استوديو التعلم الآلي في Microsoft Azure، قم بتوسيع الجزء الأيسر عن طريق تحديد أيقونة القائمة في الجزء العلوي الأيسر من الشاشة. عاين صفحة المصمم (قيد النشر)، وحدد + لإنشاء مسار جديد.

  2. غيّر اسم المسودة (Pipeline-Created-on-* date*) إلى تدريب مجموعة البطاريق.

    في التعلم الآلي من Azure، عادةً ما يتم تغليف بيانات تدريب النموذج والعمليات الأخرى في كائن يسمى مجموعة بيانات. في هذه الوحدة، سوف تستخدم مجموعة بيانات تتضمن ملاحظات لثلاثة أنواع من البطاريق.

  3. اعرض صفحة Data (ضمن Assets). تحتوي صفحة “Data” على ملفات بيانات أو جداول معينة تخطط للعمل معها في Azure ML.

  4. في صفحة البيانات، ضمن علامة التبويب أصول البيانات، حدد + إنشاء. ثم قم بتكوين أصل بيانات بالإعدادات التالية:
    • Data type:
      • الاسم: penguin-data
      • الوصف: بيانات طيور البطريق
      • نوع مجموعة البيانات: جدولي
    • Data source: From Web Files
    • عنوان URL الخاص بالويب:
      • عنوان URL الخاص بالويب: https://aka.ms/penguin-data
      • تخطى التحقق من صحة البيانات: لا تختاره
    • الإعدادات:
      • File format: Delimited
      • Delimiter: Comma
      • Encoding: UTF-8
      • عناوين الأعمدة: يحتوي الملف الأول فقط على عناوين
      • Skip rows: None
      • Dataset contains multi-line data: لا تحددها
    • Schema:
      • قم بتضمين كل الأعمدة بخلاف Path
      • مراجعة الأنواع التي تم اكتشافها تلقائيًا
    • مراجعة
      • حدد إنشاء.
  5. بعد إنشاء مجموعة البيانات، افتحها واستعرض صفحة “Explore” لرؤية عينة من البيانات. تمثل هذه البيانات قياسات طول وعمق المنقار وطول الزعانف وكتلة الجسم للحصول على ملاحظات متعددة حول طيور البطاريق. توجد ثلاثة أنواع من البطريق ممثلة في مجموعة البيانات: بطريق آديلي، وجنتو، وشريطي الذقن.

ملاحظة مجموعة بيانات طيور البطريق المستخدمة في هذا التمرين هي مجموعة فرعية من البيانات التي قامت بجمعها وتوفيرها د. كريستين غورمان ومحطة بالمر في أنتاركتيكا LTER، وهي عضو في شبكة البحوث الإيكولوجية طويلة الأجل.

رفع البيانات إلى اللوحة

  1. ارجع إلى البنية الأساسية لبرنامج ربط العمليات التجارية عن طريق Designer في القائمة اليسرى. في صفحة المصمم، حدد تدريب مجموعة البطاريق.

  2. بجوار اسم البنية الأساسية لبرنامج ربط العمليات التجارية على اليسار، حدد أيقونة الأسهم لتوسيع اللوحة إذا لم يتم توسيعها بالفعل. يجب فتح اللوحة بشكل افتراضي إلى جزء Asset library، المشار إليها بواسطة أيقونة الكتب في أعلى اللوحة. لاحظ أن هناك شريط بحث لتحديد موقع الأصول. لاحظ زرين، Data وComponent.

    لقطة شاشة لموقع مكتبة أصول المصمم وشريط البحث وأيقونة البيانات.

  3. حدد البيانات، ابحث عن مجموعة بيانات penguin-data وضعها في اللوحة.

  4. انقر بزر الماوس الأيمن (Ctrl+النقر فوق Mac) فوق مجموعة البيانات penguin-data على اللوحة، وانقر فوق Preview data.

  5. حدد علامة تبويب ملف التعريف، مع الإشارة إلى أنه يمكنك مشاهدة توزيعات الأعمدة المختلفة كمدرجات تكرارية.

  6. لاحظ الخصائص التالية لمجموعة البيانات:

    • تتضمن مجموعة البيانات الأعمدة التالية:
      • “CulmenLength”: طول منقار البطريق بالملليمترات.
      • “CulmenDepth”: عرض منقار البطريق بالملليمترات.
      • “FlipperLength”: طول زعنفة البطريق بالملليمترات.
      • “BodyMass”: وزن البطريق بالجرامات.
      • “Species”: مؤشر الأنواع (0: “آديلي”، 1: “جنتو”، 2: “شريطي الذقن”)
    • توجد قيمتين مفقودتين في عمود “CulmenLength” (كما أن أعمدة “CulmenDepth”، و “FlipperLength”، و “BodyMass” تحتوي أيضًا على قيمتين مفقودتين).
    • قيم القياس بأحجام مختلفة (من عشرات ملليمترات إلى آلاف الغرامات).
  7. أغلق صفحة DataOutput حتى تتمكن من رؤية مجموعة البيانات على لوحة المسار.

تطبيق التحويلات

  1. في جزء مكتبة الأصول على اليسار، حدد المكون (الذي يحتوي على مجموعة واسعة من الوحدات التي يمكنك استخدامها لتحويل البيانات وتدريب النموذج). يمكنك أيضا استخدام شريط البحث لتحديد موقع الوحدات بسرعة.

    لقطة شاشة لموقع مكتبة أصول المصمم وشريط البحث وأيقونة المكونات.

  2. لتجميع الملاحظات حول البطاريق، سنقوم باستخدام القياسات فقط؛ لذا سنتجاهل عمود الأنواع. لذلك، ابحث عن وحدة Select Columns in Dataset وضعها على اللوحة، أسفل الوحدة penguin-data وقم بتوصيل المخرج في الجزء السفلي من وحدة penguin-data مع المدخل في الجزء العلوي من الوحدة Select Columns in Dataset على النحو التالي:

    لقطة شاشة لمجموعة بيانات «penguin-» متصلة بالوحدة «Select Columns in Dataset».

  3. انقر نقرًا مزدوجًا فوق الوحدة النمطية Select Columns in Dataset، وفي الجزء على الجانب الأيمن، حدد Edit column. ثم في نافذة Select columns، حدد By name واستخدم الروابط + لتحديد أسماء الأعمدة CulmenLength وCulmenDepth و FlipperLengthو BodyMass؛ على النحو التالي:

    لقطة شاشة لكيفية تضمين أسماء الأعمدة "Culmen Length" و"CulmenDepth" و"Flipper Length" و"Body Mass".

  4. حدد حفظ، قم اغلق القائمة تحديد أعمدة في مجموعة البيانات للرجوع إلى لوحدة المصمم.

  5. في مكتبة الأصول، ابحث عن وحدة مسح البيانات المفقودة وضعها على اللوحة، أسفل وحدة تحديد الأعمدة في مجموعة البيانات وقم بتوصيلهما معًا على النحو التالي:

    لقطة شاشة لكيفية توصيل Select Columns" في وحدة "Dataset" بوحدة "Clean Missing Data".

  6. انقر نقرًا مزدوجًا فوق وحدة مسح البيانات المفقودة، وفي جزء “الإعدادات” على الجانب الأيمن، حدد تحرير العمود. ثم في نافذة Columns to be cleaned حدد With rules وقم بتضمين All columns؛ على النحو التالي:

    لقطة شاشة حول كيفية استخدام خيار «rules» لتحديد كافة الأعمدة.

  7. حدد حفظ ، ثم في جزء الإعدادات، قم بتعيين إعدادات التكوين التالية:
    • الحد الأدنى لنسبة القيمة المفقودة: 0.0
    • الحد الأقصى لنسبة القيمة المفقودة: 1.0
    • وضع التنظيف: إزالة الصف بالكامل
  8. في Asset library، ابحث عن وحدة Normalize Data وضعها على اللوحة، أسفل الوحدة النمطية Clean Missing Data. ثم اربط إخراج الوحدة النمطية Clean Missing Data الموجود أقصى اليسار بإدخال الوحدة النمطية Normalize Data.

    لقطة شاشة لوحدة «Clean Missing Data» المتصلة بوحدة «Normalize Data».

  9. انقر نقرًا مزدوجًا فوق الوحدة النمطية Normalize Data وفي الجزء على اليمين، قم بتعيين Transformation method” إلى MinMax وحدد Edit column. ثم في نافذة Columns to transform حدد With rules وقم بتضمين All columns؛ على النحو التالي:

    لقطة شاشة لكيفية تحديد كافة الأعمدة.

  10. حدد حفظ، ثم اغلق إعدادات وحدة تسوية البيانات للعودة إلى لوحة المصمم.

قم بتشغيل البنية الأساسية

لتطبيق تحويلات البيانات الخاصة بك، تحتاج إلى تشغيل البنية الأساسية كتجربة.

  1. حدد تكوين وإرسال في أعلى الصفحة لفتح مربع حوار إعداد مهمة مسار.

  2. في صفحة الأساسيات، حدد إنشاء جديد واضبط اسم التجربة على mslearn-penguin-training ثم حدد التالي .

  3. في صفحة الإدخالات والمخرجات، حدد التالي دون إجراء أي تغييرات.

  4. في صفحة إعدادات وقت التشغيل يظهر خطأ حيث ليس لديك حساب افتراضي لتشغيل المسار. في القائمة المنسدلة تحديد نوع الحوسبة حدد حساب بنظام مجموعة وفي القائمة المنسدلة حدد مجموعة Azure ML للحوسبة حدد مجموعة الحوسبة التي تم إنشاؤها مؤخرًا.

  5. حدد التالي لمراجعة مهمة مسار التدريب، ثم حدد إرسال لتشغيل مسار التدريب.

  6. انتظر حتى تنتهي عملية التشغيل. قد يستغرق ذلك 5 دقائق أو أكثر. يمكنك التحقق من حالة المهمة عن طريق تحديد المهام ضمن الأصول. من هناك، حدد مهمة تدريب مجموعة البطاريق.

اعرض البيانات المحولة

  1. عند اكتمال التشغيل، ستبدو الوحدات النمطية هكذا:

    لقطة شاشة للوحدات بحالة مكتملة مع شريط أخضر على يسار كل وحدة.

  2. انقر بزر الماوس الأيمن فوق وحدة تسوية البيانات، وحدد معاينة البيانات، ثم حدد مجموعة البيانات المحوّلة لعرض النتائج.

  3. استعرض البيانات، مع ملاحظة أنه تم إزالة عمود “Species”، ولا توجد قيم مفقودة، وتم تسوية القيم الخاصة بالميزات الأربعة جميعًا إلى مقياس مشترك.

  4. اغلق صفحة Transformed_dataset للعودة إلى تشغيل المسار.

والآن بعد أن قمت بتحديد وإعداد الميزات التي تريد استخدامها من مجموعة البيانات، أنت جاهز لاستخدامها لتدريب نموذج التجميع.

بعد استخدام تحويلات البيانات لإعداد البيانات، يمكنك استخدامها لتدريب نموذج التعلم الآلي.

إضافة وحدات تدريبية

اعمل من خلال الخطوات التالية لتوسيع البنية الأساسية لبرنامج ربط العمليات التجارية تدريب تكوين أنظمة مجموعات البطريق كما هو موضح هنا:

لقطة شاشة لمكون خوارزمية تكوين أنظمة المجموعات «K-Means» ومكون تعيين البيانات إلى الوحدات.

اتبع الخطوات الموجودة أدناه، باستخدام الصورة الموجودة أعلاه كمرجع عند إضافة الوحدات النمطية المطلوبة وتكوينها.

  1. ارجع إلى صفحة المصمم وافتح مسودة مسار تدريب مجموعة البطاريق.

  2. في جزء Asset library الموجود في جهة اليسار، ابحث عن الوحدة Split Data وضعها في اللوحة ضمن الوحدة Normalize Data. ثم قم بتوصيل مخرجات الوحدة النمطية Normalize Data الموجودة على اليسار مع مدخلات الوحدة النمطية Split Data.

    تلميح استخدم شريط البحث لتحديد موقع الوحدات بسرعة.

  3. حدد الوحدة Split Data، وكوّن إعداداتها كما يلي:
    • وضع التقسيم: تقسيم الصفوف
    • كسر الصفوف في مجموعة بيانات الإخراج الأولى: 0.7
    • Randomized split: True
    • القيمة الأولية العشوائية: 123
    • التقسيم الطبقي: خطأ
  4. في Asset library، ابحث عن الوحدة Train Clustering Model وضعها في اللوحة، ضمن الوحدة Split Data. ثم قم بتوصيل المخرج Result dataset1 للوحدة Split Data (الموجود على اليسار) مع المدخل Dataset للوحدة Train Clustering Model (الموجود على اليمين).

  5. يجب أن يقوم نموذج أنظمة المجموعات بتعيين المجموعات إلى عناصر البيانات باستخدام كافة الميزات التي قمت بتحديدها من مجموعة البيانات الأصلية. انقر نقرًا مزدوجًا فوق الوحدة Train Clustering Model وفي الجزء الأيمن، حدد Edit column. استخدم الخيار With rules لتضمين جميع الأعمدة، كما يلي:

    لقطة شاشة لكيفية تضمين كافة الأعمدة في مجموعة الأعمدة.

  6. سوف يستخدم النموذج الذي نقوم بتدريبه الميزات لتجميع البيانات في مجموعات بيانات، لذلك نحن بحاجة لتدريب النموذج باستخدام خوارزمية نظام المجموعات. في مكتبة الأصل، ابحث عن وحدة التجميع بالمتوسط وضعها في اللوحة، يسار وحدة تقسيم البيانات وفوق وحدة تدريب مجموعة البطاريق. ثم قم بتوصيل المخرج الخاص بها مع مدخل Untrained model للوحدة النمطية Train Clustering Model (الموجود على اليسار).

  7. تجمّع خوارزمية K-Means العناصر في عدد أنظمة المجموعات التي تحددها - وهي قيمة يشار إليها باسم K. حدد الوحدة K-Means Clustering وفي جزء الجانب الأيمن، قم بتعيين معلمة Number of centroids إلى 3.

    ملاحظة يمكنك التفكير في ملاحظات البيانات، مثل قياسات البطاريق، على أنها متجهات متعددة الأبعاد. تعمل خوارزمية أساليب K بواسطة:

    1. تهيئة إحداثيات K كنقاط يتم تحديدها عشوائيًا تُسمى نقاط مركزية في فضاء متعدد الأبعاد (حيث تعني عبارة متعدد الأبعاد عدد الأبعاد في الخطوط المتجهة للميزة).
    2. تعيين متجهات الميزة كنقاط في نفس المساحة، وتعيين كل نقطة إلى أقرب نقطة مركزية.
    3. نقل النقاط المركزية إلى منتصف النقاط المخصصة لها (حسب مسافة المتوسط).
    4. إعادة تعيين النقاط إلى أقرب نقاط مركزية بعد هذه الخطوة.
    5. تكرار الخطوات c. و d. حتى تستقر عمليات تخصيص نظام المجموعة أو إكمال العدد المحدد من التكرارات.

    بعد استخدام 70٪ من البيانات لتدريب نموذج نظام المجموعة يمكنك استخدام 30٪ المتبقية لاختباره باستخدام النموذج لتعيين البيانات إلى أنظمة المجموعات.

  8. في Asset library، ابحث عن الوحدة النمطية Assign Data to Clusters وضعها في اللوحة، أسفل الوحدة النمطية Train Clustering Model. ثم قم بتوصيل مخرج Trained model للوحدة النمطية Train Clustering Model (الموجود على اليسار) مع مدخلات Trained model للوحدة النمطية Assign Data to Clusters (الموجودة على اليسار)؛ وقم بتوصيل مخرج Results dataset2 للوحدة النمطية Split Data (الموجود على اليمين) مع مدخلات Dataset للوحدة النمطية Assign Data to Clusters (الموجودة على اليمين).

تشغيل المسار الخاص بالتدريب

الآن أنت مستعد لتشغيل البنية الأساسية للتدريب وتدريب النموذج.

  1. تأكد من أن البنية الأساسية تبدو على هذا النحو:

    لقطة شاشة لمسار تدريب كامل بدءاً من بيانات البطريق وحتى مكون تعيين البيانات إلى أنظمة المجموعات.

  2. حدد تكوين وإرسالوقم بتشغيل المسار المسمى mslearn-penguin-training على نظام مجموعة الحاسبات.

  3. انتظر حتى تنتهي عملية التشغيل. قد يستغرق ذلك 5 دقائق أو أكثر. تحقق من حالة المهمة عن طريق تحديد المهام ضمن الأصول. من هناك، حدد أحدث مهمة تدريب مجموعة البطاريق.

  4. عند انتهاء تشغيل التجربة، انقر بزر الماوس الأيمن فوق الوحدة تعيين البيانات إلى المجموعات، وحدد معاينة البيانات، ثم حدد مجموعة بيانات النتائج لعرض النتائج.

  5. مرر لأسفل، ولاحظ العمود Assignments، الذي يحتوي على نظام المجموعة (0 أو 1 أو 2) الذي تم تعيين كل صف إليها. هناك أيضًا أعمدة جديدة تشير إلى المسافة من النقطة التي تمثّل هذا الصف إلى مراكز كل مجموعة من المجموعات - المجموعة التي تكون النقطة أقرب إليها هي التي تم تعيينها إليها.

  6. أغلق مرئيات Results_dataset للعودة إلى تشغيل المسار.

النموذج هو التنبؤ بالمجموعات للحصول على ملاحظات حول البطاريق، ولكن ما مدى موثوقية توقعاتها؟ لتقييم ذلك، تحتاج إلى تقييم النموذج.

تقييم نموذج نظام المجموعة أمر صعب لأنه لا توجد قيم صحيحة معروفة مسبقًا لتعيينات نظام المجموعة. نموذج نظام المجموعة الناجح هو الذي يحقق مستوى جيدًا من الفصل بين العناصر في كل مجموعة، لذلك نحن بحاجة إلى مقاييس لمساعدتنا على قياس هذا الفصل.

إضافة وحدة نموذج للتقييم

  1. في صفحة المصمم، افتح مسودة مسار تدريب مجموعة البطاريق.

  2. في Asset library، ابحث عن الوحدة Evaluate Model وضعها على اللوحة، ضمن الوحدة Assign Data to Clusters. قم بتوصيل ناتج وحدة تعيين البيانات إلى أنظمة المجموعات إلى إدخال Scored dataset (الأيسر) لوحدة Evaluate Model.

  3. تأكد من أن البنية الأساسية تبدو على هذا النحو:

    لقطة شاشة لكيفية إضافة وحدة «Evaluate Model» إلى الوحدة «Assign Data to Clusters».

  4. حدد تكوين وإرسالوقم بتشغيل المسار المسمى mslearn-penguin-training على نظام مجموعة الحاسبات.

  5. انتظر حتى انتهاء تشغيل التجربة. للتحقق من حالتها، انتقل إلى صفحة المهام وحدد أحدث مهمة تدريب مجموعة البطاريق.

  6. انقر بزر الماوس الأيمن فوق وحدة نموذج التقييم وحدد معاينة البيانات، ثم حدد نتائج التقييم. راجع المقاييس في كل صف:
    • متوسط المسافة إلى مركز آخر
    • متوسط المسافة إلى مركز نظام المجموعة
    • عدد النقاط
    • المسافة القصوى إلى مركز نظام المجموعة
  7. أغلق علامة تبويب Evaluation_results.

الآن بعد أن أصبح لديك نموذج تكوين أنظمة مجموعات للعمل ، يمكنك استخدامه لتعيين بيانات جديدة إلى مجموعات في مسار استدلالي.

بعد إنشاء وتشغيل مسار لتدريب نموذج نظام المجموعة، يمكنك إنشاء مسار الاستدلال. يستخدم مسار الاستدلال النموذج لتعيين ملاحظات بيانات جديدة لأنظمة المجموعة. سيشكل هذا النموذج البينة الأساسية لخدمة تنبؤية يمكنك نشرها لتستخدمها التطبيقات.

إنشاء بنية أساسية استدلالية

  1. حدد موقع القائمة أعلى اللوحة وحدد إنشاء مسار الاستنتاج. قد تحتاج إلى توسيع الشاشة إلى وضع الشاشة الكاملة والنقر على أيقونة النقاط الثلاث في الزاوية العلوية اليمنى من الشاشة من أجل العثور على إنشاء مسار الاستنتاج في القائمة.

    لقطة شاشة لموقع إنشاء البنية الأساسية لبرنامج ربط العمليات التجارية للاستدلال.

  2. في القائمة المنسدلة إنشاء مسار الاستنتاج، حدد مسار الاستنتاج في الوقت الفعلي. وبعد بضع ثوان، سيتم فتح إصدار جديد من المسار الخاص بك باسم “Train Penguin Clustering-real time inference”.

  3. أعد تسمية المسار الجديد باسم **“Predict Penguin Clusters” **، ثم راجع المسار الجديد. تعد التحويلات ونموذج التجميع في البنية الأساسية لبرنامج ربط العمليات التجارية للتدريب جزءا من هذا المسار. سيتم استخدام النموذج المدرب لتسجيل البيانات الجديدة. يحتوي المسار أيضًا على web service output لإرجاع النتائج.

    ستقوم بإجراء التغييرات التالية على البنية الأساسية للاستدلال:

    لقطة شاشة بالتغييرات التي تم إجراؤها على البنية الأساسية لبرنامج ربط العمليات التجارية، بما في ذلك المكونات التي يجب إضافتها وإزالتها والمميزة باللون الأحمر.

    • أضف مكون web service input للبيانات الجديدة التي سيتم إرسالها.
    • استبدل مجموعة بيانات penguin-data بمكوّن إدخال البيانات يدويًا والتي لا تتضمن عمود الأصناف.
    • قم بإزالة المكوّن تحديد الأعمدة في مجموعة البياناتالتي هي مكررة الآن.
    • قم بتوصيل المكوّنين إدخال خدمة الويب وإدخال البيانات يدويًا (التي تمثل مدخلات للبيانات التي سيتم تجميعها) مع مكوّن تطبيق التحويل الأول.

    اتبع الخطوات المتبقية أدناه، باستخدام الصورة والمعلومات الموجودة أعلاه كمرجع في أثناء تعديل البينة الأساسية.

  4. لا يتضمن المسار تلقائيًا مكون Web Service Input للنماذج التي تم إنشاؤها من مجموعات البيانات المخصصة. ابحث عن مكون Web Service Input من asset library وضعه في أعلى المسار. اربط إخراج مكون إدخال خدمة الويب بإدخال الجانب الأيمن لـ مجموعة البيانات لمكون تطبيق التحويل الموجود بالفعل على اللوحة.

  5. يفترض المسار الاستدلالي أن البيانات الجديدة ستتطابق مع مخطط بيانات التدريب الأصلية، لذلك يتم تضمين مجموعة “penguin-data” من مسار التدريب. ومع ذلك، تتضمن بيانات الإدخال هذه عمودًا لأنواع البطريق، لا يستخدمه النموذج. احذف كلاً من مجموعة البيانات penguin-data والوحدات النمطية Select Columns in Dataset واستبدلها بالوحدة النمطية Enter Data Manually من Asset library.

  6. ثم قم بتعديل إعدادات الوحدة النمطية “Enter Data Manually” لاستخدام إدخال CSV التالي، والذي يحتوي على قيم ميزات لثلاث ملاحظات جديدة حول البطاريق (بما في ذلك الرؤوس):

     CulmenLength,CulmenDepth,FlipperLength,BodyMass
     39.1,18.7,181,3750
     49.1,14.8,220,5150
     46.6,17.8,193,3800
    
  7. اربط مخرجات وحدة إدخال البيانات يدويًا مع مدخلات مجموعة البيانات (في اليمين) لوحدة تطبيق التحويل الأولى.

  8. احذف الوحدة النمطية “Evaluate Model”.

  9. تحقق من أن البنية الأساسية تشبه الصورة التالية:

    لقطة شاشة للبنية الأساسية لبرنامج ربط العمليات التجارية الاستدلالية الكاملة لتكوين أنظمة المجموعات.

  10. أرسل المسار كتجربة جديدة باسم “mslearn-penguin-inference” الموجود على مجموعة الحساب الخاصة بك. قد تستغرق التجربة بعض الوقت لتشغيلها.

  11. انتقل إلى المهام وحدد أحدث مهمة توقع مجموعة البطاريق باستخدام اسم التجربة mslearn-penguin-inference.

  12. عند انتهاء المسار، انقر بزر الماوس الأيمن فوق الوحدة تعيين البيانات إلى المجموعات، ثم حدد معاينة البيانات، ثم حدد مجموعة بيانات النتائج لعرض تعيينات ومقاييس أنظمة المجموعة المتوقعة لملاحظات البطاريق الثلاثة في بيانات الإدخال.

البينة الأساسية للاستدلال الخاصة بك تعيّن ملاحظات البطريق إلى مجموعات على أساس ميزاتها. الآن أنت جاهز لنشر البنية الأساسية بحيث يمكن استخدام تطبيقات العميل.

نشر خدمة

في هذا التمرين، سوف تنشر خدمة الويب على مثيل حاوية Azure Container Instance (ACI). يتم إنشاء هذا النوع من الحساب بشكل حيوي، وهو مفيد للتطوير والاختبار. بالنسبة للإنتاج، يجب عليك إنشاء نظام مجموعة استدلال، والذي يوفر نظام مجموعة Azure Kubernetes Service (AKS) والتي توفر قابلية توسع وأمان أفضل.

  1. أثناء وجودك في صفحة تشغيل استنتاج مججموعات البطاريق المتوقعة، حدد نشر في شريط القوائم العلوي.

    لقطة شاشة لزر "deploy" للبنية الأساسية لبرنامج ربط العمليات التجارية الاستدلالية لـ "Predict Auto Price".

  2. حدد نشر نقطة نهاية جديدة في الوقت الفعلي واستخدم الإعدادات التالية:
    • الاسم: predict-penguin-clusters
    • الوصف: تكوين أنظمة مجموعات طيور البطريق.
    • نوع الحساب: Azure Container Instance
  3. انتظر نشر خدمة الويب - قد يستغرق ذلك عدة دقائق.

  4. لعرض حالة النشر، قم بتوسيع الجزء الأيسر عن طريق تحديد أيقونة القائمة في الجزء العلوي الأيسر من الشاشة. اعرض صفحة Endpoints (ضمن Assets) وحدد predict-penguin-clusters. عند انتهاء التوزيع، ستتغير Deployment state إلى Healthy.

اختبار الخدمة

  1. في صفحة Endpoints، افتح نقطة النهاية في الوقت الحقيقي predict-penguin-clusters، وحدد علامة التبويب Test.

    لقطة شاشة لموقع خيار "Endpoints" في الجزء الأيسر.

  2. سنستخدمه لاختبار نموذجنا ببيانات جديدة. احذف البيانات الحالية ضمن “Input data to test real-time endpoint”. انسخ البيانات أدناه والصقها في قسم البيانات:

     {
         "Inputs": {
             "input1": [
                 {
                     "CulmenLength": 49.1,
                     "CulmenDepth": 4.8,
                     "FlipperLength": 1220,
                     "BodyMass": 5150
                 }
             ]
         },
         "GlobalParameters":  {}
     }
    

    ملاحظة يحدد JSON أعلاه ميزات البطريق، ويستخدم خدمة predict-penguin-clusters التي أنشأتها للتنبؤ بتعيين نظام مجموعة.

  3. حدد اختبار. على الجانب الأيمن من الشاشة، يجب أن تشاهد الإخراج ‘Assignments’. لاحظ كيف أن نظام المجموعة المخصص هو المجموعة ذات أقصر مسافة لمركز نظام المجموعة.

    لقطة شاشة لجزء «Test» مع نموذج نتيجة الاختبار.

لقد اختبرت للتو خدمة جاهزة للاتصال بتطبيق عميل باستخدام بيانات الاعتماد في علامة التبويب Consume. سننهي التدريب العملي هنا. نرحب بمواصلة تجربة الخدمة التي قمت بتوزيعها للتو.

التنظيف

تتم استضافة خدمة الويب التي قمت بإنشائها في Azure Container Instance. إذا كنت لا تنوي إجراء المزيد من التجارب عليها، فإنه يجب عليك حذف نقطة النهاية لتجنب تراكم استخدام Azure غير الضروري. يجب عليك أيضًا حذف نظام مجموعة الحوسبة.

  1. في استديو التعلم الآلي من Azure، على علامة التبويب “Endpoints” حدد نقطة النهاية “predict-penguin-clusters”. ثم حدد “Delete” (🗑) وأكد أنك ترغب في حذف نقطة النهاية.

  2. في صفحة Compute، وفي علامة التبويب Compute clusters، حدد نظام مجموعة الحساب ثم حدد Delete.

ملاحظة يضمن حذف الحساب عدم تحصيل رسوم من اشتراكك مقابل موارد الحساب. ومع ذلك، سيتم تحصيل مبلغ صغير لتخزين البيانات طالما أن مساحة عمل التعلم الآلي من Azure موجودة في اشتراكك. إذا انتهيت من استكشاف التعلم الآلي من Azure، فإنه يمكنك حذف مساحة عمل التعلم الآلي من Azure والموارد المقترنة بها. ومع ذلك، إذا كنت تخطط لإكمال أي معامل تجريبية أخرى في هذه السلسلة، سوف تحتاج إلى إعادة إنشائها.

لحذف مساحة العمل لديك:

  1. في مدخل Azure، ومن صفحة Resource groups، افتح مجموعة الموارد التي حددتها عند إنشاء مساحة عمل Azure Machine Learning.
  2. انقر فوق حذف مجموعة الموارد، واكتب اسم مجموعة الموارد لتأكيد أنك ترغب في حذفها، ثم حدد Delete.