Résumé de section

  • التحليل العنقودي هو أسلوب إحصائي يُستخدم لتجميع البيانات في مجموعات (عناقيد) متجانسة بحيث تكون العناصر داخل كل مجموعة متشابهة، وتكون المجموعات نفسها متباينة عن بعضها. يُعنى هذا النوع من التحليل بتجميع عناصر البيانات بناءً على خصائصها المشتركة، وليس بناءً على تصنيف مُسبق لها. المصفوفة في هذا السياق تمثل مجموعة البيانات التي تُجرى عليها عملية التجميع، حيث يُمكن أن تكون صفوفها تمثل ملاحظات (مثل المستهلكين أو أنواع الحليب) وأعمدتها تمثل خصائص أو متغيرات

    الهدف الرئيسي: تصنيف البيانات أو الكائنات إلى مجموعات (عناقيد) بحيث يكون العناصر داخل العنقود الواحد متشابهة في خصائصها، وبعيدة عن العناصر في العناقيد الأخرى.

    دور المصفوفة في التحليل العنقودي

    مصفوفة البيانات: تمثل المصفوفة البيانات الأولية التي يتم تحليلها. كل صف في المصفوفة يمثل عنصراً واحداً (وحدة أو ملاحظة)، وكل عمود يمثل متغيراً أو خاصية تميز هذا العنصر.

    مصفوفة التقارب: بعد حساب التشابه أو الاختلاف بين كل عنصر والآخر، يتم إنشاء مصفوفة التقارب أو المسافة (Distance Matrix). هذه المصفوفة تُظهر مدى قرب أو بعد كل عنصر عن العناصر الأخرى، وهي أساس عملية التحليل العنقودي.

    طرق التحليل: تعتمد طرق التحليل على هذه المصفوفة لتجميع العناصر. على سبيل المثال، في "التحليل العنقودي الهرمي"، تبدأ العملية من مصفوفة المسافات لبناء التسلسل الهرمي للعناقيد.