شروحات الكمبيوتر والإنترنت والموبايل

إنشاء مخطط صندوقي مع قيم البداية والنهاية لكل فئة

مخطط الصندوق أو ما يعرف بـ Box Plot هو أداة مميزة في تحليل البيانات تستخدم بشكل واسع في مجالات علوم البيانات والإحصاء. يعمل هذا النوع من المخططات على تقديم رؤية واضحة للتوزيع الذي تحمله مجموعة من البيانات، حيث يمكن من خلاله معرفة القيم المتطرفة والطبيعية في البيانات.

فهم مخطط الصندوق

يتبع مخطط Seaborn’s boxplot مجموعة من الالتزامات القياسية، وهي تعتمد بشكل كبير على الشعيرات التي تحدد نقاط البيانات الدنيا والعليا مع استثناء القيم المتطرفة. يتم تمثيل خط المتوسط داخل الصندوق، بينما يشير الصندوق نفسه إلى حد النسب المئوية 25% و75%. هذه القيم تشمل المتوسطات للنصف السفلي والأعلى من البيانات.

إذا كان لديك 3 نقاط بيانات فقط لكل فئة، فسيتم استخدام هذه النقاط لتحديد الشعيرات والخط المتوسط. في هذه الحالة، يجب أن تؤخذ الحيطة إذ قد يحدث تحريف في مواضع بداية ونهاية الصندوق. الحل هنا هو تكرار البيانات ثلاث مرات مما يجعل الوسيط يتواجد في العمود "الرتبة الثانية" في مجموعة البيانات الخاصة بك. ومع هذا التكرار، تصبح النسب المئوية 25% و75% هي "الرتبة الأولى" و"الرتبة الثالثة".

تطبيق مخطط الصندوق باستخدام Python

لنفترض أن لديك مجموعة بيانات تتضمن تقييمات لمواد دراسية مختلفة. يمكنك استخدام مكتبة Pandas لإدارة البيانات ومكتبة Seaborn لرسم المخطط. المنهجية تتضمن استيراد الحزم اللازمة ذات الصلة:

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
data = [['Math', 3, 5, 15],
        ['English', 3, 10, 20],
        ['Computers', 5, 12, 30],
        ['Science', 8, 15, 32],
        ['Art', 17, 25, 48],
        ['Sports', 22, 45, 60]]
df = pd.DataFrame(data, columns=['Class', 'First Rank', 'Second Rank', 'Third Rank'])
df2 = pd.melt(df, ['Class'])
g = sns.catplot(x='value', y='Class', hue='Class', data=pd.concat([df2, df2, df2]), kind="box", orient="h", height=5, aspect=2)
g.set(xticks=(range(0, 80, 5)))
plt.show()

في هذا المثال، نقوم بإنشاء DataFrame بعناصر المواد الدراسية وتنظيمها بطريقة تسهل تحليلها باستخدام مخطط الصندوق.

حساب النسب المئوية بطرق متعددة

يمكن أيضًا استخدام مكتبة Numpy لحساب النسب المئوية لأي مجموعة من البيانات. فمثلاً، يمكنك إنشاء بيانات للأرقام الأولية للمعدلات الدراسية واستخدام numpy لإجراء الحسابات:

import numpy as np
values = [3, 5, 15]
for copies in [1, 2, 3]:
    data = values * copies
    print(f'copies: {copies}, data: {data}')
    for perc in [0, 25, 50, 75, 100]:
        print(f'{perc}th percentile:', np.percentile(data, perc))

بهذا المثال، نقوم بحساب النسب المئوية المختلفة للبيانات المكررة. ويظهر لنا قائمة بالقيم التي تم حسابها لكل نسبة مئوية.

استنتاجات

مخططات الصندوق تعتبر أداة قوية لعرض البيانات بشكل بصري. إن استخدامها في تحليل البيانات يعد أمرًا حيويًا، خصوصًا عند العمل مع مجموعات بيانات متعددة وبأشكال مختلفة. يمكن من خلاله التعرف بسرعة على التغيرات في القياسات بين فئات مختلفة، مما يسهل عملية اتخاذ القرارات المستندة إلى البيانات.

في النهاية، فإن تعلم كيفية إنشاء مخطط صندوق باستخدام Python مع القيم الابتدائية والنهائية لكل فئة سيضيف إلى قوائم الأدوات الخاصة بك كمحلل بيانات. يمكنك تجربة هذا الدليل بنفسك وزيادة مهاراتك في التحليل باستخدام مكتبات Python المتنوعة.

فهد السلال

خبير تقني متخصص في شروحات الكمبيوتر والإنترنت والموبايل، يتمتع بخبرة واسعة في تقديم حلول تقنية مبتكرة ومبسطة. يهدف فهد إلى مساعدة المستخدمين على تحسين تجربتهم التقنية من خلال مقالات وأدلة عملية واضحة وسهلة الفهم.
زر الذهاب إلى الأعلى
Don`t copy text!