كيفية إنشاء مخطط شجري في Superset بطريقة صحيحة
إن إنشاء عرض بمخطط شجرة يمكن أن يكون عملية معقدة في بعض الأحيان، خاصة عند استخدام أدوات مثل Apache Superset. يعتبر المخطط الشجري وسيلة فعالة لعرض البيانات الهيكلية بطريقة تسهل فهم العلاقات بين الكيانات المختلفة. في هذا المقال، سنستعرض كيفية إعداد البيانات الصحيحة للحصول على عرض مرئي يحقق هذا الهدف.
ما هو مخطط الشجرة؟
مخطط الشجرة هو نوع من البيانات الإحصائية التي تعرض المعلومات بشكل متسلسل أو هرمي، حيث ترتبط العناصر ببعضها البعض بطريقة تعكس الهيكل التنظيمي أو العلاقات بين المكونات. يمكن أن يكون هذا النوع من المخططات مفيدًا جدًا في توضيح كيفية تفاعل البيانات المختلفة أو المؤسسات المختلفة.
استعداد البيانات في SQL
لبناء عرض مخطط شجرة في Superset، يجب أولاً التأكد من أن البيانات التي سنعمل عليها تم إعدادها بشكل صحيح. لنأخذ على سبيل المثال بنية الجدول التي تم استخدامها في هذا السياق. لدينا مجموعة من الجداول الفرعية التي تعالج بيانات مختلفة، مثل medidas_score
وmedidas_regra
وmedidas_tabela
. كل جدول يلبي احتياجات محددة.
WITH medidas_score AS (
SELECT 1 AS ID, AVG(data_quality_dimension_vl) AS Score_objeto
FROM Fact_asset_dimension_data_quality_score
),
medidas_regra AS (
SELECT 1 AS ID, data_quality_dimension_sk, AVG(score_objeto) AS medida_regra
FROM act_asset_dimension_data_quality_score AS l_check
INNER JOIN medidas_score AS m_score ON m_score.ID = l_check.ID
GROUP BY 1, 2
),
medidas_tabela AS (
SELECT 1 AS ID, data_quality_dimension_sk, AVG(medida_regra) AS medida_tabela
FROM Fat_asset_dimension_data_quality_score AS l_check
INNER JOIN medidas_regra AS m_tabela ON m_tabela.ID = l_check.ID
GROUP BY 1, 2
)
في هذه الشيفرة، نقوم بجمع البيانات من عدة مستويات لتحسين دقة القياسات التي سنستخدمها لاحقًا.
تجميع البيانات النهائية
بعد إعداد الجداول الفرعية، تأتي المرحلة التالية وهي تجميع البيانات في جدول نهائي يدمج كل المعلومات. هنا، نقوم بدمج البيانات من مختلف الجداول وربطها بالحقائق النهائية.
TB_FINAL AS (
SELECT
tb2.asset_column_nm,
tb2.asset_database_nm,
tb2.asset_file_table_nm,
tb3.data_quality_dimension_nm,
CASE
WHEN tb01.asset_sk IS NOT NULL THEN 'ATRIBUTO'
WHEN tb3.DATA_QUALITY_DIMENSION_SK IS NOT NULL THEN 'TABELA'
WHEN tb2.asset_file_table_nm IS NOT NULL THEN 'ORIGEM'
ELSE 'N/A'
END AS medida_dados_atributo,
AVG(tb1.data_quality_dimension_vl) AS Medida_Atributo,
AVG(TB04.medida_tabela) AS Medida_Tabela,
AVG(TB05.medida_origem) AS Medida_Origem
FROM act_asset_dimension_data_quality_score tb1
INNER JOIN dim_asset tb2 ON tb1.asset_sk = tb2.asset_sk
INNER JOIN dim_data_quality_dimension tb3 ON tb1.data_quality_dimension_sk = tb3.data_quality_dimension_sk
INNER JOIN medidas_tabela AS TB04 ON TB04.data_quality_dimension_sk = tb1.data_quality_dimension_sk
INNER JOIN medidas_origem AS TB05 ON TB05.asset_sk = tb1.asset_sk
GROUP BY 1, 2, 3, 4, 5
)
بهذا الشكل، يتم إنشاء جدول متكامل يحتوي على جميع المعلومات الضرورية التي ستساعدنا في إنشاء المخطط الشجري.
تحديد القيم المناسبة لعرض المخطط الشجري
عند إعداد العرض النهائي في Superset، يجب عليك اختيار القيم المناسبة لكل من الأبعاد والقياسات. هنا، نحدد كيفية قراءة البيانات وضبط العروض التقديمية لتظهر المعلومات بوضوح:
SELECT
asset_column_nm,
asset_database_nm,
asset_file_table_nm,
data_quality_dimension_nm,
Medida_Atributo,
Medida_Tabela,
Medida_Origem,
medida_dados_atributo,
CASE
WHEN MEDIDAS.medida_dados_atributo = 'ATRIBUTO' THEN MEDIDAS.medida_atributo
WHEN MEDIDAS.medida_dados_atributo = 'TABELA' THEN MEDIDAS.medida_tabela
ELSE MEDIDAS.medida_origem
END AS medida_arvore
FROM TB_FINAL
الخاتمة
إن إنشاء عرض بمخطط شجرة باستخدام Apache Superset يتطلب التخطيط الدقيق ومعالجة البيانات بشكل متسلسل. من الضروري استخدام SQL بطريقة تضمن تجميع البيانات من مصادر متعددة بطريقة منظمة. من خلال الخطوات التي قمنا بمراجعتها، يمكنك الآن البدء في إنشاء العرض المرئي الخاص بك ويجب أن يساعدك الفهم الجيد للهياكل الأساسية على تصميم المخططات الشجرية بشكل فعال.
استخدام SQL – I need to create a Tree chart view in super set, but i’m not understanding the correct way to set the table to the visual work correctly، يعد من الأشياء الأساسية لفهم كيفية الربط بين البيانات. تذكر أن تنظيم البيانات هي خطوة أساسية لتحقيق النجاح في هذه العملية.