يعد قائد تحديث البيانات هو التوظيف الأكثر تأثيرًا من الناحية التقنية في مكتب البيانات بشركة بوبا العربية. يمتلك الدور مسؤولية التصميم وبناء وتشغيل منصة البيانات السحابية الأصلية لبوبا العربية على السحابة، بدءًا من Google Cloud Platform (GCP)، من تدفقات CDC في Oracle في الوقت الفعلي وصولًا إلى لوحات المعلومات في Looker التي يعتمد عليها الاكتواريون والأطباء والإداريون، لخدمة أكثر من 12 مليون عضو.
يبدأ الدور من السحابة (GCP وBigQuery)، ويقوم ببناء المنصة، وليس الاستراتيجية — كتابة الأكواد، وضع معايير الهندسة، فرض جودة البيانات على كل طبقة من Medallion، والحفاظ على تكامل النظام أثناء التوسع. كما يعمل القائد كسلطة تقنية على أي مورد خارجي، ويضمن التزامه بمعايير مستوى الخدمة وجودة الهندسة.
يتحمل الدور مسؤولية تنفيذ شريحة رأسية (Vertical Slice) بطريقة Agile تركز على الأعمال: تحقيق أول قيمة أعمال قابلة للقياس خلال 90 يومًا، التوسع على مستوى المؤسسة بالكامل خلال 12–18 شهرًا، ومنصة متوافقة مع NDMO وPDPL منذ اليوم الأول.
المسؤوليات الرئيسية:
-
بناء وتشغيل خطوط بيانات الوقت الفعلي:
-
تصميم وتشغيل خطوط GCP Datastream CDC من جميع مصادر Oracle (نظام التأمين الأساسي CAESAR، Oracle EBS) ومصادر SQL Server (CRM، IPAC، ACCPAC، Edge، Wathiq وأكثر من 10 مصادر أخرى).
-
بناء استيعاب قائم على الأحداث باستخدام Pub/Sub + Dataflow لمصادر MongoDB، Elasticsearch، JSON والمصادر القائمة على الملفات.
-
تصميم خطوط معالجة التطور التلقائي للمخطط للتعامل مع الأعمدة الجديدة وتغير الأنواع وإضافة الجداول دون فشل أو تغييرات يدوية.
-
فرض التقاط البيانات الوصفية لكل حدث استيعاب.
-
تصميم وتنفيذ بنية Medallion (Bronze / Silver / Gold):
-
إدارة جميع نماذج dbt للطبقات الفضية والذهبية، مع CI/CD وأتمتة اختبارات dbt.
-
تنفيذ SCD Type 2 لجميع الأبعاد الموحدة.
-
تصميم طبقة MDM التحليلية — سجلات ذهبية للعملاء والأعضاء مع قواعد التجميع والحفاظ على التاريخ لعدة سنوات.
-
بناء وإدارة طبقة Looker BI:
-
إنشاء وإدارة طبقة LookML لـ 50+ KPI رئيسي مع أبعاد ومقاييس قابلة لإعادة الاستخدام.
-
تمكين الاستكشاف الذاتي للمستخدمين بدون الحاجة لكتابة SQL.
-
تطبيق ضوابط الوصول القائمة على الأدوار متوافقة مع سياسات BigQuery على مستوى الأعمدة.
-
فرض حوكمة البيانات وجودتها والامتثال لـ NDMO وPDPL:
-
إدارة GCP Dataplex لاكتشاف البيانات تلقائيًا وتصنيف الأعمدة وتتبع المصدر.
-
ضمان الامتثال لمعايير NDMO وPDPL على مستوى الأعمدة.
-
التحقق اليومي من توافق البيانات بين الطبقات الذهبية والفضية والبرونزية.
-
بناء بنية تحتية للذكاء الاصطناعي/التعلم الآلي وتشغيل Vertex AI:
-
تصميم وتهيئة Vertex AI Feature Store للذكاء الاصطناعي الموجّه لموجة 1.
-
بناء خطوط Vertex AI لأتمتة تدريب النماذج ونشرها على نقاط الاستنتاج الإنتاجية.
-
تمكين BigQuery ML كأداة تطوير تنبؤي للمحللين الماليين والاكتواريين.
-
هندسة المنصة، إشراف الموردين، ونقل المعرفة الداخلي:
-
إدارة منطقة الهبوط في GCP: بيئات متعددة، إدارة IAM، البنية التحتية كرمز (Terraform)، التشفير BYOK.
-
الإشراف الفني على المورد الخارجي وفرض معايير الهندسة ومراجعة القرارات الهندسية.
-
ضمان نقل المعرفة للمهندسين الداخليين ليصبحوا قادرين على إدارة النماذج والأنظمة بشكل مستقل.
المهارات المطلوبة:
-
GCP BigQuery، Datastream، dbt Cloud، Looker/LookML، SQL BigQuery، Pub/Sub + Dataflow، DataPlex، Vertex AI، Terraform + GCP IAM + KMS، Cloud Composer/Apache Airflow، Python، Git + CI/CD.
المؤهل التعليمي:
درجة البكالوريوس في علوم الحاسب، هندسة البيانات، هندسة البرمجيات أو أي مجال ذي صلة.