الانتقال إلى المحتوى الرئيسي
يقدّم هذا المستند مقدمة حول ترحيل البيانات من Amazon Redshift إلى ClickHouse.

المقدمة

Amazon Redshift هو مستودع بيانات سحابي يوفّر إمكانات إعداد التقارير والتحليلات للبيانات المنظَّمة وشبه المنظَّمة. وقد صُمّم للتعامل مع أعباء العمل التحليلية على مجموعات البيانات الضخمة بالاعتماد على مبادئ قواعد البيانات الموجَّهة بالأعمدة، على نحوٍ مشابه لـ ClickHouse. وبصفته جزءًا من عروض AWS، فهو غالبًا ما يكون الحل الافتراضي الذي يلجأ إليه مستخدمو AWS لتلبية احتياجاتهم من البيانات التحليلية. ورغم جاذبيته لمستخدمي AWS الحاليين بسبب تكامله الوثيق مع منظومة Amazon، فإن مستخدمي Redshift الذين يعتمدون عليه لتشغيل تطبيقات التحليلات في الوقت الفعلي يجدون أنفسهم بحاجة إلى حل أكثر كفاءةً لهذا الغرض. ونتيجةً لذلك، يتجهون بشكل متزايد إلى ClickHouse للاستفادة من أداء استعلامات أفضل وضغط بيانات أعلى، سواءً كبديل أو بوصفه “طبقة تسريع” تُنشر إلى جانب أعباء عمل Redshift الحالية.

ClickHouse vs Redshift

بالنسبة للمستخدمين الذين يعتمدون بشكل كبير على منظومة AWS، يُعدّ Redshift خيارًا طبيعيًا عند وجود احتياجات تتعلق بمستودعات البيانات. ويختلف Redshift عن ClickHouse في هذه الناحية المهمة، إذ يُحسِّن محركه لأعباء عمل مستودعات البيانات التي تتطلب تقارير معقدة واستعلامات تحليلية. وعبر جميع أوضاع النشر، تجعل القيود التالية استخدام Redshift لأعباء العمل التحليلية في الوقت الفعلي أمرًا صعبًا:
  • يقوم Redshift بتجميع الشيفرة لكل خطة تنفيذ استعلام، مما يضيف عبئًا إضافيًا كبيرًا عند تنفيذ الاستعلام لأول مرة. ويمكن تبرير هذا العبء عندما تكون أنماط الاستعلامات متوقعة ويمكن تخزين خطط التنفيذ المجمّعة في ذاكرة تخزين مؤقت للاستعلامات. ومع ذلك، يطرح هذا تحديات أمام التطبيقات التفاعلية ذات الاستعلامات المتغيرة. وحتى عندما يتمكن Redshift من الاستفادة من ذاكرة التخزين المؤقت الخاصة بتجميع الشيفرة، يظل ClickHouse أسرع في معظم الاستعلامات. راجع “ClickBench”.
  • يفرض Redshift حدًا أقصى للتزامن يبلغ 50 عبر جميع قوائم الانتظار، مما يجعله، رغم كفايته لذكاء الأعمال، غير مناسب للتطبيقات التحليلية عالية التزامن.
في المقابل، وبينما يمكن أيضًا استخدام ClickHouse للاستعلامات التحليلية المعقدة، فهو مُحسَّن لأعباء العمل التحليلية في الوقت الفعلي، سواء لتشغيل التطبيقات أو للعمل لاحقًا كمسرّع لمستودع البيانات. ونتيجةً لذلك، يعمد مستخدمو Redshift عادةً إلى استبدال Redshift بـ ClickHouse أو تعزيزه به للأسباب التالية:
AdvantageDescription
زمن استجابة أقل للاستعلاماتيحقق ClickHouse زمن استجابة أقل للاستعلامات، بما في ذلك لأنماط الاستعلامات المتنوعة، في ظل التزامن العالي وأثناء عمليات insert المتدفقة. وحتى عندما لا يستفيد استعلامك من ذاكرة التخزين المؤقت، وهو أمر لا مفر منه في التحليلات التفاعلية الموجّهة للمستخدمين، يظل ClickHouse قادرًا على معالجته بسرعة.
حدود أعلى للاستعلامات المتزامنةيفرض ClickHouse حدودًا أعلى بكثير على الاستعلامات المتزامنة، وهو أمر بالغ الأهمية لتجارب التطبيقات في الوقت الفعلي. في ClickHouse، سواء في النشر ذاتي الإدارة أو السحابي، يمكنك توسيع موارد المعالجة المخصصة لديك لتحقيق مستوى التزامن الذي يحتاجه تطبيقك لكل خدمة. ويكون مستوى تزامن الاستعلامات المسموح به قابلاً للتهيئة في ClickHouse، مع قيمة default في ClickHouse Cloud تبلغ 1000.
ضغط بيانات متفوقيوفّر ClickHouse ضغط بيانات متفوقًا، مما يتيح لك تقليل إجمالي مساحة التخزين لديك (وبالتالي التكلفة) أو الاحتفاظ بمزيد من البيانات بالتكلفة نفسها واستخلاص المزيد من الرؤى الفورية من بياناتك. راجع “ClickHouse vs Redshift Storage Efficiency” أدناه.
آخر تعديل في ٢٩ يونيو ٢٠٢٦