يقدّم هذا المستند مقدمة حول ترحيل البيانات من Amazon Redshift إلى ClickHouse.
المقدمة
ClickHouse vs Redshift
- يقوم Redshift بتجميع الشيفرة لكل خطة تنفيذ استعلام، مما يضيف عبئًا إضافيًا كبيرًا عند تنفيذ الاستعلام لأول مرة. ويمكن تبرير هذا العبء عندما تكون أنماط الاستعلامات متوقعة ويمكن تخزين خطط التنفيذ المجمّعة في ذاكرة تخزين مؤقت للاستعلامات. ومع ذلك، يطرح هذا تحديات أمام التطبيقات التفاعلية ذات الاستعلامات المتغيرة. وحتى عندما يتمكن Redshift من الاستفادة من ذاكرة التخزين المؤقت الخاصة بتجميع الشيفرة، يظل ClickHouse أسرع في معظم الاستعلامات. راجع “ClickBench”.
- يفرض Redshift حدًا أقصى للتزامن يبلغ 50 عبر جميع قوائم الانتظار، مما يجعله، رغم كفايته لذكاء الأعمال، غير مناسب للتطبيقات التحليلية عالية التزامن.
| Advantage | Description |
|---|---|
| زمن استجابة أقل للاستعلامات | يحقق ClickHouse زمن استجابة أقل للاستعلامات، بما في ذلك لأنماط الاستعلامات المتنوعة، في ظل التزامن العالي وأثناء عمليات insert المتدفقة. وحتى عندما لا يستفيد استعلامك من ذاكرة التخزين المؤقت، وهو أمر لا مفر منه في التحليلات التفاعلية الموجّهة للمستخدمين، يظل ClickHouse قادرًا على معالجته بسرعة. |
| حدود أعلى للاستعلامات المتزامنة | يفرض ClickHouse حدودًا أعلى بكثير على الاستعلامات المتزامنة، وهو أمر بالغ الأهمية لتجارب التطبيقات في الوقت الفعلي. في ClickHouse، سواء في النشر ذاتي الإدارة أو السحابي، يمكنك توسيع موارد المعالجة المخصصة لديك لتحقيق مستوى التزامن الذي يحتاجه تطبيقك لكل خدمة. ويكون مستوى تزامن الاستعلامات المسموح به قابلاً للتهيئة في ClickHouse، مع قيمة default في ClickHouse Cloud تبلغ 1000. |
| ضغط بيانات متفوق | يوفّر ClickHouse ضغط بيانات متفوقًا، مما يتيح لك تقليل إجمالي مساحة التخزين لديك (وبالتالي التكلفة) أو الاحتفاظ بمزيد من البيانات بالتكلفة نفسها واستخلاص المزيد من الرؤى الفورية من بياناتك. راجع “ClickHouse vs Redshift Storage Efficiency” أدناه. |