مجموعة بيانات بسيطة بتوزيع منتظم
rand() % 10000: توزيع منتظم لـ 10 آلاف مستخدمarrayElement(...): يختار عشوائيًا نوعًا واحدًا من ثلاثة أنواع أحداث- الطوابع الزمنية موزعة على مدى الساعات الأربع والعشرين الماضية
التوزيع الأُسّي
- طوابع زمنية موزعة بانتظام خلال فترة حديثة
randExponential(1/10)— معظم القيم قريبة من 0، مع إزاحة قدرها 15 كحد أدنى ([ClickHouse][1], [ClickHouse][2], [Atlantic.Net][3], [GitHub][4])
الأحداث الموزعة زمنيًا (Poisson)
- تبلغ الأحداث ذروتها قرابة الظهر، مع انحراف يتبع توزيع بواسون
التوزيع الطبيعي المتغيّر بمرور الوقت
- يتبع
usageموجة جيبية يومية + بعض العشوائية - القيم محصورة بين [0,100]
البيانات الفئوية وبيانات Nested
- طول عشوائي للمصفوفة بين 1 و3
- ثلاث درجات لكل مستخدم في كل اهتمام
إنشاء جداول عشوائية
generateRandomStructure مفيدة للغاية عند استخدامها مع محرك الجدول generateRandom لأغراض الاختبار، وقياس الأداء، أو إنشاء بيانات وهمية بمخططات عشوائية.
لنبدأ أولًا بإلقاء نظرة على شكل البنية العشوائية باستخدام الدالة generateRandomStructure:
DESCRIBE لمعرفة ما أنشأناه: