Jeu de données simple à distribution uniforme
rand() % 10000: distribution uniforme de 10 000 utilisateursarrayElement(...): sélectionne aléatoirement l’un des trois types d’événements- Horodatages répartis sur les 24 heures précédentes
Distribution exponentielle
- Horodatages uniformément répartis sur une période récente
randExponential(1/10)— la plupart des totaux sont proches de 0, avec un minimum fixé à 15 ([ClickHouse][1], [ClickHouse][2], [Atlantic.Net][3], [GitHub][4])
Événements répartis dans le temps (Poisson)
- Les événements culminent vers midi, avec une variation suivant une loi de Poisson
Distribution normale variant dans le temps
usagesuit une onde sinusoïdale diurne + une composante aléatoire- Valeurs bornées à [0,100]
Données catégorielles et imbriquées
- Longueur de tableau aléatoire comprise entre 1 et 3
- Trois scores par utilisateur pour chaque centre d’intérêt
Génération de tables aléatoires
generateRandomStructure est particulièrement utile lorsqu’elle est associée au moteur de table generateRandom pour les tests, le benchmarking ou la création de données fictives avec des schémas arbitraires.
Commençons simplement par voir à quoi ressemble une structure aléatoire à l’aide de la fonction generateRandomStructure :
DESCRIBE pour voir ce que nous avons créé :