الانتقال إلى المحتوى الرئيسي

range_hashed

يُخزَّن القاموس في الذاكرة على شكل جدول تجزئة يتضمن مصفوفة مرتبة من النطاقات والقيم المقابلة لها. تعمل طريقة التخزين هذه بالطريقة نفسها التي تعمل بها hashed، وتتيح استخدام نطاقات التاريخ/الوقت (أي نوع رقمي) بالإضافة إلى المفتاح. مثال: يحتوي الجدول على خصومات لكل مُعلِن بالتنسيق التالي:
┌─advertiser_id─┬─discount_start_date─┬─discount_end_date─┬─amount─┐
│           123 │          2015-01-16 │        2015-01-31 │   0.25 │
│           123 │          2015-01-01 │        2015-01-15 │   0.15 │
│           456 │          2015-01-01 │        2015-01-15 │   0.05 │
└───────────────┴─────────────────────┴───────────────────┴────────┘
لاستخدام عيّنة مع نطاقات التاريخ، حدِّد العنصرين range_min وrange_max في البنية. يجب أن يحتوي هذان العنصران على name وtype (إذا لم يتم تحديد type، فسيُستخدم النوع الافتراضي - Date). ويمكن أن يكون type أي نوع رقمي (Date / DateTime / UInt64 / Int32 / غيرها).
يجب أن تلائم قيمتا range_min وrange_max النوع Int64.
مثال:
CREATE DICTIONARY discounts_dict (
    advertiser_id UInt64,
    discount_start_date Date,
    discount_end_date Date,
    amount Float64
)
PRIMARY KEY id
SOURCE(CLICKHOUSE(TABLE 'discounts'))
LIFETIME(MIN 1 MAX 1000)
LAYOUT(RANGE_HASHED(range_lookup_strategy 'max'))
RANGE(MIN discount_start_date MAX discount_end_date)

للعمل مع هذه القواميس، تحتاج إلى تمرير وسيطة إضافية إلى الدالة dictGet يُختار النطاق على أساسها:
dictGet('dict_name', 'attr_name', id, date)
مثال على الاستعلام:
SELECT dictGet('discounts_dict', 'amount', 1, '2022-10-20'::Date);
تُرجع هذه الدالة القيمة الخاصة بـ id المحددة ونطاق التاريخ الذي يشمل التاريخ المُمرَّر. تفاصيل الخوارزمية:
  • إذا لم يتم العثور على id، أو لم يتم العثور على نطاق لهذا id، فإنها تُرجع القيمة الافتراضية لنوع السمة.
  • إذا كانت هناك نطاقات متداخلة وكان range_lookup_strategy=min، فإنها تُرجع نطاقًا مطابقًا بأصغر range_min، وإذا عُثر على عدة نطاقات، فإنها تُرجع نطاقًا بأصغر range_max، وإذا عُثر مرة أخرى على عدة نطاقات (أي كانت عدة نطاقات لها range_min وrange_max نفسيهما)، فإنها تُرجع نطاقًا عشوائيًا منها.
  • إذا كانت هناك نطاقات متداخلة وكان range_lookup_strategy=max، فإنها تُرجع نطاقًا مطابقًا بأكبر range_min، وإذا عُثر على عدة نطاقات، فإنها تُرجع نطاقًا بأكبر range_max، وإذا عُثر مرة أخرى على عدة نطاقات (أي كانت عدة نطاقات لها range_min وrange_max نفسيهما)، فإنها تُرجع نطاقًا عشوائيًا منها.
  • إذا كانت قيمة range_max هي NULL، فسيكون النطاق مفتوحًا. وتُعامَل NULL على أنها أكبر قيمة ممكنة. ويمكن استخدام 1970-01-01 أو 0 (-MAX_INT) مع range_min باعتبارها القيمة المفتوحة.
مثال على الإعداد:
CREATE DICTIONARY somedict(
    Abcdef UInt64,
    StartTimeStamp UInt64,
    EndTimeStamp UInt64,
    XXXType String DEFAULT ''
)
PRIMARY KEY Abcdef
RANGE(MIN StartTimeStamp MAX EndTimeStamp)

مثال على التهيئة مع نطاقات متداخلة ونطاقات مفتوحة:
CREATE TABLE discounts
(
    advertiser_id UInt64,
    discount_start_date Date,
    discount_end_date Nullable(Date),
    amount Float64
)
ENGINE = Memory;

INSERT INTO discounts VALUES (1, '2015-01-01', Null, 0.1);
INSERT INTO discounts VALUES (1, '2015-01-15', Null, 0.2);
INSERT INTO discounts VALUES (2, '2015-01-01', '2015-01-15', 0.3);
INSERT INTO discounts VALUES (2, '2015-01-04', '2015-01-10', 0.4);
INSERT INTO discounts VALUES (3, '1970-01-01', '2015-01-15', 0.5);
INSERT INTO discounts VALUES (3, '1970-01-01', '2015-01-10', 0.6);

SELECT * FROM discounts ORDER BY advertiser_id, discount_start_date;
┌─advertiser_id─┬─discount_start_date─┬─discount_end_date─┬─amount─┐
12015-01-01 │              ᴺᵁᴸᴸ │    0.1
12015-01-15 │              ᴺᵁᴸᴸ │    0.2
22015-01-012015-01-150.3
22015-01-042015-01-100.4
31970-01-012015-01-150.5
31970-01-012015-01-100.6
└───────────────┴─────────────────────┴───────────────────┴────────┘

-- RANGE_LOOKUP_STRATEGY 'max'

CREATE DICTIONARY discounts_dict
(
    advertiser_id UInt64,
    discount_start_date Date,
    discount_end_date Nullable(Date),
    amount Float64
)
PRIMARY KEY advertiser_id
SOURCE(CLICKHOUSE(TABLE discounts))
LIFETIME(MIN 600 MAX 900)
LAYOUT(RANGE_HASHED(RANGE_LOOKUP_STRATEGY 'max'))
RANGE(MIN discount_start_date MAX discount_end_date);

select dictGet('discounts_dict', 'amount', 1, toDate('2015-01-14')) res;
┌─res─┐
0.1-- the only one range is matching: 2015-01-01 - Null
└─────┘

select dictGet('discounts_dict', 'amount', 1, toDate('2015-01-16')) res;
┌─res─┐
0.2-- two ranges are matching, range_min 2015-01-15 (0.2) is bigger than 2015-01-01 (0.1)
└─────┘

select dictGet('discounts_dict', 'amount', 2, toDate('2015-01-06')) res;
┌─res─┐
0.4-- two ranges are matching, range_min 2015-01-04 (0.4) is bigger than 2015-01-01 (0.3)
└─────┘

select dictGet('discounts_dict', 'amount', 3, toDate('2015-01-01')) res;
┌─res─┐
0.5-- two ranges are matching, range_min are equal, 2015-01-15 (0.5) is bigger than 2015-01-10 (0.6)
└─────┘

DROP DICTIONARY discounts_dict;

-- RANGE_LOOKUP_STRATEGY 'min'

CREATE DICTIONARY discounts_dict
(
    advertiser_id UInt64,
    discount_start_date Date,
    discount_end_date Nullable(Date),
    amount Float64
)
PRIMARY KEY advertiser_id
SOURCE(CLICKHOUSE(TABLE discounts))
LIFETIME(MIN 600 MAX 900)
LAYOUT(RANGE_HASHED(RANGE_LOOKUP_STRATEGY 'min'))
RANGE(MIN discount_start_date MAX discount_end_date);

select dictGet('discounts_dict', 'amount', 1, toDate('2015-01-14')) res;
┌─res─┐
0.1-- the only one range is matching: 2015-01-01 - Null
└─────┘

select dictGet('discounts_dict', 'amount', 1, toDate('2015-01-16')) res;
┌─res─┐
0.1-- two ranges are matching, range_min 2015-01-01 (0.1) is less than 2015-01-15 (0.2)
└─────┘

select dictGet('discounts_dict', 'amount', 2, toDate('2015-01-06')) res;
┌─res─┐
0.3-- two ranges are matching, range_min 2015-01-01 (0.3) is less than 2015-01-04 (0.4)
└─────┘

select dictGet('discounts_dict', 'amount', 3, toDate('2015-01-01')) res;
┌─res─┐
0.6-- two ranges are matching, range_min are equal, 2015-01-10 (0.6) is less than 2015-01-15 (0.5)
└─────┘

complex_key_range_hashed

يُخزَّن القاموس في الذاكرة على هيئة جدول تجزئة مع مصفوفة مرتبة من النطاقات والقيم المقابلة لها (انظر range_hashed). يُستخدم هذا النوع من التخزين مع المفاتيح المركبة. مثال على التهيئة:
CREATE DICTIONARY range_dictionary
(
  CountryID UInt64,
  CountryKey String,
  StartDate Date,
  EndDate Date,
  Tax Float64 DEFAULT 0.2
)
PRIMARY KEY CountryID, CountryKey
SOURCE(CLICKHOUSE(TABLE 'date_table'))
LIFETIME(MIN 1 MAX 1000)
LAYOUT(COMPLEX_KEY_RANGE_HASHED())
RANGE(MIN StartDate MAX EndDate);
آخر تعديل في ٢٩ يونيو ٢٠٢٦