| الإدخال | الإخراج | الاسم المستعار |
|---|---|---|
| ✔ | ✗ |
الوصف
Regex كل سطر من البيانات المستوردة وفقًا للتعبير النمطي المُحدَّد.
الاستخدام
يُطبَّق التعبير النمطي من إعداد format_regexp على كل سطر من البيانات المستوردة. ويجب أن يساوي عدد الأنماط الفرعية في التعبير النمطي عدد الأعمدة في مجموعة البيانات المستوردة.
يجب أن تكون أسطر البيانات المستوردة مفصولة بمحرف سطر جديد '\n' أو بمحرف سطر جديد بنمط DOS "\r\n".
يُحلَّل محتوى كل نمط فرعي مطابق باستخدام طريقة التحليل الخاصة بنوع البيانات المقابل، وفقًا لإعداد format_regexp_escaping_rule.
إذا لم يطابق التعبير النمطي السطر وكان format_regexp_skip_unmatched مضبوطًا على 1، فسيتم تخطي السطر بصمت. وإلا، يُطرَح استثناء.
مثال للاستخدام
data.tsv:
data.tsv
imp_regex_table:
Query
Query
SELECT البيانات من الجدول لمعرفة كيف حلّل تنسيق Regex البيانات من الملف:
Query
Response
إعدادات التنسيق
Regexp، يمكنك استخدام الإعدادات التالية:
-
format_regexp— String. يحتوي على تعبير نمطي بتنسيق re2. -
format_regexp_escaping_rule— String. قواعد الإفلات التالية مدعومة:- CSV (على غرار CSV
- JSON (على غرار JSONEachRow
- Escaped (على غرار TSV
- Quoted (على غرار Values
- Raw (يستخرج الأنماط الفرعية كاملةً، من دون قواعد إفلات، على غرار TSVRaw
-
format_regexp_skip_unmatched— UInt8. يحدد ما إذا كان ينبغي إطلاق استثناء إذا لم يطابق التعبيرformat_regexpالبيانات المستوردة. يمكن ضبطه على0أو1.