| Entrée | Sortie | Alias |
|---|---|---|
| ✔ | ✗ |
Description
Regex analyse chaque ligne des données importées selon l’expression régulière fournie.
Utilisation
L’expression régulière définie par le paramètre format_regexp est appliquée à chaque ligne des données importées. Le nombre de sous-motifs dans l’expression régulière doit être égal au nombre de colonnes du jeu de données importé.
Les lignes des données importées doivent être séparées par le caractère de nouvelle ligne '\n' ou par un saut de ligne de style DOS "\r\n".
Le contenu de chaque sous-motif correspondant est analysé selon la méthode du type de données correspondant, conformément au paramètre format_regexp_escaping_rule.
Si l’expression régulière ne correspond pas à la ligne et que format_regexp_skip_unmatched est défini sur 1, la ligne est simplement ignorée. Sinon, une exception est levée.
Exemple d’utilisation
data.tsv :
data.tsv
imp_regex_table :
Query
Query
SELECT les données de la table pour voir comment le format Regex a interprété les données du fichier :
Query
Response
Paramètres du format
Regexp, vous pouvez utiliser les paramètres suivants :
-
format_regexp— String. Contient une expression régulière au format re2. -
format_regexp_escaping_rule— String. Les règles d’échappement suivantes sont prises en charge :- CSV (similaire à CSV
- JSON (similaire à JSONEachRow
- Escaped (similaire à TSV
- Quoted (similaire à Values
- Raw (extrait les sous-motifs dans leur intégralité, sans règle d’échappement, similaire à TSVRaw
-
format_regexp_skip_unmatched— UInt8. Définit s’il faut lever une exception lorsque l’expressionformat_regexpne correspond pas aux données importées. Peut être défini sur0ou1.