الانتقال إلى المحتوى الرئيسي

دالة الجدول paimon

يوفّر واجهة شبيهة بالجدول للقراءة فقط لجداول Apache Paimon المخزّنة في Amazon S3 أو Azure أو HDFS أو محليًا.

الصياغة

paimon(url [,access_key_id, secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

paimonS3(url [,access_key_id, secret_access_key] [,format] [,structure] [,compression] [,extra_credentials])

paimonAzure(connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])

paimonHDFS(path_to_table, [,format] [,compression_method])

paimonLocal(path_to_table, [,format] [,compression_method])

المعاملات

يتوافق وصف المعاملات هنا مع وصف المعاملات في دوال الجداول s3 وazureBlobStorage وHDFS وfile، كلٌّ بحسب ما يقابله. ويشير format إلى تنسيق ملفات البيانات في جدول Paimon. بالنسبة إلى paimonS3، يمكن استخدام المعلَمة الاختيارية extra_credentials لتمرير role_arn من أجل الوصول المستند إلى الأدوار في ClickHouse Cloud. راجع Secure S3 للاطلاع على خطوات الإعداد.

القيمة المعادة

جدول ذو بنية محددة لقراءة البيانات من جدول Paimon المحدد.

تعريف مجموعة مسماة

فيما يلي مثال على تهيئة مجموعة مسماة لتخزين عنوان URL وبيانات الاعتماد:
<clickhouse>
    <named_collections>
        <paimon_conf>
            <url>http://test.s3.amazonaws.com/clickhouse-bucket/</url>
            <access_key_id>test</access_key_id>
            <secret_access_key>test</secret_access_key>
            <format>auto</format>
            <structure>auto</structure>
        </paimon_conf>
    </named_collections>
</clickhouse>
SELECT * FROM paimonS3(paimon_conf, filename = 'test_table')
DESCRIBE paimonS3(paimon_conf, filename = 'test_table')

الأسماء المستعارة

أصبحت دالة الجدول paimon الآن اسمًا مستعارًا لـ paimonS3.

الأعمدة الافتراضية

  • _path — مسار الملف. النوع: LowCardinality(String).
  • _file — اسم الملف. النوع: LowCardinality(String).
  • _size — حجم الملف بالبايت. النوع: Nullable(UInt64). إذا كان حجم الملف غير معروف، فستكون القيمة NULL.
  • _time — وقت آخر تعديل للملف. النوع: Nullable(DateTime). إذا كان الوقت غير معروف، فستكون القيمة NULL.
  • _etag — قيمة etag للملف. النوع: LowCardinality(String). إذا كانت قيمة etag غير معروفة، فستكون القيمة NULL.

أنواع البيانات المدعومة

نوع بيانات Paimonنوع البيانات في ClickHouse
BOOLEANInt8
TINYINTInt8
SMALLINTInt16
INTEGERInt32
BIGINTInt64
FLOATFloat32
DOUBLEFloat64
STRING,VARCHAR,BYTES,VARBINARYString
DATEDate
TIME(p),TIMETime(‘UTC’)
TIMESTAMP(p) WITH LOCAL TIME ZONEDateTime64
TIMESTAMP(p)DateTime64(‘UTC’)
CHARFixedString(1)
BINARY(n)FixedString(n)
DECIMAL(P,S)Decimal(P,S)
ARRAYArray
MAPMap

التقسيم المدعوم

أنواع البيانات المدعومة ضمن مفاتيح التقسيم في Paimon:
  • CHAR
  • VARCHAR
  • BOOLEAN
  • DECIMAL
  • TINYINT
  • SMALLINT
  • INTEGER
  • DATE
  • TIME
  • TIMESTAMP
  • TIMESTAMP WITH LOCAL TIME ZONE
  • BIGINT
  • FLOAT
  • DOUBLE

راجع أيضًا

آخر تعديل في ٢٥ يونيو ٢٠٢٦