قيمة hash لـ NULL هي NULL. للحصول على قيمة hash غير NULL لعمود من النوع Nullable، لفّه داخل tuple:
لحساب قيمة hash لكامل محتويات table، استخدم
sum(cityHash64(tuple(*))) (أو أي دالة hash أخرى). تضمن tuple عدم تخطي الصفوف التي تحتوي على قيم NULL. وتضمن sum ألّا يؤثر ترتيب الصفوف.BLAKE3
message— سلسلة الإدخال المطلوب تجزئتها.String
FixedString(32)
أمثلة
hash
Query
Response
MD4
s— سلسلة الإدخال المطلوب حساب قيمة hash لها.String
FixedString(16)
أمثلة
مثال على الاستخدام
Query
Response
MD5
s— سلسلة الإدخال النصية المطلوب تجزئتها.String
FixedString(16)
أمثلة
مثال على الاستخدام
Query
Response
RIPEMD160
s— سلسلة الإدخال المطلوب تجزئتها.String
FixedString(20)
أمثلة
مثال على الاستخدام
Query
Response
SHA1
s— سلسلة الإدخال النصية المراد تجزئتهاString
FixedString(20)
أمثلة
مثال على الاستخدام
Query
Response
SHA224
s— قيمة الإدخال المراد تجزئتها.String
FixedString(28)
أمثلة
مثال على الاستخدام
Query
Response
SHA256
s— سلسلة الإدخال المطلوب تجزئتها.String
FixedString(32)
أمثلة
مثال على الاستخدام
Query
Response
SHA384
s— سلسلة الإدخال المطلوب تجزئتها.String
FixedString(48)
أمثلة
مثال على الاستخدام
Query
Response
SHA512
s— سلسلة الإدخال المطلوب تطبيق دالة التجزئة عليهاString
FixedString(64)
أمثلة
مثال على الاستخدام
Query
Response
SHA512_256
s— سلسلة الإدخال المطلوب تجزئتها.String
FixedString(32)
أمثلة
مثال على الاستخدام
Query
Response
URLHash
| الوضع | الوصف |
|---|---|
URLHash(url) | تحسب قيمة hash لسلسلة نصية بعد إزالة أحد الرموز الختامية / أو ? أو # من النهاية، إذا كان موجودًا. |
URLHash(url, N) | تحسب قيمة hash لسلسلة نصية حتى المستوى N في التسلسل الهرمي لـ URL، بعد إزالة أحد الرموز الختامية / أو ? أو # من النهاية، إذا كان موجودًا. المستويات هي نفسها كما في URLHierarchy. |
url. UInt64
أمثلة
مثال على الاستخدام
Query
Response
Query
Response
cityHash64
غيّرت Google خوارزمية CityHash بعد إضافتها إلى ClickHouse.
وبعبارة أخرى، ينتج cityHash64 في ClickHouse وCityHash الأصلي من Google الآن نتائج مختلفة.
يتوافق cityHash64 في ClickHouse مع CityHash v1.0.2.
قد تتساوى قيم التجزئة المحسوبة لقيم الإدخال نفسها رغم اختلاف أنواع المعاملات.
وينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّاة وغير المسمّاة التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغيّر من وسائط الإدخال المطلوب حساب قيمة التجزئة لها.Any
UInt64
أمثلة
مثال على الاستدعاء
Query
Response
Query
Response
farmFingerprint64
Fingerprint64.
قد تتطابق قيم hash المحسوبة لقيم الإدخال نفسها رغم اختلاف أنواع الوسائط.
وينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّاة وغير المسمّاة التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغيّر من وسيطات الإدخال المطلوب حساب قيمة التجزئة لها.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
farmHash64
Hash64.
قد تتطابق قيم التجزئة المحسوبة لقيم الإدخال نفسها حتى مع اختلاف أنواع الوسيطات.
وينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّاة وغير المسمّاة التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغيّر من وسيطات الإدخال المراد حساب قيمة التجزئة لها.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
gccMurmurHash
arg1[, arg2, ...]— عدد متغير من المعاملات المطلوب حساب قيمة التجزئة لها.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
halfMD5
sipHash64 بدلًا منها.
تأخذ الدالة عددًا متغيرًا من معلمات الإدخال.
يمكن أن تكون الوسائط من أي من أنواع البيانات المدعومة.
بالنسبة إلى بعض أنواع البيانات، قد تتطابق القيمة المحسوبة لدالة الهاش للقيم نفسها حتى إذا اختلفت أنواع الوسائط (الأعداد الصحيحة ذات الأحجام المختلفة، وTuple المسمّاة وغير المسمّاة التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل الذي يحتوي على البيانات نفسها).
الصياغة
arg1[, arg2, ..., argN]— عدد متغيّر من الوسائط المطلوب حساب قيمة التجزئة لها.Any
UInt64 بترتيب البايتات big-endian. UInt64
أمثلة
مثال على الاستخدام
Query
Response
hiveHash
JavaHash مع تصفير بتات الإشارة.
تُستخدم هذه الدالة في Apache Hive للإصدارات السابقة لـ 3.0.
الصياغة
arg— سلسلة الإدخال المراد حساب hash لها.String
Int32
أمثلة
مثال على الاستخدام
Query
Response
icebergHash
value— القيمة المصدر المطلوب حساب تجزئتها من النوعIntegerأوBoolأوDecimalأوFloat*أوStringأوFixedStringأوUUIDأوDateأوTimeأوDateTime
Int32
أمثلة
مثال
Query
Response
intHash32
arg— عدد صحيح يُراد تجزئته.(U)Int*
UInt32
أمثلة
مثال على الاستخدام
Query
Response
intHash64
intHash32)، لكنها ليست دالة hash تشفيرية.
الصياغة
int— عدد صحيح لإجراء التجزئة عليه.(U)Int*
UInt64
أمثلة
مثال على الاستخدام
Query
Response
javaHash
لا تدعم Java سوى حساب hash للأعداد الصحيحة الموقعة،
لذا إذا أردت حساب hash للأعداد الصحيحة غير الموقعة، فيجب تحويلها إلى أنواع ClickHouse الموقعة المناسبة.
arg— قيمة الإدخال المطلوب تجزئتها.Any
arg Int32
أمثلة
مثال استخدام 1
Query
Response
Query
Response
javaHashUTF16LE
arg— سلسلة بترميز UTF-16LE.String
Int32
أمثلة
مثال استخدام
Query
Response
jumpConsistentHash
Int32
أمثلة
مثال على الاستخدام
Query
Response
kafkaMurmurHash
seed المستخدم في Kafka، ومن دون أعلى بت، ليكون متوافقًا مع Default Partitioner.
الصيغة
arg1[, arg2, ...]— عدد متغيّر من المعاملات المطلوب حساب قيمة التجزئة لها.Any
UInt32
أمثلة
مثال على الاستخدام
Query
Response
keccak256
message— سلسلة الإدخال المطلوب حساب hash لها.String
FixedString(32)
أمثلة
مثال استخدام
Query
Response
kostikConsistentHash
n <= 32768.
الصياغة
yandexConsistentHash
المعاملات
القيمة المُعادة
يعيد قيمة التجزئة المحسوبة. UInt16
أمثلة
مثال على الاستخدام
Query
Response
metroHash64
قد تتطابق قيم hash المحسوبة لقيم الإدخال نفسها حتى مع اختلاف أنواع argument.
وينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّى وغير المسمّى الذي يحتوي على البيانات نفسها، وMap والنوع المناظر له Array(Tuple(key, value)) الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغير من وسيطات الإدخال المراد حساب قيمة التجزئة لها.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
murmurHash2_32
قد تتطابق قيم التجزئة المحسوبة لقيم الإدخال نفسها رغم اختلاف أنواع المعاملات.
ينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّاة وغير المسمّاة التي تحتوي على البيانات نفسها، وMap والنوع المقابل Array(Tuple(key, value)) الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغيّر من وسيطات الإدخال المطلوب حساب قيمة التجزئة لها.Any
UInt32
أمثلة
مثال على الاستخدام
Query
Response
murmurHash2_64
قد تتطابق قيم التجزئة المحسوبة لقيم الإدخال نفسها رغم اختلاف أنواع الوسيطات.
وينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّى وغير المسمّى التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل له الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغير من وسيطات الإدخال التي تُحسب لها قيمة التجزئة.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
murmurHash3_128
arg1[, arg2, ...]— عدد متغيّر من وسائط الإدخال المطلوب حساب قيمة التجزئة لها.Any
MurmurHash3 المحسوبة بطول 128 بت لوسائط الإدخال. FixedString(16)
أمثلة
مثال للاستخدام
Query
Response
murmurHash3_32
قد تتطابق قيم التجزئة المحسوبة لقيم الإدخال نفسها مع أنواع وسيطات مختلفة.
وينطبق ذلك، على سبيل المثال، على أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّاة وغير المسمّاة التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغيّر من وسائط الإدخال التي تُحسب لها قيمة التجزئة.Any
UInt32
أمثلة
مثال على الاستخدام
Query
Response
murmurHash3_64
قد تتساوى قيم التجزئة المحسوبة لقيم الإدخال نفسها لأنواع وسائط مختلفة.
يؤثر هذا، على سبيل المثال، في أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّى وغير المسمّى التي تحتوي على البيانات نفسها، وMap ونوع Array(Tuple(key, value)) المقابل الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغير من وسيطات الإدخال التي تُحسب لها قيمة التجزئة.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHash
ngramsize رموز، وتحسب قيم hash لكل n-gram، ثم تُرجع tuple يحتوي على هذه القيم.
وتستخدم hashnum من أصغر قيم hash لحساب أقل hash، وhashnum من أكبر قيم hash لحساب أكبر hash.
وهي تراعي حالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
وبالنسبة إلى سلسلتين، إذا كانت قيم hash المُرجعة متطابقة في كلتيهما، فإن هاتين السلسلتين متطابقتان.
الصياغة
string— السلسلة النصية التي تُحسب لها قيمةhash.Stringngramsize— اختياري. حجمn-gram، وأي قيمة من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالدنيا والعليا المستخدمة لحساب النتيجة، وأي قيمة من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple تحتوي على قيمتي hash — الصغرى والكبرى. Tuple
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashArg
ngramsize رمزًا، ويُرجع n-grams ذات أصغر وأكبر قيم hash، كما تحسبها الدالة ngramMinHash للمدخل نفسه.
وهي حساسة لحالة الأحرف.
البنية
string— السلسلة المراد حساب قيمة التجزئة لها.Stringngramsize— اختياري. حجمn-gram، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم التجزئة الدنيا والعليا المستخدمة لحساب النتيجة، أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
hashnum من n-grams. Tuple(String)
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashArgCaseInsensitive
ngramsize رموز، وتُرجِع قيم n-grams ذات أصغر وأكبر hash كما تحسبها الدالة ngramMinHashCaseInsensitive للمدخل نفسه.
وهي غير حساسة لحالة الأحرف.
البنية
string— سلسلة نصية يُراد حساب قيمةhashلها.Stringngramsize— اختياري. حجمn-gram، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالصغرى والكبرى المستخدمة لحساب النتيجة، أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple تحتوي على قيمتين من النوع Tuple، في كلٍّ منهما hashnum من n-grams. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashArgCaseInsensitiveUTF8
ngramsize رمزًا، وتُرجع مقاطع n-gram ذات قيم hash الصغرى والكبرى، كما تحسبها الدالة ngramMinHashCaseInsensitiveUTF8 باستخدام المُدخل نفسه.
وهي غير حساسة لحالة الأحرف.
الصيغة
string— سلسلة نصية يُراد حساب قيمة التجزئة لها.Stringngramsize— اختياري. حجمn-gram، ويمكن أن يكون أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم التجزئة الصغرى والكبرى المستخدمة لحساب النتيجة، ويمكن أن يكون أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
hashnum من n-grams. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashArgUTF8
ngramsize رمزًا، ويُرجع قيم n-grams ذات أدنى وأعلى hash، كما تحسبها الدالة ngramMinHashUTF8 للإدخال نفسه.
وهي حساسة لحالة الأحرف.
البنية
string— السلسلة النصية التي سيتم حساب قيمة التجزئة لها.Stringngramsize— اختياري. حجمn-gram، ويمكن أن يكون أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم التجزئة الصغرى والكبرى المستخدمة لحساب النتيجة، ويمكن أن يكون أي رقم من1إلى25. القيمة الافتراضية هي6.UInt8
hashnum من n-grams. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashCaseInsensitive
ngramsize رموز، وتحسب قيم hash لكل n-gram، وتُرجع Tuple بهذه الـ hashes.
وتستخدم hashnum من أقل قيم hash لحساب أدنى hash، وhashnum من أكبر قيم hash لحساب أقصى hash.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
بالنسبة إلى سلسلتين، إذا كانت الـ hashes المُعادة متطابقة في كلتا السلسلتين، فهذا يعني أن السلسلتين متطابقتان.
الصياغة
string— سلسلة نصية. String. -ngramsize— حجم الـ n-gram. اختياري. القيم الممكنة: أي رقم من1إلى25. القيمة الافتراضية:3. UInt8. -hashnum— عدد قيمتي hash الصغرى والكبرى المستخدمتين لحساب النتيجة. اختياري. القيم الممكنة: أي رقم من1إلى25. القيمة الافتراضية:6. UInt8.
Tuple
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashCaseInsensitiveUTF8
ngramsize رموز، وتحسب قيم hash لكل n-gram، ثم تُرجع Tuple تحتوي على هذه الـ hashes.
وتستخدم hashnum من أصغر قيم hash لحساب الحد الأدنى للـ hash، وhashnum من أكبر قيم hash لحساب الحد الأقصى للـ hash.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
وبالنسبة إلى سلسلتين، إذا كانت الـ hashes المُعادة متطابقة في كلتا السلسلتين، فإن هاتين السلسلتين متطابقتان.
البنية
string— سلسلة نصية يُحسَب لها hash.Stringngramsize— اختياري. حجمn-gram، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم hash الصغرى والكبرى المستخدمة لحساب النتيجة، أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple تحتوي على قيمتي hash — الصغرى والكبرى.
أمثلة
مثال على الاستخدام
Query
Response
ngramMinHashUTF8
ngramsize رمزًا، وتحسب قيم hash لكل n-gram، ثم تُرجع tuple تحتوي على هذه الـhashes.
وتستخدم hashnum من أصغر قيم hash لحساب أقل hash، وhashnum من أكبر قيم hash لحساب أكبر hash.
وهي حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
وبالنسبة إلى سلسلتين، إذا كانت الـhashes المُرجعة متطابقة في كلتا السلسلتين، فإن هاتين السلسلتين تكونان متطابقتين.
البنية
string— السلسلة النصية المطلوب حسابhashلها.Stringngramsize— اختياري. حجمn-gram، وأي قيمة من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالصغرى والكبرى المستخدمة لحساب النتيجة، وأي قيمة من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple تحتوي على قيمتي hash — الصغرى والكبرى. Tuple
أمثلة
مثال استخدام
Query
Response
ngramSimHash
ngramsize رمزًا، وتُرجع قيمة simhash الخاصة بـ n-gram.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام bitHammingDistance.
وكلما كانت مسافة هامينغ بين قيم simhashes المحسوبة لسلسلتين أصغر، زاد احتمال أن تكون هاتان السلسلتان متماثلتين.
البنية
string— سلسلة نصية يُحسَب لهاsimhashمع مراعاة حالة الأحرف.Stringngramsize— اختياري. حجمn-gram، وأي قيمة من1إلى25. القيمة الافتراضية هي3.UInt8
hash المحسوب لسلسلة الإدخال. UInt64
أمثلة
مثال على الاستخدام
Query
Response
ngramSimHashCaseInsensitive
ngramsize رموز وتُرجع قيمة simhash الخاصة بها.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام bitHammingDistance.
وكلما صغرت مسافة هامنغ لقيم simhashes المحسوبة لسلسلتين، زاد احتمال أن تكون هاتان السلسلتان متماثلتين.
البنية
string— السلسلة النصية التي يُحسب لهاsimhashغير الحساس لحالة الأحرف.Stringngramsize— اختياري. حجمn-gram، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8
UInt64
أمثلة
مثال على الاستخدام
Query
Response
ngramSimHashCaseInsensitiveUTF8
ngramsize وتُرجع simhash الخاص بـ n-gram.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المكررة باستخدام bitHammingDistance. وكلما صغرت مسافة Hamming بين قيم simhashes المحسوبة لسلسلتين، زاد احتمال أن تكونا متطابقتين.
الصياغة
string— السلسلة النصية المراد حساب قيمة التجزئة لها.Stringngramsize— اختياري. حجمn-gram، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8
UInt64
أمثلة
مثال على الاستخدام
Query
Response
ngramSimHashUTF8
ngramsize رمزًا، ويُرجع simhash الخاص بها.
وهو حساس لحالة الأحرف.
يمكن استخدامه لاكتشاف السلاسل شبه المكررة باستخدام bitHammingDistance.
وكلما صغرت مسافة هامينغ بين قيم simhash المحسوبة لسلسلتين، زادت احتمالية أن تكونا متماثلتين.
البنية
string— سلسلة نصية يُحسب لهاhash.Stringngramsize— اختياري. حجمn-gram، وهو أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8
hash المحسوبة. UInt64
أمثلة
مثال على الاستخدام
Query
Response
sipHash128
sipHash64، لكنه يُنتج قيمة hash بطول 128 بت، أي إن حالة xor-folding النهائية تُحسب حتى 128 بت.
الصيغة
arg1[, arg2, ...]— عدد متغيّر من وسيطات الإدخال التي تُحسَب لها قيمة التجزئة.Any
SipHash بطول 128 بت. FixedString(16)
أمثلة
مثال على الاستخدام
Query
Response
sipHash128Keyed
sipHash128، لكنه يأخذ أيضًا وسيطة مفتاح محددة صراحةً بدلًا من استخدام مفتاح ثابت.
الصيغة
(k0, k1)— زوج مرتب من قيمتَي UInt64 يمثّل المفتاح.Tuple(UInt64, UInt64)arg1[, arg2, ...]— عدد متغيّر من وسائط الإدخال التي تُحسب لها قيمة التجزئة.Any
SipHash بطول 128 بت من النوع FixedString(16). FixedString(16)
أمثلة
مثال على الاستخدام
Query
Response
sipHash128Reference
sipHash128، لكنه يطبّق خوارزمية 128 بت الخاصة بالمؤلفين الأصليين لـ SipHash.
الصياغة
arg1[, arg2, ...]— عدد متغيّر من معاملات الإدخال التي تُحسب لها قيمة التجزئة.Any
SipHash محسوبة بطول 128 بت لمعاملات الإدخال. FixedString(16)
أمثلة
مثال على الاستخدام
Query
Response
sipHash128ReferenceKeyed
sipHash128Reference، لكنها تأخذ أيضًا وسيطة مفتاح صريحة بدلًا من استخدام مفتاح ثابت.
البنية
(k0, k1)—Tupleمن قيمتين تمثلان المفتاحTuple(UInt64, UInt64)arg1[, arg2, ...]— عدد متغير من معاملات الإدخال المطلوب حساب التجزئة لها.Any
SipHash المحسوبة بطول 128 بت لمعاملات الإدخال. FixedString(16)
أمثلة
مثال على الاستخدام
Query
Response
sipHash64
MD5.
تتعامل الدالة interprets مع جميع معلمات الإدخال على أنها سلاسل نصية، وتحسب قيمة تجزئة لكل واحدة منها.
ثم تدمج قيم التجزئة باستخدام الخوارزمية التالية:
- تُدمَج قيمتا التجزئة الأولى والثانية في مصفوفة، ثم تُحسَب لهما قيمة تجزئة.
- تُحسَب قيمة التجزئة المحسوبة سابقًا وقيمة تجزئة معلمة الإدخال الثالثة بطريقة مماثلة.
- يتكرر هذا الحساب مع جميع قيم التجزئة المتبقية من الإدخال الأصلي.
قد تتساوى قيم التجزئة المحسوبة لقيم الإدخال نفسها رغم اختلاف أنواع الوسائط.
ويؤثر ذلك، على سبيل المثال، في أنواع الأعداد الصحيحة ذات الأحجام المختلفة، و
Tuple المسمّى وغير المسمّى الذي يحتوي على البيانات نفسها، وMap والنوع المقابل Array(Tuple(key, value)) الذي يحتوي على البيانات نفسها.arg1[, arg2, ...]— عدد متغير من وسيطات الإدخال.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
sipHash64Keyed
sipHash64، لكنه يأخذ أيضًا وسيطة مفتاح صريحة بدلًا من استخدام مفتاح ثابت.
الصيغة
(k0, k1)— زوجTupleمن قيمتين يمثّل المفتاح.Tuple(UInt64, UInt64)arg1[,arg2, ...]— عدد متغير من وسيطات الإدخال.Any
UInt64
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHash
shinglesize كلمات، وتحسب قيم hash لكل shingle كلمات وتُرجع Tuple بهذه القيم.
وتستخدم hashnum من أقل قيم hash لحساب أقل hash، وhashnum من أكبر قيم hash لحساب أكبر hash.
وهي حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
وبالنسبة إلى سلسلتين، إذا كانت قيم hash المُعادة متطابقة لكلتا السلسلتين، فهذا يعني أن السلسلتين متطابقتان.
الصيغة
string— السلسلة النصية المطلوب حساب قيمةhashلها.Stringshinglesize— اختياري. حجمword shingle، وأي قيمة من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالصغرى والكبرى المستخدمة لحساب النتيجة، وأي قيمة من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple يحتوي على قيمتي hash — الصغرى والكبرى. Tuple(UInt64, UInt64)
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashArg
shingles)، يتكوّن كل جزء منها من shinglesize كلمات، ويُرجع أجزاء shingles ذات الحد الأدنى والأقصى من قيم hash للكلمات، كما تحتسبها الدالة wordShingleMinHash باستخدام الإدخال نفسه.
وهي حساسة لحالة الأحرف.
الصيغة
string— سلسلة نصية تُحسب لها قيمة التجزئة.Stringshinglesize— اختياري. حجم مقطع الكلمات، أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم التجزئة الدنيا والعليا المستخدمة لحساب النتيجة، أي رقم من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple يحتوي على اثنين من Tuple، يحتوي كل منهما على hashnum من مقاطع الكلمات. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashArgCaseInsensitive
shinglesize كلمات، وتُرجع الـ shingles ذات أقل وأكبر قيم hash للكلمات، كما تحسبها الدالة wordShingleMinHashCaseInsensitive باستخدام الإدخال نفسه.
وهي لا تراعي حالة الأحرف.
الصيغة
string— سلسلة نصية تُحسب لها قيمة التجزئة.Stringshinglesize— اختياري. حجم شينغل الكلمات، أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد أقل وأعلى قيم التجزئة المستخدمة لحساب النتيجة، أي رقم من1إلى25. القيمة الافتراضية هي6.UInt8
hashnum من شينغل الكلمات. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashArgCaseInsensitiveUTF8
shinglesize كلمة، وتُرجع الـ shingles ذات أدنى وأعلى قيم hash للكلمات، كما تحسبها الدالة wordShingleMinHashCaseInsensitiveUTF8 للمدخل نفسه.
وهي غير حساسة لحالة الأحرف.
البنية
string— سلسلة نصية يُراد حساب قيمة التجزئة لها.Stringshinglesize— اختياري. حجم تتابع الكلمات، وأي رقم من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم التجزئة الصغرى والكبرى المستخدمة لحساب النتيجة، وأي رقم من1إلى25. القيمة الافتراضية هي6.UInt8
hashnum من تتابعات الكلمات. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashArgUTF8
shinglesize كلمات، ويُرجع الـ shingles ذات أصغر وأكبر hash للكلمات، كما تحسبها الدالة wordShingleMinHashUTF8 باستخدام المُدخل نفسه.
وهي حساسة لحالة الأحرف.
الصياغة
string— سلسلة نصية يُحسب لهاhash.Stringshinglesize— اختياري. حجم شينغل الكلمات، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالصغرى والكبرى المستخدمة لحساب النتيجة، أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple تحتوي على Tupleين، يضم كلٌّ منهما hashnum من شينغل الكلمات. Tuple(Tuple(String))
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashCaseInsensitive
shinglesize كلمات، وتحسب قيم hash لكل word shingle وتُرجع tuple بهذه القيم.
وتستخدم أقل hashnum من قيم hash لحساب قيمة hash الدنيا، وأعلى hashnum من قيم hash لحساب قيمة hash القصوى.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المكررة باستخدام tupleHammingDistance.
وبالنسبة إلى سلسلتين، إذا كانت قيم hash المُعادة متطابقة لكلتا السلسلتين، فإن هاتين السلسلتين متطابقتان.
البنية
string— سلسلة نصية يُحسَب لهاhash.Stringshinglesize— اختياري. حجمword shingle، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالصغرى والكبرى المستخدمة في حساب النتيجة، أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple تضم قيمتي hash — الصغرى والكبرى. Tuple(UInt64, UInt64)
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashCaseInsensitiveUTF8
shinglesize كلمات، وتحسب قيم hash لكل word shingle وتُرجع Tuple يحتوي على هذه القيم.
وتستخدم hashnum من أصغر قيم hash لحساب الحد الأدنى للـhash، وhashnum من أكبر قيم hash لحساب الحد الأقصى للـhash.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
وبالنسبة إلى سلسلتين، إذا كانت قيم hash المُعادة متطابقة لكليهما، فإن هاتين السلسلتين متطابقتان.
البنية
string— قيمة String يُراد حسابhashلها.Stringshinglesize— اختياري. حجمword shingle، وهو أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيمhashالصغرى والكبرى المستخدمة لحساب النتيجة، وهو أي رقم من1إلى25. القيمة الافتراضية هي6.UInt8
hash — الصغرى والكبرى. Tuple(UInt64, UInt64)
أمثلة
مثال على الاستخدام
Query
Response
wordShingleMinHashUTF8
shingles) تتكوّن من shinglesize كلمات، ويحسب قيم hash لكل word shingle ويُرجع tuple يحتوي على قيم hash هذه.
ويستخدم أصغر hashnum من قيم hash لحساب الحد الأدنى لـ hash، وأكبر hashnum من قيم hash لحساب الحد الأقصى لـ hash.
وهو حسّاس لحالة الأحرف.
يمكن استخدامه لاكتشاف السلاسل شبه المتطابقة باستخدام tupleHammingDistance.
بالنسبة إلى سلسلتين، إذا كانت قيم hash المُعادة متطابقة لكليهما، فهذا يعني أن السلسلتين متطابقتان.
البنية
string— سلسلة نصية يُحسَب لها hash.Stringshinglesize— اختياري. حجمword shingle، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8hashnum— اختياري. عدد قيم hash الدنيا والعليا المستخدمة لحساب النتيجة، أي عدد من1إلى25. القيمة الافتراضية هي6.UInt8
Tuple(UInt64, UInt64)
أمثلة
مثال على الاستخدام
Query
Response
wordShingleSimHash
shingles) من shinglesize كلمات وتُرجع simhash لشينغل الكلمات.
وهي حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام bitHammingDistance.
كلما صغرت مسافة هامينغ بين قيم simhash المحسوبة لسلسلتين، زاد احتمال أن تكون هاتان السلسلتان متماثلتين.
الصيغة
string— سلسلة تُحسب لها قيمة التجزئة.Stringshinglesize— اختياري. حجم مجموعة كلمات متجاورة، أي قيمة من1إلى25. القيمة الافتراضية هي3.UInt8
UInt64
أمثلة
مثال على الاستخدام
Query
Response
wordShingleSimHashCaseInsensitive
shinglesize كلمات، وتُرجع قيمة simhash الخاصة بـ word shingle.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام bitHammingDistance.
وكلما صغرت مسافة هامنغ بين قيم simhashes المحسوبة لسلسلتين، زاد احتمال أن تكونا متماثلتين.
الصياغة
string— السلسلة النصية المراد حساب قيمة التجزئة لها.Stringshinglesize— اختياري. حجمword shingle، ويمكن أن يكون أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8
UInt64
أمثلة
مثال على الاستخدام
Query
Response
wordShingleSimHashCaseInsensitiveUTF8
shinglesize كلمات، وتُرجع simhash لـ word shingle.
وهي غير حساسة لحالة الأحرف.
يمكن استخدامها لاكتشاف السلاسل شبه المتطابقة باستخدام bitHammingDistance.
وكلما صغرت مسافة Hamming المحسوبة لـ simhashes الخاصتين بسلسلتين، زاد احتمال أن تكون هاتان السلسلتان متطابقتين.
الصيغة
string— السلسلة النصية المراد حساب قيمة التجزئة لها.Stringshinglesize— اختياري. حجم تسلسل الكلمات المتجاورة، أي عدد من1إلى25. القيمة الافتراضية هي3.UInt8
UInt64
أمثلة
مثال على الاستخدام
Query
Response
wordShingleSimHashUTF8
shinglesize كلمات، وتُرجع simhash لـ word shingle.
وهي case sensitive.
يمكن استخدامها لاكتشاف semi-duplicate strings باستخدام bitHammingDistance.
وكلما صغرت Hamming distance لقيم simhashes المحسوبة لسلسلتين، زاد احتمال أن تكون هاتان السلسلتان متماثلتين.
الصيغة
string— السلسلة النصية المطلوب حساب قيمة التجزئة لها.Stringshinglesize— اختياري. حجم مجموعة كلمات متجاورة، أي رقم من1إلى25. القيمة الافتراضية هي3.UInt8
UInt64
أمثلة
مثال على الاستخدام
Query
Response
wyHash64
arg— وسيط من النوع String تُحسَب له قيمةhash.String
hash محسوبة بطول 64 بت من النوع UInt64
أمثلة
مثال على الاستخدام
Query
Response
xxHash32
xxHash64
البنية
arg— سلسلة الإدخال المطلوب تجزئتها.String
UInt32
أمثلة
مثال على الاستخدام
Query
Response
xxHash64
xxHash32
البنية
arg— سلسلة الإدخال المراد تجزئتها.String
UInt64
أمثلة
مثال على الاستخدام
Query
Response
xxh3
expr— قائمة من التعبيرات من أي نوع بيانات.Any
xxh3 المحسوبة ذات 64 بت UInt64
أمثلة
مثال على الاستخدام
Query
Response
xxh3_128
expr— قائمة بالتعبيرات من أي نوع بيانات.Any
xxh3 المحسوبة بطول 128 بت UInt128
أمثلة
مثال على الاستخدام
Query
Response