Avor數據排序順序
發布時間:
2022-05-17 15:27:29
Avor數據排序順序,對象化前景常使用的操作就是排序,在Avro確定了數據標準排列順序以后,就允許系統寫入的數據被另外的系統高效地排序了,這是個很重要的優化。即使Avro二進制數據還沒有反序列化對象,也可以對其進行高效排序。
要對擁有相同模式的數據項進行比較,可以采用對模式的深度優先、從左到右遞歸遍歷的方式。遇到不能匹配的項即按原來順序,比如,boolean類型的數據和int類型的數據不能匹配,因此就不用進行排序。具體來說,相同模式的兩個項進行比較時需遵從以下規則。
① null數據總是相等的。
② boolean類型中false排在true的前面。
③ int、long、float與double數據按照數值的升序排列。
④ bytes和fixed數據根據8位無符號值按照字節序進行比較。
⑤ string數據根據Unicode按字節進行比較,值得注意的是,對字符串而言,既然UTF-8作為二進制編碼使用,那么按字節排序和按字符串二進制數據排序是相同的。
⑥ array數據根據元素按字節序進行比較。
⑦ enum數據根據枚舉模式中符號的位置進行排序。例如,枚舉的符號位["z","a"]把"z"排在"a"前面。
⑧ union數據先按照聯合的分支進行排序,接著按照分支的類型排序。例如,聯合["int","string"]中,所有整型將排在所有字符型值前,而整型和字符型各自按照上面的規則排序。
⑨ record數據根據字段按字節序排序。如果字段指定順序為:
● "ascending":其值排序的順序不變;
● "descending":其值排序的順序反轉;
● "ignore":排序時其值將被忽略。⑩ map數據不進行比較。試圖比較包含映射的數據是非法的,除非映射是“有序”的,否則“忽略”記錄字段。
上一篇:
虛擬化技術分類有哪些
下一篇:
譜聚類算法