You have multiple accounts
Choose the account you want to sign in with.

摘要

在 Microsoft SQL Server 平行資料倉儲中的數個不同層級,就會發生扭曲的資料。本文著重於不準特定值的資料列。這可能會造成分散式的資料表,以更多的資料放入一個散發比其他的散發版本。下列查詢會計算出具有特定的值,通訊群組索引鍵資料表的資料列數目︰

select distribution_key, count(distribution_key)
from distributed_table

group by distribution_key

--having count(distribtuion_key) >5000

order by count(distribtuion_key) desc


注意擁有 」 的子句標記為註解。不過,如果您想要執行快速檢查是否有顯著的扭曲,這個子句會告訴您。您可能要調整有成適合您的結果設定的值。例如,如果所有值都有 5000 的記錄,我們建議您將此值設定為 7500 或 10000,表示發生問題。

問題的扭曲時問題並沒有決定性的回應。扭曲會造成問題,很明顯的偏態分配的效能時,應用程式無法容忍這種情況。根據經驗法則是應用裝置可以忍受 10 到 20%的扭曲,跨所有資料表。在此閾值,偏態的分配應該平均下並行存取。大於此閾值,您可能會開始在處理資料時,請參閱一些較長時間執行分配。某些實作可能能夠容忍更大的扭曲,有些實作方式可能無法容忍這許多。測試才能判斷實際的閾值,以便您的實作。

更多的資訊

如果扭曲的值還用做聯結條件,相同的值向扭曲的另一端,可以是從聯結的資料列數目在爆炸。這可能會造成長時間執行的查詢。

重要注意額外 NULL 值數目,因為這些可能會導致對聯結的問題。

Need more help?

Expand your skills
Explore Training
Get new features first
Join Microsoft Insiders

Was this information helpful?

How satisfied are you with the translation quality?
What affected your experience?

Thank you for your feedback!

×