注:這些技術是通用的,只不過我們選擇使用Postgres的語法。使用獨特的pgAdminIII生成解釋圖形。
很有用,但太慢Count distinct是SQL分析時的禍根,因此它是我第一篇博客的不二選擇。
首先:如果你有一個大的且能夠容忍不精確的數據集,那像HyperLogLog這樣的概率計數器應該是你最好的選擇。(我們會在以后的博客中談到HyperLogLog。)但對于需要快速、精準答案的查詢,一些簡單的子查詢可以節省你很多時間。
讓我們以我們一直使用的一個簡單查詢開始:哪個圖表的用戶訪問量最大?