您的位置：首頁 > 軟件教程 > 教程 > PostgreSQL數(shù)據(jù)庫臨時表去重效率比較與優(yōu)化策略

PostgreSQL數(shù)據(jù)庫臨時表去重效率比較與優(yōu)化策略

來源：好特整理　|　時間：2024-08-17 10:05:31 |　閱讀：104　|　標簽： T TG POS S 數(shù)據(jù)庫策略　 |　分享到：

使用的是PostgreSQL 在做大數(shù)據(jù)量（十萬級）導(dǎo)入時，某些字段和數(shù)據(jù)庫表里數(shù)據(jù)（千萬級）重復(fù)的需要排除掉，把表數(shù)據(jù)查詢出來用程序的方式判斷去重效率很低，于是考慮用臨時表。先把新數(shù)據(jù)插入到臨時表里，臨時表結(jié)構(gòu)和原始表一致。用SQL的方式把不重復(fù)的數(shù)據(jù)DataA查詢出來。把DataA插入到原

最近在處理大數(shù)據(jù)量（十萬級）導(dǎo)入時，發(fā)現(xiàn)某些字段和數(shù)據(jù)庫表里的數(shù)據(jù)（千萬級）重復(fù)，需要進行去重處理。由于用程序方式查詢?nèi)ブ匦实拖拢虼丝紤]使用臨時表來優(yōu)化去重過程。

具體優(yōu)化步驟如下：

首先將新數(shù)據(jù)插入臨時表，其結(jié)構(gòu)與原始表相同。
通過SQL查詢不重復(fù)的數(shù)據(jù)DataA。
將DataA插入到原始表中。

鑒于不重復(fù)數(shù)據(jù)還需要進一步處理，若無需特殊處理，可直接使用 insert into select 語句將第2步的數(shù)據(jù)插入原始表，并清空臨時表。

第2步有兩種方式，一種是使用 not exists 查詢方法，另一種是利用 left join 方式。

測試結(jié)果表明，當臨時表數(shù)據(jù)量較少時， not exists 方式耗時相對較短，但隨著數(shù)據(jù)量增加耗時逐漸增加。而 left join 方式在數(shù)據(jù)量較少時用時較長，但隨著數(shù)據(jù)量增加變化不大。因此，總結(jié)出單表去重時，只要導(dǎo)入的數(shù)據(jù)量不是特別特別大（20w級以上），優(yōu)先使用 not exists 做去重。

然而，當需要對兩個表進行去重時，情況會有所不同。在這種情況下，測試結(jié)果顯示對于數(shù)據(jù)量較少的臨時表， not exists 方式用時相對較短，但隨著數(shù)據(jù)量增加耗時急劇增加。而 left join 方式對于數(shù)據(jù)量較少時用時較長，但隨著數(shù)據(jù)量增加變化不大。因此，當導(dǎo)入的數(shù)據(jù)在3w以下時，建議使用 not exists ；在3w以上時，建議使用 left join 。

小編推薦閱讀

首頁

找游戲

游戲庫

開測表

搶禮包

看攻略

手游排行榜

新聞中心

游戲中心

熱門專區(qū)

熱門頻道

小編推薦

特色欄目

抖音熱游

一刀999

絕地吃雞

沙雕游戲

BT手游

經(jīng)典街機

真人互動

PostgreSQL數(shù)據(jù)庫臨時表去重效率比較與優(yōu)化策略

好特網(wǎng)發(fā)布此文僅為傳遞信息，不代表好特網(wǎng)認同期限觀點或證實其描述。

相關(guān)視頻攻略

更多

同類最新

更多

熱門資訊

更多

更多

更多

首頁

找游戲

游戲庫

開測表

搶禮包

看攻略

手游排行榜

新聞中心

游戲中心

熱門專區(qū)

熱門頻道

小編推薦

特色欄目

抖音熱游

一刀999

絕地吃雞

沙雕游戲

BT手游

經(jīng)典街機

真人互動

PostgreSQL數(shù)據(jù)庫臨時表去重效率比較與優(yōu)化策略

好特網(wǎng)發(fā)布此文僅為傳遞信息，不代表好特網(wǎng)認同期限觀點或證實其描述。

相關(guān)視頻攻略

更多

同類最新

更多

熱門資訊

更多

更多

更多

好特網(wǎng)發(fā)布此文僅為傳遞信息，不代表好特網(wǎng)認同期限觀點或證實其描述。