無論是本地硬盤還是網(wǎng)絡(luò)云盤,我們都希望用最小的空間存儲(chǔ)最大的數(shù)據(jù)量。為了達(dá)到這個(gè)目的,各種各樣的文件壓縮技術(shù)和標(biāo)準(zhǔn)也應(yīng)運(yùn)而生,圖片里有jpeg和png,音頻里有mp3和flac,視頻里有rmvb和mkv,還有zip和tar等各種壓縮。
其實(shí)他們的最終目的是一樣的:最大限度地保持?jǐn)?shù)據(jù)的原始信息,同時(shí)生成最小體積的可讀寫文件,F(xiàn)在,谷歌憑借神經(jīng)網(wǎng)絡(luò)的方法又向著這個(gè)目標(biāo)往前跨了一大步。
來自谷歌的一個(gè)研究團(tuán)隊(duì)日前憑借神經(jīng)網(wǎng)絡(luò)訓(xùn)練法讓計(jì)算機(jī)對(duì)圖片文件的壓縮效率達(dá)到了新高度。據(jù)外媒報(bào)道,這種新的壓縮算法效果要優(yōu)于傳統(tǒng)的jpeg壓縮,在同樣的清晰度下,使用神經(jīng)網(wǎng)絡(luò)算法壓縮的文件體積要比jpeg更小。
團(tuán)隊(duì)的具體做法是:首先從互聯(lián)網(wǎng)上隨機(jī)挑選6百萬張已經(jīng)被壓縮過的圖片,并將每張圖片都切割成若干個(gè)32x32大小的像素碎片,從每張圖片中都挑出100個(gè)壓縮效果最差的碎片輸入到神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)。經(jīng)過反復(fù)訓(xùn)練,告訴神經(jīng)網(wǎng)絡(luò)哪些是最差的壓縮,讓計(jì)算機(jī)自己學(xué)習(xí)這些最差壓縮的特點(diǎn)。科學(xué)家們的想法是:如果計(jì)算機(jī)掌握了最差壓縮的圖片特點(diǎn),那就能夠在后續(xù)的壓縮算法中有效規(guī)避,于是在保證文件壓縮比的同時(shí),能最大限度地確保圖片的顯示效果。
該神經(jīng)網(wǎng)絡(luò)壓縮的實(shí)現(xiàn)方式類似于訓(xùn)練中的情況。計(jì)算機(jī)會(huì)將一張照片首先拆分成若干個(gè)小片段,并針對(duì)每個(gè)片段的特點(diǎn)進(jìn)行單獨(dú)壓縮,隨后再將所有片段組合起來形成最后的輸出結(jié)果。在團(tuán)隊(duì)成員發(fā)表的論文中,可以看到算法的具體實(shí)現(xiàn)情況,其中也展示了神經(jīng)網(wǎng)絡(luò)算法在大部分壓縮比例下都優(yōu)于jpeg的效果。
不過谷歌也承認(rèn),人類的視覺系統(tǒng)或許是所有感知系統(tǒng)中最難把握的一個(gè),因?yàn)橛行┤藢?duì)某種特定的變化很敏感,而另一些又不敏感,目前還無法形成一個(gè)統(tǒng)一的判定標(biāo)準(zhǔn),一張圖片到底怎樣才算最優(yōu)的顯示。
無論如何,谷歌都在努力將我們的越來越龐大的媒體數(shù)據(jù)盡量無損地壓縮到最小,這在任何時(shí)候都是一件好事。
小編推薦閱讀
如何使用 Pytorch 中的 DataSet 和 DataLoader
閱讀golang slice相關(guān)常見的性能優(yōu)化手段
閱讀連接Elasticsearch服務(wù)器的Python代碼示例
閱讀國(guó)產(chǎn)操作系統(tǒng)上實(shí)現(xiàn)RTMP推流攝像頭視頻和麥克風(fēng)聲音到流媒體服務(wù)器
閱讀使用Python讀取和導(dǎo)出NetCDF格式的多時(shí)相柵格文件
閱讀多租戶系統(tǒng)數(shù)據(jù)權(quán)限設(shè)計(jì)與RuoYi系統(tǒng)的借鑒
閱讀count(*)、count(1)哪個(gè)更快?面試必問:通宵整理的十道經(jīng)典MySQL必問面試題
閱讀從需求分析、產(chǎn)品設(shè)計(jì)到部署交付各階段說明
閱讀如何利用七牛云進(jìn)行數(shù)據(jù)備份和刪除
閱讀強(qiáng)化學(xué)習(xí)筆記之【ACE:Off-PolicyActor-CriticwithCausality-AwareEntropyRegularization】
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]
湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2024 haote.com 好特網(wǎng)