您的位置:首頁 > 業(yè)內(nèi)資訊 > 阿里媽媽圖像識別創(chuàng)世界紀錄:識別虛假推廣準確率超95%
相對其他限定場景OCR應(yīng)用相比,阿里媽媽要處理的創(chuàng)意圖片和商品圖片上的文字字體、色彩更加多樣,文字布局更加靈活,背景包括各種商品、布景或自然場景,蘊含各種復(fù)雜紋理,給識別問題帶來了更大的挑戰(zhàn)。
蓋坤介紹,在技術(shù)路線上,相比于傳統(tǒng)方法,拋棄了圖像預(yù)處理、字符分割等流程,采用了多個深度神經(jīng)網(wǎng)絡(luò)和語言模型相結(jié)合的方法來組成完整的OCR系統(tǒng)。針對復(fù)雜的場景信息,將LSTM(長短時記憶)技術(shù)成功應(yīng)用到建模中去,大大提高識別的準確率。
據(jù)悉,現(xiàn)在基于OCR文字識別實時審核已覆蓋整個阿里媽媽業(yè)務(wù),每天處理圖片近千萬張,自動反饋疑似違規(guī)圖片準確率達95%以上;同時將圖文審核風(fēng)險發(fā)現(xiàn)時間從“天”降低到“秒”級。數(shù)據(jù)顯示,2015年阿里媽媽累計屏蔽了4600萬條惡意推廣,有效凈化了互聯(lián)網(wǎng)營銷環(huán)境。
除OCR過濾惡意推廣以外,計算機視覺技術(shù)在阿里巴巴集團內(nèi)部已經(jīng)獲得廣泛使用,比如手淘的“拍立淘”產(chǎn)品,通過手機拍照即可搜索相似商品,2015年雙11當(dāng)天,千萬消費者使用了“拍立淘”功能,創(chuàng)造了超過數(shù)千萬元的銷售額。另外,在商品圖片版權(quán)保護、鑒黃等場景也都引入了計算機視覺技術(shù)。
小編推薦閱讀
本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)