您的位置:首頁 > 業(yè)內資訊 > 阿里媽媽圖像識別創(chuàng)世界紀錄:識別虛假推廣準確率超95%

阿里媽媽圖像識別創(chuàng)世界紀錄:識別虛假推廣準確率超95%

來源:互聯(lián)網(wǎng) | 時間:2016-06-01 14:18:31 | 閱讀:106 |  標簽: 阿里媽媽   | 分享到:

日前,阿里巴巴旗下廣告交易平臺阿里媽媽圖像團隊的OCR(圖中文字識別)技術刷新了ICDAR Robust Reading競賽數(shù)據(jù)集的全球最好成績,并大幅超越第二名。

Robust Reading競賽是當前OCR技術領域全球最具影響力的比賽。這也是繼阿里巴巴圖像搜索領軍人物華先勝獲得ACM(美國計算機協(xié)會)“杰出科學家”稱號之后,阿里的圖像識別技術再一次登上國際頂尖舞臺。

借助這一領先的OCR技術,阿里媽媽圖像團隊能夠以95%的超高準確率識別圖中違規(guī)文字信息,有效過濾商家惡意推廣,維護消費者權益。2015年,阿里媽媽累計屏蔽了4600萬條惡意推廣。

OCR是計算機視覺領域的經(jīng)典問題,長久以來,一直受到學術界和工業(yè)界的持續(xù)關注。在工業(yè)界,Google、Microsoft、Amazon等大型互聯(lián)網(wǎng)公司,以及商湯科技、曠視科技(擁有Face++、Image++)等計算機視覺技術創(chuàng)業(yè)公司,都在OCR技術上耕耘多年。隨著技術不斷成熟,OCR也開始在互聯(lián)網(wǎng)及其他行業(yè)逐步上線使用。

據(jù)阿里媽媽定向算法技術負責人蓋坤介紹,在阿里巴巴平臺上營銷創(chuàng)意、商品等均是以圖片形式展示,圖像技術是理解這些信息的重要手段。同時,也有不良商家在圖片中內嵌一些違規(guī)的信息達到其惡意推廣的目的,圖片內文字違規(guī)是比例相當大的一類,而傳統(tǒng)監(jiān)控手段多以人工肉眼來審核,費時費力,尤其是隨著圖片數(shù)量越來越大,這幾乎已成為不可完成的任務。

針對這一強烈需求,從2014年開始,阿里媽媽圖像團隊開始重點攻堅OCR技術,通過機器視覺的方式從圖片中識別出文字,從而鑒別出違規(guī)的文案信息。

對惡意推廣的定義,蓋坤表示,一方面依據(jù)國家相關法律法規(guī),對于違禁品、色情信息、封建迷信、假冒偽劣、減肥豐胸、夸大虛假等違規(guī)類型進行不同程度的處罰和管理,另一方面在法規(guī)之外平臺有著更高要求,對損害消費者利益或進行不正當競爭的推廣類型積極嘗試進行管控。其中,與消費者關系最為密切的假冒偽劣單項違規(guī)類型,被阿里媽媽作為重點審查對象。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認同期限觀點或證實其描述。

相關視頻攻略

更多

掃二維碼進入好特網(wǎng)手機版本!

掃二維碼進入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權,請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)