您的位置:首頁 > 業(yè)內(nèi)資訊 > 這家公司用人工智能技術(shù)識別網(wǎng)頁內(nèi)容
當你每天打開電腦,瀏覽新聞獲取信息時,不經(jīng)意間,你的大腦實際上已經(jīng)做了很多復(fù)雜的信息處理工作,例如識別文章的標題、作者、正文內(nèi)容、圖片等信息。一家名為Diffbot的公司,已經(jīng)可以通過人工智能技術(shù),讓“機器”來進行上述工作,并將上述信息轉(zhuǎn)化為軟件能夠識別的結(jié)構(gòu)化數(shù)據(jù)。
人工智能領(lǐng)域初創(chuàng)公司Diffbot于30日宣布,將解鎖識別論壇、產(chǎn)品評測和問答以及文章評論頁面的API。
Diffbot是一家人工智能公司,通過人工智能技術(shù),讓“機器”識別網(wǎng)頁內(nèi)容,抓取關(guān)鍵內(nèi)容,并輸出軟件可以直接識別的結(jié)構(gòu)化數(shù)據(jù)。
其創(chuàng)始人兼首席執(zhí)行官Mike Tung 30日在接受騰訊科技專訪時表示,目前Diffbot能夠幫助很多開發(fā)者獲取產(chǎn)品開發(fā)所需的關(guān)鍵數(shù)據(jù),省去了他們過去所需要經(jīng)歷的復(fù)雜中間環(huán)節(jié)。
“例如你作為開發(fā)者,想要開發(fā)一款基于Yelp上數(shù)據(jù)的產(chǎn)品,在過去你需要向Yelp發(fā)出API調(diào)用,但通過Diffbot,你就可以很容易獲取數(shù)據(jù)!盩ung說。
在Diffbot的主頁上,你可以在其輸入框中輸入任意網(wǎng)頁地址,測試其識別網(wǎng)頁內(nèi)容的實際效果。
例如,在輸入框中輸入騰訊科技文章“微信回應(yīng)謠言:沒有推出會員制度計劃”的頁面鏈接,按下回車鍵后,系統(tǒng)在進行了大約4秒左右的分析后,將提取出“標題”、“日期”、“作者”、“全文內(nèi)容”、“圖片”(包括格式大。ⅰ罢Z言”等這些信息數(shù)據(jù),將菜單欄、廣告欄等信息自動去除。
Tung說,Diffbot現(xiàn)在做的,相當于人類在瀏覽網(wǎng)頁文章時所做的事情,找出頁面中最核心的相關(guān)信息。
與其他很多“高調(diào)”創(chuàng)業(yè)公司不同,Diffbot自2009年成立以來,大多數(shù)時間都在進行技術(shù)研發(fā),僅在2012年進行了一輪200萬美元的融資,團隊也一直保持極其精簡,目前僅有12人。
Tung介紹說,Diffbot項目最早誕生于斯坦福大學(xué)校園內(nèi),當時他正在人工智能實驗室就讀。Diffbot是第一個獲得斯坦福孵化器Stanford StartX支持的項目,隨后又獲得了包括Sun聯(lián)合創(chuàng)始人、谷歌(微博)投資人Andreas Bechtolsheim等人的投資。
小編推薦閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]
湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)