這就是Import.io的用武之地。這家位于加利福尼亞州Los Gatos的創(chuàng)業(yè)公司利用機(jī)器學(xué)習(xí)來自動(dòng)提取和處理網(wǎng)絡(luò)數(shù)據(jù),今天該公司宣布獲得了1550萬美元的B輪融資。總部位于倫敦的Talis Capital領(lǐng)投,現(xiàn)有投資者IP Group、OpenOcean、Oxford Capital和Wellington Partners也參與了此輪融資。該公司在2013年的種子輪融資中獲得了450萬美元的投資,在2016年的A輪融資中獲得了1300萬美元的投資,本輪融資使其融資總額達(dá)到了3300萬美元。
該公司的首席執(zhí)行官Gary Read表示,這些資金將用于加速全球增長并擴(kuò)大Import.io的產(chǎn)品供應(yīng)。他表示,自從該公司于2012年在柏林注冊(cè)成立以來,已經(jīng)吸引了800多家企業(yè)客戶,他們通過其專有平臺(tái)接收來自數(shù)百萬個(gè)網(wǎng)絡(luò)資源的數(shù)據(jù)。(僅在2015年,它就從超過55億個(gè)網(wǎng)頁中提取數(shù)據(jù)。)
Read 表示:“由于無法及時(shí)獲取高質(zhì)量數(shù)據(jù),全球各地的企業(yè)可謂損失慘重。事實(shí)上,據(jù)IBM估計(jì),質(zhì)量差的數(shù)據(jù)每年使美國企業(yè)付出的代價(jià)超過了3萬億美元。Import.io致力于提供及時(shí)、高質(zhì)量的數(shù)據(jù),幾乎沒有客戶資源要求。我們讓我們的800多家企業(yè)客戶能夠根據(jù)我們每天提供的數(shù)據(jù)制訂重要的業(yè)務(wù)決策,并通過積極的服務(wù)級(jí)別保證來支持這一點(diǎn)。”
Import.io的新穎機(jī)器學(xué)習(xí)解決方案不僅可以提取數(shù)據(jù),還可以將其準(zhǔn)備并集成到客戶的分析平臺(tái)和業(yè)務(wù)應(yīng)用程序(如Tableau)中,從而有效地將網(wǎng)站轉(zhuǎn)換為API。例如,創(chuàng)業(yè)企業(yè)StoryFit使用它來獲取數(shù)十萬個(gè)網(wǎng)頁中的書籍、電影和電視數(shù)據(jù)相關(guān)的信息,以便為電影制片廠和圖書出版商生成預(yù)測(cè)分析。另一家客戶AudioLock利用它來掃描網(wǎng)絡(luò)上的未經(jīng)許可的音樂內(nèi)容。
Import.io的數(shù)據(jù)爬蟲套件還提供了更復(fù)雜的功能,例如從多個(gè)源合并信息并為其創(chuàng)建通用模式的功能。它還提供報(bào)告和可視化工具,包括顯示事物如何變化的比較審核。
Talis Capital的Matus Maar認(rèn)為這種方法使其有別于Webhose.io、DeepCrawl等競(jìng)爭(zhēng)對(duì)手。