亚洲国产成人九九综合,无码人妻精一区二区三区,免费a一级毛片在线播放

估值40億美元的Dropbox又為用戶帶來新功能：AI識別掃描文檔

責任編輯：editor007

作者：韓旭

2017-04-13 17:47:35

摘自：36kr

云文件同步和共享服務商Dropbox今天披露了更多支持光學字符識別（OCR）功能的技術細節(jié)，已經(jīng)為Dropbox Business付費的企業(yè)員工可以在Android和iOS應用程序中使用該功能。

具體操作是這樣的，使用移動設備上的相機掃描文檔后，光學字符識別功能將會啟動。然后，應用程序會根據(jù)需要裁剪或旋轉(zhuǎn)文檔，然后將其保存為Dropbox中的PDF。8月，該公司表示正在使用計算機視覺來檢測應用程序掃描文檔。

與人工智能深度學習結合的OCR技術已經(jīng)不是新鮮事了。GitHub 上的開源軟件可以用于兩者結合，Google在Google街景圖像中也運用了機器學習和OCR技術。OCR系統(tǒng)的初始版本采用市售軟件開發(fā)工具包（SDK）。Dropbox選擇運行自己的數(shù)據(jù)包以節(jié)省資金并提高準確性，因為市售系統(tǒng)主要是為實際的硬件掃描儀構建的，而不是為移動設備上使用相機的掃描儀。Dropbox利用用戶數(shù)據(jù)訓練系統(tǒng)。

Dropbox的軟件工程師Brad NeubergNeuberg表示，Dropbox需要收集用戶上傳一部分圖像或文件，例如收據(jù)、發(fā)票、信件等。為了收集這個集合，公司事先征得了用戶的同意。如果用戶同意，那么這些文件信息一定會被保密。Dropbox對用戶捐贈的數(shù)據(jù)采取各種安全措施，比如絕不會將數(shù)據(jù)保留在本地部署的服務器上，保持持續(xù)并廣泛的審計、部署強大的身份驗證訪問數(shù)據(jù)措施等。

為了預測文檔中特定單詞的剪切文本，Dropbox通過卷積神經(jīng)網(wǎng)絡，然后是雙向長時間短期記憶（LSTM）網(wǎng)絡發(fā)送圖像，最后連接時間分類（CTC）系統(tǒng)。該系統(tǒng)部分依賴于Google的TensorFlow開源深入學習框架。為了加強這個系統(tǒng)，Dropbox借鑒了虛構的數(shù)據(jù) ，然后以簡單的方式進行了轉(zhuǎn)換。

Dropbox已經(jīng)脫離了亞馬遜網(wǎng)絡服務（AWS）的公共云端，并運行自己的數(shù)據(jù)中心基礎架構。此外，Dropbox已經(jīng)開始使用圖形處理單元（GPU）加速的G2 虛擬機（VM）實例對其模型進行了培訓，并存儲了一些數(shù)據(jù)在AWS S3服務中。為了進一步改進模型，Dropbox訓練了小數(shù)量的圖像單詞。然后，從預測單個詞跳轉(zhuǎn)到處理整個文檔。

與人工智能深度學習結合的OCR技術已經(jīng)不是新鮮事了。GitHub上的開源軟件可以用于兩者結合，Google在Google街景圖像中也運用了機器學習和OCR技術。OCR系統(tǒng)的初始版本采用市售軟件開發(fā)工具包（SDK）。Dropbox選擇運行自己的數(shù)據(jù)包以節(jié)省資金并提高準確性，因為市售系統(tǒng)主要是為實際的硬件掃描儀構建的，而不是為移動設備上使用相機的掃描儀。Dropbox利用用戶數(shù)據(jù)訓練系統(tǒng)。

Dropbox已經(jīng)脫離了亞馬遜網(wǎng)絡服務（AWS）的公共云端，并運行自己的數(shù)據(jù)中心基礎架構。此外，Dropbox已經(jīng)開始使用圖形處理單元（GPU）加速的G2虛擬機（VM）實例對其模型進行了培訓，并存儲了一些數(shù)據(jù)在AWS S3服務中。為了進一步改進模型，Dropbox訓練了小數(shù)量的圖像單詞。然后，從預測單個詞跳轉(zhuǎn)到處理整個文檔。

Dropbox 文檔改進模型