在线观看免费日本,亚洲国产成人久久一区二区,亚洲性爱专区最新东京热

1億中國人已被AI批改過作業(yè)

責任編輯：zsheng

2018-06-03 10:45:27

摘自：量子位

你被機器批改過作業(yè)么?

最近，老外特別關注AI在中國教育界的進展，例如人臉識別進課堂、高中AI教材出版等等，這一次關注的焦點是：AI代替老師批作業(yè)。

起因是，英文媒體《南華早報》最近有篇報道[1]說，中國有大約6萬所學校都在用人工智能來批改學生的作業(yè)，每四所學校中就有一所在用。

這些學校分布在各地，四川、山東、安徽、北京……

學生們提交的英文作業(yè)，打分交由機器完成，而不是人類教師。作文批改系統(tǒng)，要比Word的拼寫檢查復雜得多。它能夠理解文字的一般邏輯和意思，對作文的整體質量做出像人一樣合理的評判，還要在寫作風格、結構、主題等方面給出改進建議。

據說，92%的情況下，AI和人類教師對一篇作文的評分是一致的。

這個籠罩6萬所學校的人工智能，就是句酷批改網。在它的背后，是一個多所高校和公司共同推進了近10年的項目：語言智能評測關鍵技術及應用。

數據顯示，這個機器教師的學生已經達到1.2億，還覆蓋了北京90%高校，以及所有區(qū)縣的中學。但它也像一道分水嶺，有些人壓根沒聽過。這一點也不奇怪。要知道2016年底，這個服務覆蓋的學校才6000多所。

也就是說，一年之間，它覆蓋的學校數量增長了900%。

“高分秘籍”

學生對機器批改作業(yè)，感受如何?

一個可見的情況是，你能輕松從微博上找到各種吐槽。

比如：

“生活所有的痛苦都來自英語批改網和老師的公郵”

“受了批改網一肚子氣”

“就像相信批改網是垃圾。即使在批改網的排名是倒數也不影響就是這樣堅定地上交的決心”

說起這些，量子位的一枚同事，默默地貼出她被批改網“支配”的往事：100多字的英語短文，修改了40多次。

當人把命運交到機器手里，心中總是有點不服氣。

于是不斷有人試圖證明，機器評分這套系統(tǒng)，不過爾爾。比如此前未來網就在報道[2]中提及此事。

網友“TroyS”反映，一次專門到網上查到批改網各種高分表達并且用到作文里，提交后得了86分，修改語法錯誤后分數變?yōu)?1.5分。此后，該網友把“高分表達”刪除，試著用普通表達后，評分還是91.5分。再后來，試著刪掉最后一段、試著刪掉最后兩段，提交后的分數也都仍然是91.5分。但更令其吃驚的是，當該網友把最后兩段又貼回去后，分數變成了90分，并且此后修改了17次之多，但分數沒變過。

知乎網友“猴賽雷”也提到，通過使勁重復題目要求中的詞和句子、貫穿全文，結構以“首先、其次”這類“八股文模式”照搬，文內多加六級高級詞匯和句式等，再加上批改網推薦替換的詞匯都用上，最后就能得到高分，但是內容驢唇不對馬嘴。

未來網記者將網上找的《假如給我三天光明》的英文節(jié)選粘貼到批改網上，提交后得分85.5分，并提示標題“假如給我三天光明”的英文表達“疑似謂語缺失”。根據文后的按句點評修改兩處提交后，得分仍為85.5分。然而，當記者刪掉最后一段后，得分變?yōu)榱?6分。接著，記者又刪除第一段，提交后得分變成了86.5分。當記者再將第二段刪除后，分數又變成了86分。

總而言之一句話，機器批改作業(yè)，確實還有很多不完善的地方。

一位自稱曾經是批改網研發(fā)的用戶也表示，“批改網的批改原理是用多維度加權平均來給你打分。如果一個維度權重很重，你剛好改了之后這個維度的值降了，一加權自然就分數低了”。

“同學們加油，是機器就有漏洞，就看你們能不能總結出規(guī)律了。”

背后原理

機器到底是如何批改作業(yè)的?

在批改網的官方頁面上，對于背后技術的闡釋如下。

批改網的原理通過對比學生作文和標準語料庫之間的距離，并通過一定的算法將之映射成分數和點評。

2014年多知網的一篇報道中[3]，批改網創(chuàng)始人講述了更多的細節(jié)。我們摘錄如下。

批改網修改作文的原理是，作文提交后，網站將作文從“詞匯”、“句子”、“篇章結構”、“內容相關度”4個大類192個維度進行拆分，每個維度都會與批改網建立的英語本族語語料庫(即國外英語文章的素材)作對比。語料庫越豐富，對比的客觀性就越高，機器批改與人工批改的一致率就越高。

比如，在作文中經常出現“learn knowledge”這樣的中式英語。將這樣的語言搭配與語料庫資料對比后發(fā)現，以英語為母語的國家中，使用“learn knowledge”的頻率為0次，使用頻率最高的是“have knowledge”。所以，會建議學生使用“have knowledge”。

再提供點新信息，根據《2018年國家科學技術進步獎項目提名公示》中披露的內容顯示，批改網背后的技術“歷經近10年的潛心研究”。

其中列出的五個主要的創(chuàng)新點包括：