表態引發爭議　微軟高層宣稱近乎所有網上資訊都可用來無償訓練 AI

對於有份開發人工智能模型的公司而言，其中一大煩惱是如何合法地獲取大量資訊，用來訓練旗下的人工智能模型。其中一個可行但不合理的辦法，就是在未得資訊提供者的同意下，就擅自獲取資訊。日前，微軟高層在專訪中談到這點，恐怕不只令微軟及其他公司感到尷尬，甚至有機會在日後因而引發法律訴訟。

微軟高層稱網上近乎所有內容都可自由被取用

日前，負責管理 AI 部門的微軟高層 Mustafa Suleyman 接受美國 CNBC 的 Andrew Ross Sorkin 的專訪，期間談到生成式 AI 如何取得網上的數據。以 Andrew 的說法，就是有份開發 AI 模型的公司是否有效地「盜取」網上資訊來用於自家的 AI 模型。

不過，Mustafa Suleyman 的回應卻引起爭議。他指出對於已經存在於網路上的內容，自 90 年代以來該類內容的社會契約一直是容許任何人都可以複製它們、運用它們來複製、重新創建新的內容，有如一般人平日可用的「免費軟件」。

至於有些網站出版商或新聞機構會明確表示，除了將它們公開的內容編入索引以便其他人可以找到之外，不可出於任何其他原因來進行擷取。他認為這項宣稱存在一個灰色地帶，可以透過法律途徑來解決，成為可任意使用的資源。

或會令不同開發 AI 模型公司感到尷尬

Mustafa Suleyman 的說法，既可以是為包括微軟在內的公司打下強心針，為日常獲得數據來訓練 AI 帶來支持，但另一方面亦有可能令外界質疑，究竟現時的眾多人工智能模型，究竟有多少是開發的公司沒得內容提供者的事前許可就隨意擷取內容，甚至過後也沒有為他們提供半點補償。不但在公關上可能引起尷尬，更嚴重的是有機會在日後引發法律訴訟，最終影響整個行業的發展。

來源︰Neowin

隨機新聞

台男在IKEA拍裸照全裸坐梳化

平民機有消息！傳「iPhone SE 2」將於2018上半年推出

《哥斯拉大戰金剛Godzilla vs. Kong》釋出預告影片3 月底正式上映

【電競比賽】Logitech G x MONOLOGUE Tournament 開始報名，出席參賽有純銀電競選手軍牌！

481