在NVIDIA旗下挖礦與遊戲最強顯示卡的TITAN V,最近被爆出竟然有BUG。這張採用12nm工藝的Volta核心,12GB HBM2顯存,5120流處理器,640 Tensor Cores,110TFlops峰值浮點性能,是TITAN Xp(12T)9倍的顯示卡。以$2,999 美元(折合HK $23,394)的價錢,竟然被專業領域科學家,在以TITAN V進行仿真計算時,出來的結果不一的嚴重漏洞。
專業運算錯誤
一位生物領域的科學家發現,當使用TITAN V進行「蛋白質與酶之間的相互作用」模擬計算時,發現以相同基礎運算的數據,可以計出不同的結果。對此,外國媒就戲稱道,「TITAN V在遇到生物學上的2+2=?時,會輸出=4、=4.1、=4.2…等」N種結果。其後研究人員又在四張TITAN V卡進行反複試驗,發現其中兩張都有10%的機率,出現這錯誤。
業內估計:糾錯機制問題
對於這種錯誤,有晶片業內人士就試以分析,指出NVIDIA或是為過高的晶片負荷以及影像記憶體,而故意砍掉了TITAN V的糾錯機制,導致記憶體讀取時有概率出錯。
官方認Amber存異常
目前,NVIDIA確認有Amber的問題存在,其表示「在遇到運算錯誤的用戶,要與官方聯繫解決。目前確認,在使用分子動力學中被稱為Amber的科學應用程序時,TITAN V會異常。」同時,NVIDIA指所有的GPU產品的設計都是準確的,加上Tesla有ECC糾錯功能,能應對高性能專業運算服務。而對遊戲領域的玩家來說,暫時不會產生太大影響。
來源:the register