欧美高清精品一区二区三区|精品一区二区三区视频电影|国产伦一区二区三区久久|日韩中文字幕不卡

公司新聞

新聞中心

匯集全面、前沿、深度的小視科技官網(wǎng)資訊與媒體聚焦報道

【壓縮率3000%】小視科技ICCV:精度保證下的新型深度網(wǎng)絡(luò )壓縮框架

公司新聞 2017-08-30 1683 閱讀

       

       隨著(zhù)人工智能在各個(gè)領(lǐng)域的應用中大放異彩,深度學(xué)習已經(jīng)成為街頭巷尾都能聽(tīng)到的詞匯。然而,網(wǎng)絡(luò )越來(lái)越深,數據越來(lái)越大,訓練越來(lái)越久,如何在保證準確率的情況下加速網(wǎng)絡(luò ),甚至讓網(wǎng)絡(luò )在CPU或者移動(dòng)設備上進(jìn)行訓練與測試,就變成了迫在眉睫的問(wèn)題。


1675925661651564.jpg

       

       小視科技AI技術(shù)團隊的研究人員發(fā)表了論文《基于高階殘差量化的高精度網(wǎng)絡(luò )加速》(Performance Guaranteed Network Acceleration via High-Order Residual Quantization),提出一種新的方法,能夠在保證網(wǎng)絡(luò )模型精度的前提下對深度網(wǎng)絡(luò )進(jìn)行壓縮。實(shí)驗結果,他們將網(wǎng)絡(luò )的大小降低了約32倍,速度上有30倍的提升。雖然以往的方法在體積和速度上也曾經(jīng)取得類(lèi)似的效果,但本論文提出的方法在精度保證上更勝一籌。


2.png

新的壓縮方法HORQ:加快網(wǎng)絡(luò )計算的同時(shí)保證準確率


除了網(wǎng)絡(luò )pruning,網(wǎng)絡(luò )稀疏近似等等,網(wǎng)絡(luò )二值化也是常見(jiàn)的網(wǎng)絡(luò )加速方式。通常情況下,我們用 +1 和 -1 來(lái)代替原來(lái)的浮點(diǎn)數數值,使得卷積中的乘法操作變成加減操作,而如果輸入和權重同時(shí)二值化,乘法操作就會(huì )變成異或操作。


這看似是一種合理的網(wǎng)絡(luò )壓縮方式,然而如果單純的運用閾值二值化方法對網(wǎng)絡(luò )輸入進(jìn)行二值化處理,那么模型最后的精度將無(wú)法得到保證。但如果不運用二值化方法對網(wǎng)絡(luò )進(jìn)行加速,那么就又無(wú)法利用二值化所帶來(lái)的在計算和存儲方面的優(yōu)勢。


這篇文章提出的HORQ(High Order Residual Quantization)方法,提出了一種針對輸入的高階殘差二值量化的方法,既能夠利用二值化計算來(lái)加快網(wǎng)絡(luò )的計算,又能夠保證訓練所得的二值化網(wǎng)絡(luò )模型擁有較高的準確率。


圖一展示了如何用HORQ方法將一個(gè)普通的卷積層進(jìn)行殘差量化。


3.png

圖一  HORQ結構


之前的二值化方法,例如XNOR,對輸入簡(jiǎn)單地采用了閾值量化的操作。這樣的方法可以看成是對浮點(diǎn)數的一階二值近似方法。在此之上,本文運用遞歸閾值量化的方法,提出了HORQ的框架。具體來(lái)講,如圖一所示,在第一次閾值量化操作后,我們可以定義并計算改階近似對應的殘差,然后對該階殘差進(jìn)行新一輪的二值近似。通過(guò)對高階殘差的近似,我們可以得到對應于不同尺度下的二值feature map。將這些feature map相加,便可得到最終的輸出。


實(shí)驗結果

這篇文章的實(shí)驗部分在MNIST和CIFAR-10數據集上進(jìn)行測試,發(fā)現HORQ-net對比之前對輸入簡(jiǎn)單采取一階閾值二值化的方法有喜人的優(yōu)勢:

4.jpg

圖二  MNIST實(shí)驗


5.jpg

圖三  Cifar-10實(shí)驗


我們發(fā)現,對于二階殘差量化方法,該方法將網(wǎng)絡(luò )的大小降低了約32倍,同時(shí)速度上有30倍的提升,相比XNOR-net在兩個(gè)MNIST和CIFAR-10上測試準確率均有提升,并且展現出了可在CPU上進(jìn)行網(wǎng)絡(luò )訓練的潛能。


1675926040447514.jpg


圖四  HORQ方法加速比性能分析


1675926151607987.jpg

圖五  HORQ方法加速比與量化階數分析


HORQ方法對卷積層計算的的加速比跟卷積核大小,feature map數量,以及殘差量化的階數都有較大關(guān)系。這些關(guān)系體現在圖四和圖五中。而且,如圖六所示,基于二值化的模型存儲空間可以得到大幅度的降低。



該論文提出的HORQ方法可以作為一個(gè)基礎的二值量化的方法,用于網(wǎng)絡(luò )的輸入二值化中,能夠在保證網(wǎng)絡(luò )模型精度的前提下,利用二值量化的技術(shù)提升網(wǎng)絡(luò )的計算速度,而且同時(shí)可以根據實(shí)際的硬件需要來(lái)調整殘差階數以適應需求。


這個(gè)方法有著(zhù)很大的發(fā)展和使用前景。對于一般的深度學(xué)習網(wǎng)絡(luò ),HORQ方法能能夠很大程度上加速深度網(wǎng)絡(luò )的計算速度。由于網(wǎng)絡(luò )的每層輸入的輸入和權值都被二值化,模型的前向傳播時(shí)間得到大大降低,同時(shí)存儲模型所需的空間得到大大壓縮,使得在資源受限的小運算平臺,例如手機和筆記本上運行大規模深度網(wǎng)絡(luò )模型成為可能。另外,高階殘差量化的方法能夠使得網(wǎng)絡(luò )精度的得到保證,使得網(wǎng)絡(luò )不再會(huì )因為簡(jiǎn)單二值化方法而出現精度大幅下降。


該論文已經(jīng)被ICCV2017接收,由小視科技AI技術(shù)團隊李澤凡博士實(shí)現,倪冰冰教授,張文軍教授,楊小康教授,高文院士指導。



相關(guān)論文 Performance Guaranteed Network Acceleration via High-Order Residual Quantization 將在ICCV發(fā)表,詳情可屆時(shí)查看。