欧美日操-欧美日韩91-欧美日韩99-欧美日韩ay在线观看-xxxx色-xxxx视频在线

讓FPGA替代GPU,你會有怎樣的顧慮?

2018-01-23 10:09:24 e-works   點(diǎn)擊量: 評論 (0)
這幾天,已經(jīng)退役的AlphaGo又強(qiáng)行刷了一波頭條,不是又跟哪位世界高手對決,而是新狗通過無監(jiān)督式學(xué)習(xí),僅用3天時間就戰(zhàn)勝了李世石版的
  

   顧慮二:FPGA的計(jì)算性能能不能滿足我的需求?
    與CPU和GPU不同,F(xiàn)PGA是一種典型的非諾依曼架構(gòu),是硬件適配軟件的模式,它能夠根據(jù)系統(tǒng)資源和算法特征靈活的調(diào)整并行度,達(dá)到最優(yōu)的適配,因此能效比高于CPU和GPU。
    以浪潮F10A為例,這是目前業(yè)界支持OpenCL的最高密度最高性能的FPGA加速設(shè)備,基于Altera的Arria10芯片,單芯片峰值運(yùn)算能力達(dá)到了1.5TFlops,功耗卻只需35W,每瓦特性能達(dá)到42GFlops。同時,F(xiàn)10A設(shè)計(jì)為高密度的半高半長PCI-E插卡,同時具有靈活的板卡內(nèi)存配置,最大支持32G雙通道內(nèi)存,是業(yè)內(nèi)同等FPGA卡內(nèi)存容量的4-8倍。此外,F(xiàn)10A支持2個10Gb光口,可以實(shí)現(xiàn)數(shù)據(jù)直接從網(wǎng)絡(luò)到板卡處理,無需經(jīng)過CPU,大大減低了傳輸延時。
    測試數(shù)據(jù)顯示,在語音識別應(yīng)用下,浪潮F10A較CPU性能加速2.87倍,而功耗相當(dāng)于CPU的15.7%,性能功耗比提升18倍。
    顧慮三:FPGA的開發(fā)周期得1年以上吧,這不能滿足我的業(yè)務(wù)上線需求?
    傳統(tǒng)的FPGA的開發(fā)類似于芯片的開發(fā),采用硬件描述語言(HDL)開發(fā),HDL開發(fā)帶來的問題就會像芯片設(shè)計(jì)一樣周期會比較長,從架構(gòu)設(shè)計(jì)、到仿真驗(yàn)證、再到最終完成,需要一年左右的開發(fā)時間。
    但是互聯(lián)網(wǎng)的業(yè)務(wù)迭代速度極快,在幾個月時間內(nèi)就可能完成龐大用戶群的積累,因此業(yè)務(wù)對于數(shù)據(jù)中心的要求是“快”—計(jì)算力平臺的升級要盡量快地滿足業(yè)務(wù)的發(fā)展,因此FPGA的傳統(tǒng)開發(fā)模式動輒以半年或年為單位的開發(fā)周期難以滿足需求。
    為此浪潮嘗試通過OpenCL高級語言開發(fā)方式,它把底層的硬件如總線、IO接口、訪存控制器等和底層軟件如驅(qū)動、函數(shù)調(diào)用等全部封裝,變成標(biāo)準(zhǔn)單元提供上層支持,用戶只需要關(guān)注算法本身,OpenCL開發(fā)的邏輯通過編譯工具直接映射到FPGA中,開發(fā)周期從至少1年縮短至4個月以內(nèi)。
    顧慮四:對于O經(jīng)驗(yàn)的公司,怎樣快速上線FPGA應(yīng)用?
    或許你還是有些顧慮,即時開發(fā)效率大幅提升、開發(fā)周期大大縮短,但是對于技術(shù)和團(tuán)隊(duì)儲備不足的中小型AI企業(yè)來說,F(xiàn)PGA仍是“高不可攀”的AI加速部件。如果,有一種方案能夠?qū)④浖⑺惴ê陀布蹇ㄕ希攒浻惨惑w化的形式,提供FaaS(FPGAasaService)服務(wù)。你還有什么顧慮么?
    目前,浪潮正在針對市場上需求最迫切的幾種應(yīng)用場景進(jìn)行算法的移植開發(fā),在圖像壓縮、文本數(shù)據(jù)壓縮及神經(jīng)網(wǎng)絡(luò)加速等應(yīng)用開發(fā)出業(yè)界領(lǐng)先的IP,省去客戶的算法開發(fā)周期,最小化FPGA落地門檻、最大化FPGA落地效率。
    神經(jīng)網(wǎng)絡(luò)加速方案:基于浪潮F10A的AI線上推理加速方案,針對CNN卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)算法進(jìn)行優(yōu)化和固化,可加速ResNet等神經(jīng)網(wǎng)絡(luò),能夠應(yīng)用于圖片分類、對象檢測和人臉識別等應(yīng)用場景。
    實(shí)測數(shù)據(jù)顯示,在進(jìn)行ResNet殘差網(wǎng)絡(luò)的圖片識別分類任務(wù)時,浪潮F10A加速方案圖片處理速度可達(dá)每秒742張,Top-5識別準(zhǔn)確率達(dá)到99.6%,相比同檔次GPU能效比提升3倍以上。而與通用CPU對比,在處理這種高并行、小計(jì)算量的任務(wù)時,F(xiàn)10A的優(yōu)勢將更明顯。
    WebP圖片轉(zhuǎn)碼壓縮加速方案:針對圖片數(shù)據(jù)的壓縮應(yīng)用,嵌入基于FPGA計(jì)算環(huán)境下的WebP編解碼優(yōu)化算法,通過充分利用硬件流水設(shè)計(jì)和任務(wù)級并行,大大提升WebP圖像壓縮編碼算法的處理性能,能夠?qū)崿F(xiàn)JPEG-WebP圖片格式的快速轉(zhuǎn)換,比傳統(tǒng)實(shí)現(xiàn)方式的整體處理效率平均高9.13倍左右,最高性能可比CPU提高14倍。
    數(shù)據(jù)壓縮加速方案:為解決傳統(tǒng)壓縮架構(gòu)的弊端,浪潮GZip算法加速方案充分利用板卡硬件流水設(shè)計(jì)和任務(wù)級并行,大幅提升了壓縮任務(wù)的吞吐量并有效降低CPU的負(fù)載,壓縮率(壓縮率=1-壓縮后文件/壓縮前文件)最高可達(dá)94.8%,壓縮速度達(dá)到1.2GB/s,10倍于傳統(tǒng)方案的壓縮效率。
    顧慮五:我是做云的,F(xiàn)PGA咋管理?支持虛擬機(jī)么?
    FaaS不僅僅是指板卡與軟件算法的一體化服務(wù),同時還可以支持公有云及在線遠(yuǎn)程管理和更新。浪潮FPGA解決方案能夠支持動態(tài)邏輯的在線可重構(gòu)、靜態(tài)邏輯的遠(yuǎn)程更新,并且通過優(yōu)化的監(jiān)控管理機(jī)制,提升板卡遠(yuǎn)程監(jiān)控管理的可靠性,通過它們可以實(shí)時的監(jiān)控FPGA芯片的溫度、板卡風(fēng)扇轉(zhuǎn)速、板卡內(nèi)存特性等從而調(diào)整FPGA的工作頻率。
    同時浪潮FPGA也支持虛擬機(jī)的直接訪問,板卡本身也加入了很多RAS(可靠性、可用性、可擴(kuò)展性)特性,如高可靠內(nèi)存訪問等,支持并行(FPP)和串行(AS)雙加載模式,任何一種模式加載出現(xiàn)故障,都可以快速切換到另一種模式加載,保證了板卡大規(guī)模服務(wù)的可用性。
    有了這些特性,就可以利用浪潮FPGA方案,快速搭建FPGA云所需要的基礎(chǔ)底層計(jì)算平臺,不論是對外提供公有云服務(wù),還是對內(nèi)實(shí)現(xiàn)FPGA計(jì)算力快速分配都能夠既高效又可靠。
 

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:任我行

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個贊
?
主站蜘蛛池模板: 国产aⅴ一区二区三区 | 上海一级毛片 | 四虎影视成人永久在线观看 | 91精品国产高清在线入口 | 成人午夜影视 | 国产v日韩v欧美v精品专区 | 夜夜天天操 | 牛牛影视精品一区二区在线看 | 免费中文字幕一级毛片 | 婷婷丁香视频 | 精品欧美高清不卡在线 | 黄色片www| 99热在线观看免费 | 四虎影视在线 | 国产激情对白一区二区三区四 | 国产特级毛片 | 香蕉高清免费永久在线视频 | 魏璎珞电视剧免费观看 | 99久久香蕉国产综合影院 | 日本中文字幕一区 | 2019国内精品久久久久久 | 四虎一区二区三区 | 欧美成人自拍视频 | 亚洲欧美日本国产一区二区三区 | 成人免费视频在线 | 日韩在线看片中文字幕不卡 | 国产免费久久精品99久久 | 亚洲国产精品自在现线让你爽 | 四虎永久在线精品影院 | 成人影片在线免费观看 | 色综合久久天天综线观看 | 亚洲成人日韩 | 永久黄网站色视频免费网站 | 国产精品一区二区国产 | 亚洲天堂男人的天堂 | 四虎永久免费网站免费观看 | 日本免费成人网 | 91香蕉视频在线播放 | 97精品国产91久久久久久久 | 上海麻豆文化传媒网站入口 | xxx大片免费视频 |