久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 揭秘FPGA:為什么比 GPU 的延遲低這么多?

揭秘FPGA:為什么比 GPU 的延遲低這么多?

作者: 時間:2018-06-27 來源:網(wǎng)絡 收藏

  ▲Open Compute Server 在機架中。

本文引用地址:http://cqxgywz.com/article/201806/382354.htm


  ▲Open Compute Server 內(nèi)景。紅框是放 的位置。


  ▲插入 后的 Open Compute Server。


  ▲ 與 Open Compute Server 之間的連接與固定。

  FPGA 采用 Stratix V D5,有 172K 個 ALM,2014 個 M20K 片上內(nèi)存,1590 個 DSP。板上有一個 8GB DDR3-1333 內(nèi)存,一個 PCIe Gen3 x8 接口,兩個 10 Gbps 網(wǎng)絡接口。一個機柜之間的 FPGA 采用專用網(wǎng)絡連接,一組 10G 網(wǎng)口 8 個一組連成環(huán),另一組 10G 網(wǎng)口 6 個一組連成環(huán),不使用交換機。


  ▲機柜中 FPGA 之間的網(wǎng)絡連接方式。

  這樣一個 1632 臺服務器、1632 塊 FPGA 的集群,把 Bing 的搜索結(jié)果排序整體性能提高到了 2 倍(換言之,節(jié)省了一半的服務器)。

  如下圖所示,每 8 塊 FPGA 穿成一條鏈,中間用前面提到的 10 Gbps 專用網(wǎng)線來通信。這 8 塊 FPGA 各司其職,有的負責從文檔中提取特征(黃色),有的負責計算特征表達式(綠色),有的負責計算文檔的得分(紅色)。


  ▲FPGA 加速 Bing 的搜索排序過程。


  ▲FPGA 不僅降低了 Bing 搜索的延遲,還顯著提高了延遲的穩(wěn)定性。



關鍵詞: FPGA 云計算 GPU

評論


相關推薦

技術(shù)專區(qū)

關閉