Intel開創處理器高清新時代
Intel Intel SSE4 指令包括矢量化編譯器和媒體加速器指令。未來的英特爾處理器將支持其余指令,而軟件也將能從程序的角度檢測出處理器支持哪些Intel® SSE4 指令。那么我們曾多次提到SSE4指令集,相信很多消費者對其還非常陌生,究竟是何方神圣能夠為Intel處理器帶來如此大的改進呢?下面就讓我們來了解一下這款什么的指令集吧!
Intel Intel SSE4 指令包括矢量化編譯器和媒體加速器指令
SSE4的英文全稱是:Streaming SIMD Extensions 4,是英特爾自從SSE2之后對ISA擴展指令集最大的一次的升級擴展。新指令集增強了從多媒體應用到高性能計算應用領域的性能,同時還利用一些專用電路實現對于特定應用加速。
從指令數目上看,SSE4指令增加了的指令改進了整數和浮點操作,支持DWORD和QWORD操作,新的單精度FP操作、快速寄存器操作、面向性能優化的內存操作等等,包括了圖形、圖像、數據裝載各方面的革新,因此稱其為SSE2以來最大的指令集變動也是不為過的。利用支持SSE4指令集的編譯器編譯之后,包括圖形/圖像處理、視頻處理、2D/3D創作、多媒體、游戲、內存敏感負載、高性能計算等應用都會受益。
SSE4指令集將分為兩個版本:4.1和4.2,SSE4.1版本隨著45nm Penryn發布,而SSE4.2版本將會隨著下一代架構Nehalem發布,4.1將包括47條指令,4.2將包括7條指令。
技術領先 強大的SSE4指令集解析
據Intel指出,在應用SSE4指令集后,Penryn增加了2個不同的32Bit向量整數乘法運算支持,引入了8位無符號 (Unsigned)最小值及最大值運算,以及16Bit 及32Bit 有符號 (Signed) 及無符號運算,并有效地改善編譯器效率及提高向量化整數及單精度代碼的運算能力。同時,SSE4 改良插入、提取、尋找、離散、跨步負載及存儲等動作,令向量運算進一步專門化。
不僅如此,Intel SSE4指令集還進一步增強訊編碼效果,例如可同時處理8個4-byte寬度的SAD(Sums of Absolute Differences)運算,常用于新一代高清影像編碼如VC.1及H.264等規格中,令視頻編碼速度進一步提升。因此在播放高清視頻的時候,即使在軟解的情況下也同樣游刃有余。
有效地改善編譯器效率及提高向量化整數及單精度代碼的運算能力
SSE4 構建于英特爾64 指令集架構 (Intel® 64 Instruction Set Architecture) (ISA),該架構是開發 32 位和 64 位應用最為廣泛應用的電腦架構。Intel® SSE4 包含 54 條指令,主要分為兩類:矢量化編譯器和媒體加速器,以及高效加速字符串和文本處理。矢量化編譯器和媒體加速器可提供高性能的編譯器函數庫,如封包(同時使用多個操作數)整數運算和浮點運算,可生成性能優化型代碼。此外,它還包括高度優化的媒體相關運算,如絕對差值求和、浮點點積和內存負載等。矢量化編譯器和媒體加速器指令可改進音頻、視頻和圖像編輯應用、視頻編碼器、3D 應用和游戲的性能。高效加速字符串和文本處理包含多個壓縮字符串比較指令,允許同時運行多項比較和搜索操作。由此受益的應用包括數據庫和數據采掘應用,以及那些利用病毒掃描和編譯器等分析、搜索和模式匹配算法的應用。
SSE4加入了6條浮點型點積運算指令
SSE4加入了6條浮點型點積運算指令,支持單精度、雙精度浮點運算及浮點產生操作,且IEEE 754指令 (Nearest, -Inf, Inf, and Truncate) 可立即轉換其路徑模式,大大減少延誤,這些改變將對游戲及 3D 內容制作應用有重要意義。此外,SSE4加入串流式負載指令,可提高以圖形幀緩沖區的讀取數據頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時緩沖區內,讓指令最多可帶來8倍的讀取頻寬效能提升,對于視訊處理、成像以及圖形處理器與中央處理器之間的共享數據應用,有著明顯的效能提升。
新聞熱點
疑難解答