用于具一個以上圖形處理單元的圖形系統(tǒng)的圖形處理單元的制作方法

文檔序號：6609539閱讀：188來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：用于具一個以上圖形處理單元的圖形系統(tǒng)的圖形處理單元的制作方法
技術(shù)領(lǐng)域：
本發(fā)明大體上涉及能夠支持不同數(shù)目的圖形卡以獲得改進性能的圖形系統(tǒng)。更具體地說，本發(fā)明針對一種用以支持節(jié)省成本且高性能的圖形系統(tǒng)的專用總線。
背景技術(shù)：
圖形系統(tǒng)通常構(gòu)建為插入到母板中的不同卡(有時也稱為“板”)的三維組合件。所述母板是系統(tǒng)的主電路板，且通常包含中央處理單元和稱為“芯片組”的其它芯片。另外，母板包含連接器、端口和用于附著其它電子組件的其它特征。
參看圖1，在常規(guī)圖形系統(tǒng)中，母板100包含芯片組，所述芯片組包含(例如)橋接器單元110和中央處理單元(CPU)120。出于說明目的，將圖形卡130說明為處于用以組合的適當(dāng)位置中。圖形卡130通常包含圖形處理單元(GPU)(未圖示)。圖形卡130通常包含連接器表面135。出于說明目的，將單個連接器表面135說明為經(jīng)設(shè)計以與外圍組件接口(PCI)Express(通常稱為“PCI-E”或“PCIe”)連接器140緊密配合。PCI-E是利用高速串行數(shù)據(jù)路線的高速總線接口標(biāo)準(zhǔn)。PCI-SIG組織發(fā)表PCI-E標(biāo)準(zhǔn)。個別數(shù)據(jù)路線150包括兩個單工連接件，一個用于接收數(shù)據(jù)且另一個用于發(fā)射數(shù)據(jù)。
所述PCI-E標(biāo)準(zhǔn)規(guī)定總線接口協(xié)議以將一組數(shù)據(jù)路線配置成兩個實體之間的鏈路。鏈路帶寬根據(jù)并行操作的數(shù)據(jù)路線的數(shù)目來按比例伸縮。PCI-E總線的大小通常被稱為一個數(shù)據(jù)路線的倍數(shù)，例如“xN”或“Nx”，以指示所述鏈路具有單個數(shù)據(jù)路線的帶寬的N倍。PCI-E支持x1、x2、x4、x8、x16和x32路線的總線大小。常規(guī)上，利用多種標(biāo)準(zhǔn)連接器大小，其中x16連接器大小通常用于圖形卡。
圖2說明可伸縮鏈路接口(SLI)圖形系統(tǒng)，其類似于由Nvidia Corporation of SantaClara，California提供的SLI圖形系統(tǒng)。SLI圖形系統(tǒng)利用兩個或兩個以上圖形卡130-A和130-B，其一起進行操作以產(chǎn)生單個輸出。也就是說，所述圖形卡并行處理圖形數(shù)據(jù)。舉例來說，可在母板100上提供兩個PCI-E x16連接器140-A和140-B，每一連接器用于一個圖形卡130-A和130-B。將PCI-E x16總線(例如，源自芯片110的一個x16總線)分成兩個x8總線，其中每一x8總線去往一個圖形卡。通常，提供切換卡170(也稱為“開關(guān)卡”)以決定源自芯片110的x16總線的哪些路線路由到所述兩個PCI-E連接器140-A和140-B。切換卡170本質(zhì)上相當(dāng)于進一步包含切換元件的額外PCI-E連接器。此切換卡170通常具有兩個位置第一位置，其中源自芯片110的所有16個路線均路由到一個PCI-E連接器(例如PCI-E連接器140-A)；和第二切換位置，其中8個路線從芯片110路由到PCI-E連接器140-A且源自芯片110的另外8個路線路由到PCI-E連接器140-B。因此，在SLI模式中，每一PCI-E連接器使得其串行數(shù)據(jù)路線的一半耦合到芯片組，而未使用另一半。這導(dǎo)致固有折衷，因為圖形處理能力增加(由于所述兩個GPU并行操作)，但代價是每一圖形卡具有的PCI-E帶寬將是其單獨使用時具有的PCI-E帶寬的一半。
SLI通常以主/從布置來實施，其中在多個圖形處理器之間劃分工作。軟件驅(qū)動程序在所述兩個圖形卡之間分配處理圖形數(shù)據(jù)的工作。舉例來說，在分幀渲染(SFR)中，圖形處理經(jīng)組織以使得將個別幀分成兩個不同部分，所述兩個部分由不同圖形處理器并行處理。在交錯幀渲染(AFR)中，一個圖形卡處理當(dāng)前幀而另一圖形卡對下一幀進行處理。在一種型式中，外部SLI連接器180提供圖形卡之間的鏈路，以在圖形卡之間傳輸同步和像素數(shù)據(jù)。
近年來，Nvidia Corporation已發(fā)布包含四個圖形卡的四重SLI系統(tǒng)。四重SLI系統(tǒng)是SLI的延伸，其中四個圖形卡處理圖形數(shù)據(jù)。舉例來說，可將所述工作分成AFR和SFR的組合，其中多個具有兩個圖形卡的群組對交錯幀進行處理，其中每一具有兩個圖形卡的群組又執(zhí)行分幀渲染。
常規(guī)SLI的一個問題在于，其比所需的更為昂貴。具體地說，通常需要額外組件(例如切換卡和SLI連接器)，從而增加了成本。另一問題與性能有關(guān)，其是由在兩個圖形卡之間分裂芯片110的PCI-E帶寬造成的。與單個圖形卡結(jié)構(gòu)相比，從芯片組到GPU的帶寬減少了一半。這還會導(dǎo)致限制用于流過芯片組的GPU到GPU流量的可用帶寬。
如圖3中說明，對于常規(guī)SLI的一個替代方案將在芯片組中使用較為昂貴的一組芯片305、310來增加PCI-E帶寬，以使得每一GPU 320-A和320-B具有專用于芯片組的x16帶寬。然而，除了所需的較為昂貴的芯片組外，圖3中所說明的結(jié)構(gòu)不具有從CPU 302到GPU的對稱數(shù)據(jù)路徑350和360。來自GPU的命令流可因此在稍微不同的時間到達每一GPU。結(jié)果，與對稱數(shù)據(jù)通路的情況相比，在使GPU 320-A和320-B的操作同步方面必須更加小心?；蛘?，如圖4中說明，可使用具有較昂貴芯片組的芯片402和404的SLI結(jié)構(gòu)來增加指派到每一GPU 420的PCI-E帶寬。舉例來說，可包含具有x32 PCI-E接口的芯片404以支持每對具有x16總線的GPU 420。然而，對于許多市場細分而言，添加額外芯片或較昂貴芯片的增加性能不能證明額外芯片成本是合理的。
因此，鑒于上述問題，研發(fā)了本發(fā)明的設(shè)備、系統(tǒng)和方法。

發(fā)明內(nèi)容
本發(fā)明提供一種圖形處理單元，其具有第一操作模式，其中所述圖形處理單元可作為個別圖形處理單元進行操作。所述圖形處理單元具有第二操作模式，其中所述圖形處理單元可作為一組圖形處理單元進行操作，其中每一個別圖形處理單元用圖形處理單元之間的專用總線并行處理圖形數(shù)據(jù)以進行對等通信。
在一個實施例中，所述圖形處理單元包含支持一組串行數(shù)據(jù)路線的總線接口。所述總線接口包含模式控制器，其中對于所述第一操作模式，所述組串行數(shù)據(jù)路線作為單個總線進行操作，且對于所述第二操作模式，第一子組所述串行數(shù)據(jù)路線作為一個總線進行管理，且第二子組所述串行數(shù)據(jù)路線作為專用總線進行管理，以用于與另一圖形處理單元進行對等通信。

結(jié)合下文聯(lián)合附圖所作的詳細描述可更全面地理解本發(fā)明，在附圖中圖1說明具有常規(guī)PCI-E總線的圖形系統(tǒng)的現(xiàn)有技術(shù)母板；圖2說明具有兩個圖形卡的現(xiàn)有技術(shù)可伸縮鏈路接口圖形系統(tǒng)的母板；圖3是具有兩個GPU的現(xiàn)有技術(shù)圖形系統(tǒng)的方框圖；圖4是具有四個GPU的現(xiàn)有技術(shù)圖形系統(tǒng)的方框圖；圖5說明根據(jù)本發(fā)明一個實施例將PCI-E連接器進行耦合以形成專用總線的母板；圖6說明根據(jù)本發(fā)明一個實施例將PCI-E連接器進行耦合以形成專用總線且包含切換卡的母板；圖7說明根據(jù)本發(fā)明一個實施例的PCI-E連接器由形成在母板上的連接件耦合以界定專用總線的母板；圖8是根據(jù)本發(fā)明一個實施例的圖形系統(tǒng)的功能方框圖；圖9是根據(jù)本發(fā)明一個實施例的四重SLI系統(tǒng)的方框圖；和圖10是根據(jù)本發(fā)明一個實施例的四重SLI系統(tǒng)的第二實施例的方框圖。
圖11說明其中使用單個圖形卡的圖7的系統(tǒng)的替代性實施方案；圖12說明其中利用兩個圖形卡的圖9的系統(tǒng)的替代性實施方案；和圖13說明其中利用兩個圖形卡的圖10的系統(tǒng)的替代性實施方案。
在附圖的所述若干視圖中，相同參考元件符號始終指代相應(yīng)部分。
具體實施例方式
圖5是本發(fā)明的一個實施例的透視圖，其中為了清晰起見省略了一些常規(guī)組件，且為了說明目的而并未按比例繪示其它組件。母板500包含芯片組，所述芯片組可包含CPU550和另一具有外圍組件接口Express(PCI-E)接口545的芯片540。母板500具有兩個PCI-E連接器510和515(例如兩個PCI-E x16連接器)以用于接納圖形卡530-A和530-B。
圖形卡530-A和530-B具有PCI-E連接器表面535-A和535-B，所述連接器表面經(jīng)設(shè)計以與相應(yīng)的PCI-E連接器510或515配合。每一圖形卡530-A和530-B具有其自己的個別圖形處理單元(GPU)502-A和502-B。每一圖形卡530-A和530-B包含內(nèi)部信號路徑(未圖示)以將來自PCI-E連接器表面535的電信號耦合到個別的GPU 502-A或502-B。
個別PCI-E連接器(例如連接器510)具有插腳525和相關(guān)聯(lián)的接觸指的內(nèi)部接觸位置527，圖中以虛線說明。PCI-E卡邊連接器(例如連接器510或515)具有接觸指，以接受卡并且與連接器表面535的接觸表面配合。在連接器內(nèi)，具有對應(yīng)于接觸指的接觸位置的標(biāo)準(zhǔn)PCI-E連接器插腳引線。所述插腳引線(和其相關(guān)聯(lián)的與接觸位置的關(guān)系)用以界定特定的串行數(shù)據(jù)路線。因此，舉例來說，x16 PCI-E連接器具有為16個串行數(shù)據(jù)路線界定16個個別單工接收器和16個個別單工發(fā)射器的插腳引線。插腳引線還指定給特定數(shù)據(jù)路線的插腳(和相關(guān)聯(lián)的接觸位置)的分派。
在一個實施例中，進一步向PCI-E總線(例如，到達芯片540的PCI-E總線590或595)或向?qū)Ｓ每偩€580(例如，圖形卡530-A與530-B之間的專用總線)分派每一連接器510和515的插腳525(和其相關(guān)聯(lián)的接觸位置527)。將PCI-E插腳引線組織成發(fā)射器和接收器的接觸位置布置在連接器的兩側(cè)，且路線數(shù)目沿著連接器依次上升地布置。因此，通過對特定連接器插腳進行電連接(所述插腳又耦合到由插腳引線界定的特定內(nèi)部接觸位置)來分派特定數(shù)據(jù)路線。P2P箭頭說明分派給連接器510與515之間的專用總線580的一子組數(shù)據(jù)路線。C1箭頭說明分派給PCI-E總線595的連接器515的一子組數(shù)據(jù)路線。C2箭頭說明分派給PCI-E總線590的連接器510的一子組數(shù)據(jù)路線。
如芯片540的PCI-E接口545上的箭頭指示，在一個實施例中，將芯片540的PCI-E接口的帶寬分成耦合到C1和C2數(shù)據(jù)路線的兩個子總線。作為一個實例，芯片540可為基于Nvidia Corporation of Santa Clara，California的nForce4芯片組設(shè)計的芯片組的一部分。nForce4芯片組允許芯片組PCI-E接口545將其串行數(shù)據(jù)路線配置成一個x16 PCI-E總線或配置成兩個x8 PCI-E總線。
連接連接器510和515的P2P串行數(shù)據(jù)路線的專用總線580提供高數(shù)據(jù)速率卡到卡總線。發(fā)明者的研究顯示，GPU到GPU流量構(gòu)成SLI模式中的流量的較大部分。因此，形成在兩個圖形卡的P2P串行數(shù)據(jù)路線之間的專用總線可用于改進性能。在一個實施例中，芯片組的PCI-E接口545是x16 PCI-E接口，且每一連接器510和515均是PCI-E x16連接器，所述連接器將其串行數(shù)據(jù)路線分派為向P2P指派8個串行數(shù)據(jù)路線且指派另外8個串行數(shù)據(jù)路線用于與芯片組進行通信(即，C1或C2數(shù)據(jù)路線)。然而，將了解，這些數(shù)目是示范性的，且更常見的情況是專用總線包含至少一個串行數(shù)據(jù)路線。
圖形卡530-A與530-B之間由P2P串行數(shù)據(jù)路線形成的專用總線580應(yīng)當(dāng)與PCI-E電兼容，但可使用PCI-E協(xié)議或其它協(xié)議，例如所有者協(xié)議(proprietary protocol)。由專用總線運載的流量的說明性實例包含同步數(shù)據(jù)、像素數(shù)據(jù)和消息數(shù)據(jù)。其它實例包含用于紋理過濾的交叉位塊傳送(cross-blit)流量。此外，由于專用總線可用于在圖形卡之間發(fā)送專門流量，因而可基于經(jīng)由專用總線發(fā)送的數(shù)據(jù)的類型來選擇數(shù)據(jù)壓縮技術(shù)。
參看圖6，在一個實施例中，可包含切換卡570以在連接器510和515的連接器插腳之間路由一些或所有信號。在此實施例中，芯片540的相應(yīng)PCI-E插腳也連線到切換卡570。接著，切換卡570執(zhí)行路由功能，以幫助形成用于SLI模式的總線580、590和595。然而，切換卡570會增加額外的費用。因此，圖6的實施例的成本可能會高于許多應(yīng)用所期望的成本。
圖7說明包含定制母板700的實施例。定制母板700包含專用總線580電耦合連接器510和515的P2P插腳(未圖示)的電互連件(以虛線說明)。定制母板700還包含用以電耦合連接器510和515的相應(yīng)插腳(未圖示)與芯片540的插腳(未圖示)以形成總線590和595的電互連件(以虛線說明)。用于將電互連件圖案化到母板上的技術(shù)在電子封裝技術(shù)中是眾所周知的。然而，用以形成總線580、590和595的電互連件優(yōu)選地制造成與PCI-E的高數(shù)據(jù)速率兼容。形成在母板中的用于每一總線580、590和595的電互連件可(例如)包含以與PCI-E中使用的低電壓差分信令兼容的方式圖案化到母板700上的硬連線高速單工連接件。因此，舉例來說，如果子總線(例如專用總線580)具有8個串行數(shù)據(jù)路線，那么母板可具有高速互連件以支持所述8個串行數(shù)據(jù)路線的8個雙單工連接。因此，圖7的實施例需要定制母板，但免除了切換卡的成本。
圖8是更詳細說明圖形系統(tǒng)800的功能組件的方框圖。所述系統(tǒng)包含在CPU 550上運行的軟件，例如BIOS 805和驅(qū)動程序820。個別GPU(例如GPU 502-A)優(yōu)選地經(jīng)設(shè)計為具有默認(rèn)模式，其中其在一些應(yīng)用中充當(dāng)單獨GPU，但也可針對多圖形卡SLI結(jié)構(gòu)經(jīng)配置以與其它圖形卡一起使用。使用配置過程來針對SLI配置兩個GPU 502-A和502-B。在SLI模式中，驅(qū)動程序820為GPU 502-A和502-B兩者產(chǎn)生命令，以渲染不同的幀部分(例如，SFR)。每一GPU 502-A和502-B還可具有在設(shè)置過程期間配置的SLI模式信息840。
在一個實施例中，每一GPU 502-A和502-B的PCI-E模式也在設(shè)置操作期間配置。每一GPU 502包含PCI-E物理接口850，其包含發(fā)射器和接收器對801以支持串行數(shù)據(jù)路線；PCI-E控制器860；總線模式控制模塊865；和邏輯通道模塊870。在PCI Express規(guī)定中，組件之間的每一點到點鏈路可具有1、2、4、8、12、16或32個雙單工2.5Gbps路線。PCI Express調(diào)用8位/10位數(shù)據(jù)編碼以建立2差分對、2.5Gbps(2.0Gbps有效速率)雙單工數(shù)據(jù)流，其中每一數(shù)據(jù)路線具有一嵌入時鐘。PCI Express規(guī)定的默認(rèn)內(nèi)容指定將鏈路寬度處理成總線兩側(cè)所支持的最大鏈路寬度。鏈路狀態(tài)機執(zhí)行由PCI Express規(guī)定所指定的鏈路調(diào)訓(xùn)與狀況狀態(tài)機(LTSSM)的狀態(tài)。
在圖8的實施例中，每一渲染模式還具有相關(guān)聯(lián)的總線接口模式，這取決于用于渲染幀的圖形卡的數(shù)目和為不同圖形卡指派幀數(shù)據(jù)渲染的方式。舉例來說，模式控制模塊865可通過在BIOS配置步驟中進行寄存器寫入來配置。邏輯通道模塊870可根據(jù)操作模式而將可用串行數(shù)據(jù)路線以邏輯方式分割成一個或兩個通道。邏輯通道模塊870具有第一模式，其中將物理接口850的所有串行數(shù)據(jù)路線視為常規(guī)PCI-E總線的一部分。邏輯通道模塊具有第二操作模式，其中PCI-E物理接口850的串行數(shù)據(jù)路線以邏輯方式分割成包含第一子組串行數(shù)據(jù)路線的第一總線通道和具有第二子組串行數(shù)據(jù)路線的第二總線通道。因此，所支持的這兩種不同模式允許將圖形卡用作單個卡(所有串行數(shù)據(jù)路線用作一個PCI-E總線)或針對具有一子組所述串行數(shù)據(jù)路線的SLI而用作專用GPU到GPU總線。請注意，可將模式控制模塊865和邏輯通道模塊870的功能性集成到PCI-E控制器860中。
物理接口850的邏輯分割可利用相同總線協(xié)議(例如，PCI-E)或不同協(xié)議。舉例來說，所述通道中的一者可使用PCI-E，而另一者可使用所有者協(xié)議。舉例來說，每一通道可具有其自己的狀態(tài)機，以用于使用針對所述通道選定的協(xié)議來配置鏈路。
圖形系統(tǒng)800需要考慮到使用SLI時沿著不同數(shù)據(jù)通路的數(shù)據(jù)等待時間的差別。請注意，圖形系統(tǒng)800具有若干不同的數(shù)據(jù)通路。這些通路包含專用總線892以及個別GPU與芯片540之間的總線894和896。因此，視實施方案的細節(jié)而定，一些GPU到GPU流量可直接在專用總線892上發(fā)送，而其它GPU到GPU流量可經(jīng)由總線894和896通過芯片540來發(fā)送。此外，視實施方案的細節(jié)而定，其它類型的流量可采用不同的途經(jīng)，這取決于是否使用專用總線892。
圖形系統(tǒng)800中的某些類型的流量可使用語義次序。也就是說，特定類型的數(shù)據(jù)流量可能需要維持流量的關(guān)鍵次序(相對于其它事件和/或流量)，以便能夠?qū)?shù)據(jù)進行正確地解譯。如先前描述，在SLI結(jié)構(gòu)中，CPU 550向GPU 502-A和502-B發(fā)布命令流，以在GPU 502-A與502-B之間劃分工作。此外，對于特定類型的圖形操作，一個GPU 502-A可能必須將數(shù)據(jù)傳送到另一GPU 502-B以進行額外處理。結(jié)果，某些類型的流量可能需要維持語義次序。在某些情形下存在這種可能性由于使用SLI時不同數(shù)據(jù)路徑的傳播時間存在差別，因而由一個GPU 502經(jīng)由專用總線892接收的某些類型的流量可能會以與理想語義次序略微不同的次序到達。優(yōu)選地提供重新排序模塊885，以提供任何必要的重新排序，從而無論流量采用哪條通路均確保流量的正確語義排序。舉例來說，重新排序模塊885可包含先進先出(FIFO)緩沖器和重新排序邏輯以便將流量重新排序成正確的語義次序?；蛘撸谝粋€實施例中，每一GPU 502-A和502-B均經(jīng)配置以用經(jīng)選擇以避免經(jīng)由嚴(yán)重依賴于語義次序的專用總線892發(fā)送流量的方式來引導(dǎo)流量。
如先前描述，本發(fā)明的一個優(yōu)點在于，可針對GPU到GPU通信使用專用總線。發(fā)明者的研究顯示，在典型的SLI結(jié)構(gòu)中存在大量GPU到GPU流量。在SLI的常規(guī)低成本實施方案中，通常通過芯片組來路由這種GPU到GPU流量。相反，本發(fā)明的一個實施例利用串行數(shù)據(jù)路線，通常不使用串行數(shù)據(jù)路線來形成專用總線。對于存在大量GPU到GPU流量的SLI系統(tǒng)，專用總線允許以低成本解決方案來實現(xiàn)比得上較昂貴的解決方案的性能。此外，如先前描述，在一個實施例中，用無需切換卡170和外部SLI連接器180的方式構(gòu)建專用總線，這樣可能會節(jié)省成本。
預(yù)期可在多種不同SLI結(jié)構(gòu)中利用本發(fā)明。將了解，本發(fā)明的實施例還包含具有四個GPU的四重SLI系統(tǒng)。如圖9和10說明，對于高性能四重SLI系統(tǒng)，可使用較復(fù)雜的芯片組來支持四個GPU，其中多個具有兩個GPU的對具有專用總線(如先前描述)。舉例來說，在圖9的方框圖中，芯片組具有CPU 550、中間芯片905和到達兩個芯片920的輸出端(fan out)，其中每個輸出端具有x16 PCI-E接口。支持四個GPU 930，其中系統(tǒng)支持每對GPU之間的x8專用總線950。圖10說明芯片1020具有x32 PCI-E接口使得其可支持四個具有x8 PCI-E總線的GPU 930的結(jié)構(gòu)。
在某些應(yīng)用中，需要提供用不同數(shù)目的圖形卡來配置圖形系統(tǒng)且同時充分利用到達芯片組的可用PCI-E帶寬的選項。舉例來說，再次參看圖7的圖形系統(tǒng)，圖中說明兩個圖形卡530-A和530-B。然而，可能需要提供這樣的選項以僅僅利用單個圖形卡530-A且PCI-E接口545的全部PCI-E總線帶寬均可供圖形卡530-A使用的配置來利用定制母板700。圖11說明僅具有單個圖形卡530-A的定制母板700。在圖11的實例中，在連接器515中安裝了印刷電路板(PCB)1105。PCB 1110包含橋接器部分1110，其具有將C1數(shù)據(jù)路線與各自P2P數(shù)據(jù)路線橋接的互連。因此，C1和C2數(shù)據(jù)路線兩者均可用于支持芯片540與圖形卡530-A之間的流量，使得圖形卡530-A可利用PCI-E總線的全部帶寬。
在一個實施例中，圖形系統(tǒng)支持具有不同數(shù)目的圖形卡的SLI操作，例如具有兩個圖形卡或四個圖形卡的SLI操作。圖12說明圖9的系統(tǒng)的實施方案，其中每對中的GPU930中的一者替換成PCB 1105。因此，圖12的實施方案中的每一個別GPU 930具有全部PCI-E x16帶寬。因此，將圖9與圖12進行比較，可使用同一系統(tǒng)來支持兩個圖形卡(圖12)或四個圖形卡(圖9)。類似地，如圖13說明，圖10的系統(tǒng)也可在將每對中的GPU 930中的一者替換成PCB 1105的情況下構(gòu)建。
盡管PCI-E是圖形產(chǎn)業(yè)中的通用總線，但將了解，本發(fā)明可應(yīng)用于可以邏輯方式分割一組串行數(shù)據(jù)路線的其它類型的總線。此外，將了解，本發(fā)明可應(yīng)用于圖形卡之外的實體之間的專用總線，例如為圖形卡之外的其它類型的卡提供卡到卡鏈路的專用總線。
盡管已針對GPU描述了多個實例，但更一般而言，將了解本發(fā)明也可應(yīng)用于通用GPU(GPGPU)。
本發(fā)明的實施例涉及一種具有計算機可讀媒體的計算機存儲產(chǎn)品，所述計算機可讀媒體上面具有用于執(zhí)行各種計算機實施操作的計算機代碼。所述媒體和計算機代碼可為針對本發(fā)明用途特別設(shè)計和構(gòu)造的媒體和代碼，或者其可具有計算機軟件領(lǐng)域的技術(shù)人員熟知的且可用的類型。計算機可讀媒體的實例包含但不限于磁性媒體，例如硬盤、軟盤和磁帶；光學(xué)媒體，例如CD-ROM和全息裝置；磁光媒體，例如可光讀軟盤；和經(jīng)特別配置以存儲和執(zhí)行程序代碼的硬件裝置，例如專用集成電路(“ASIC”)、可編程邏輯裝置(“PLD”)和ROM及RAM裝置。計算機代碼的實例包含例如由編譯器產(chǎn)生的機器代碼和含有計算機使用解譯器來執(zhí)行的高級代碼的文件。舉例來說，本發(fā)明的一實施例可使用Java、C++或其它面向?qū)ο蟮木幊陶Z言和開發(fā)工具來實施。本發(fā)明的另一實施例可以硬連線電路代替或結(jié)合機器可執(zhí)行軟件指令來實施。
出于闡釋目的，以上描述內(nèi)容使用了特定術(shù)語以提供對本發(fā)明的透徹了解。然而，所屬領(lǐng)域的技術(shù)人員將易于了解，要實踐本發(fā)明并不需要特定細節(jié)。因此，對本發(fā)明特定實施例的以上描述是為了說明和描述目的而提出的。并不希望它們是完全的或者將本發(fā)明局限于所揭示的精確形式；顯然，鑒于以上教示，可能存在許多修改和更改。之所以選擇和描述所述實施例是為了最清楚地解釋本發(fā)明的原理及其實踐應(yīng)用，因此所述實施例使得所屬領(lǐng)域的技術(shù)人員能夠以適合于所預(yù)期的特定用途的各種修改來最充分地利用本發(fā)明和各種實施例。希望所附權(quán)利要求書及其均等物界定本發(fā)明的范圍。
權(quán)利要求
1.一種圖形系統(tǒng)，其包括圖形處理單元，其具有第一操作模式和第二操作模式，在所述第一操作模式中，所述圖形處理單元可作為個別圖形處理單元進行操作，且在所述第二操作模式中，所述圖形處理單元可作為一組圖形處理單元的一部分進行操作，其中每一個別圖形處理單元并行處理圖形數(shù)據(jù)；總線接口，其設(shè)置在所述圖形處理單元中，所述總線接口支持一組串行數(shù)據(jù)路線；且所述總線接口包含模式控制器，其中對于所述第一操作模式，所述組串行數(shù)據(jù)路線作為單個總線進行操作，且對于所述第二操作模式，第一子組所述串行數(shù)據(jù)路線作為一個總線進行管理，且第二子組所述串行數(shù)據(jù)路線作為專用總線進行管理，以用于與另一圖形處理單元進行對等通信。
2.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述圖形處理單元利用所述專用總線作為像素總線。
3.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述圖形處理單元在所述專用總線上以壓縮格式發(fā)送數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述圖形處理單元包含重新排序模塊以將經(jīng)由所述專用總線接收到的數(shù)據(jù)重新排序為語義次序。
5.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述專用總線用于發(fā)送數(shù)據(jù)，其中接收所述數(shù)據(jù)的次序不是關(guān)鍵的。
6.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述專用總線由所述圖形處理單元用以發(fā)送交叉位塊傳送數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述第二操作模式對應(yīng)于分幀渲染，其中兩個圖形處理單元分裂個別幀的渲染。
8.根據(jù)權(quán)利要求1所述的圖形系統(tǒng)，其中所述圖形處理單元的所述總線接口的至少一個串行數(shù)據(jù)路線耦合到芯片組。
全文摘要
本發(fā)明提供一種圖形處理單元，其可作為個別圖形處理單元進行操作。然而，所述圖形處理單元具有與第二圖形處理單元形成有專用總線的操作模式。
文檔編號G06F13/38GK101089892SQ20071010867
公開日2007年12月19日申請日期2007年6月14日優(yōu)先權(quán)日2006年6月15日
發(fā)明者拉多斯拉夫·丹尼拉克申請人:輝達公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：拉多斯拉夫.丹尼拉克
技術(shù)所有人：輝達公司
我是此專利的發(fā)明人

上一篇：用于具有一個以上圖形處理單元的圖形系統(tǒng)的母板的制作方法
上一篇：多核處理器及其串口復(fù)用方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

液壓系統(tǒng)圖形符號圖相關(guān)技術(shù)

無法啟動圖形系統(tǒng)相關(guān)技術(shù)

圖形系統(tǒng)無法初始化相關(guān)技術(shù)

300mw單元制給水系統(tǒng)相關(guān)技術(shù)

初始化圖形系統(tǒng)失敗相關(guān)技術(shù)

小區(qū)單元門禁系統(tǒng)相關(guān)技術(shù)

電力系統(tǒng)圖形描述規(guī)范相關(guān)技術(shù)

小區(qū)單元門禁系統(tǒng)報價相關(guān)技術(shù)

午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

用于具一個以上圖形處理單元的圖形系統(tǒng)的圖形處理單元的制作方法