You are here
Home > posts

Teoretisk vs faktisk bandbredde: PCI Express og Thunderbolt.

Teoretisk vs faktisk bandbredde: PCI Express og Thunderbolt.

Alt du trenger a vite om moderne PCI Express og Thunderbolts bandbreddepotensial og begrensninger nar du bygger din neste PC.

Vi er i fremtiden! Det er pa tide a fortsette var scintillating titt pa grensesnitt, og bandbredde begrensninger derav. Denne uken kastet vi vare blikk pa PCI Express og Thunderbolt. For det forste, PCI Express: Hva betyr det egentlig nar du har en PCIe 2.0 x8-tilkobling? Og gjor det en forskjell om forbindelsen din er x8 eller x16?

PCI Express.

PCI Express er litt forvirrende. En PCIe-tilkobling bestar av en eller flere dataoverforingsbaner, koblet serielt. Hver bane bestar av to par ledninger, en for mottak og en for overforing. Du kan ha en, fire, atte eller seksten baner i et enkeltbruker PCIe-spor – betegnet som x1, x4, x8 eller x16. Hver bane er en uavhengig forbindelse mellom PCI-kontrolleren og utvidelseskortet, og bandbredde skaleres line rt, slik at en atte-lane-tilkobling vil ha to ganger bandbredden til en fire-lane-tilkobling. Dette bidrar til a unnga flaskehalser mellom, sier CPU og grafikkort. Hvis du trenger mer bandbredde, bruk bare flere baner.

Det finnes flere forskjellige fysiske tilkoblinger, som hver kan fungere elektrisk som et spor med et lavere antall baner og kan huse et fysisk mindre kort ogsa. En fysisk PCIe x16-spor kan huse et x1, x4, x8 eller x16-kort, og kan kjore et x16-kort ved x16, x8, x4 eller x1. En PCIe x4-spor kan huse et x1 eller x4-kort, men kan ikke passe et x16-kort. Og til slutt er det flere forskjellige versjoner av PCIe-grensesnittet, hver med forskjellige bandbreddebegrensninger, og mange moderne hovedkort har PCIe-spor av forskjellige fysiske storrelser og forskjellige PCIe-generasjoner. Forvirret enna?

La oss starte med maksimal teoretisk bandbredde. En enkelt PCIe 1.0 (eller 1.1) bane kan b re opptil 2,5 Gigatransfers per sekund (GT / s) i hver retning samtidig. For PCIe 2.0, som oker til 5GT / s, og en enkelt PCIe 3.0-bane kan b re 8GT / s.

Hva er med denne gigatransfers nonsens? Gigatransfers per sekund er det samme (i dette tilfellet) som gigabits per sekund, men de inkluderer biter som gar tapt som folge av grensesnittets overhead. Alle PCI Express-versjoner mister noe av deres teoretiske maksimale gjennomstromning til den fysiske overhead forbundet med elektroniske overforinger. PCIe 1. * og 2.0 bruker 8b / 10b-koding (som SATA gjor), hvis oppgang er at hver 8 bits data koster 10 bits a overfore, slik at de mister 20 prosent av deres teoretiske bandbredde til overhead. Det er bare kostnaden for a gjore forretninger.

Etter overhead er den maksimale per-lane datahastigheten for PCIe 1.0 atti prosent av 2.5GT / s. Det gir oss to gigabits per sekund, eller 250MB / s (husk atte biter til en byte). PCIe-grensesnittet er toveis, sa det er 250MB / s i hver retning, per kjorefelt. PCIe 2.0 dobler per-lane-gjennomgangen til 5GT / s, noe som gir oss 500MB / s av den faktiske dataoverforingen per kjorefelt.

PCIe 3.0 oppnar to ganger hastigheten til PCI 2.0, til tross for at det har en per-lane gjennomstromning som bare er 60 prosent mer enn en PCIe-tilkobling.

Du har sikkert hort at PCIe 3.0 er dobbelt sa hoy som PCI 2.0, men som vi har sett ovenfor, er den teoretiske gjennomstromningen per lane 8GT / s, som bare er 60 prosent mer enn PCIe 2.0s 5GT / s. Det er fordi PCIe 3.0 og nyere bruker et mer effektivt kodingsprogram som kalles 128b / 130b (PDF-kobling), slik at overhead er mye mindre – bare 1,54 prosent. Det betyr at en enkelt PCIe 3.0 lane, ved 8GT / s, kan sende 985MB / s. Det er ikke ganske to ganger 500MB / s, men det er n r nok til markedsforingsformal.

Det betyr at en PCIe 3.0 x4-tilkobling (3,94 GB / s) burde ha nesten samme bandbredde som PCIe 1.1 x16 eller PCIe 2.0 x8 (begge 4 GB / s).

Moderne GPUer bruker et x16 PCIe 2.0 eller 3.0 grensesnitt. Det betyr ikke at de alltid kjorer pa x16-hastighet, skjont. Mange hovedkort har flere fysiske x16-spor, men et mindre antall faktiske PCIe-baner er tilgjengelige. Pa en Z87 (Haswell) eller Z77 (Ivy Bridge) skrivebord har CPU 16 PCIe 3.0-baner. Intel-brikkesett har ytterligere atte PCIe 2.0 baner, men de brukes vanligvis til lydkort, RAID-kort og sa videre. (AMDs 990FX-brikkesett inkluderer 32 PCIe 2.0-baner, pluss fire pa northbridge.) I Asus-kortet som vist ovenfor, er PCIe 3.0-sporene f.eks. CPU-baner, mens resten ma dele de atte brikkesettene PCIe 2.0-banene. Bruk av PCIe 2.0 x16-sporet i x4-modus deaktiverer tre av PCIe 2.0 x1-sporene.

Sa et enkelt x16 grafikkort vil bruke alle 16 CPU PCIe baner, men a legge til en GPU til den andre x16-banen vil slippe begge grafikkortens tilkoblinger ned til atte baner hver. Hvis du legger til en tredje GPU, slettes det forste kortets tilkobling til x8, og det andre og tredje kortets tilkoblinger ned til x4 hver. Dette er grunnen til at mange som kjorer multi-GPU-oppsett, foretrekker Intels entusiastarkitekturer, som Sandy Bridge-E og den kommende Ivy Bridge-E. Ivy Bridge-E CPUer vil ha forti PCIe 3.0-baner. Det er nok a kjore to kort pa x16 og ett pa x8, ett kort pa x16 og tre kort pa x8, eller en pa x16, to pa x8 og to pa x4. Det er bare latterlig.

Betyr det for ytelse?

To PCIe 3.0 GPUer som kjorer pa x8 hver pa et PCIe 3.0-hovedkort, bor ha nesten samme bandbredde som to PCIe 2.0 GPUer som kjorer ved x16 – det forste settet gar pa 7,88 GB / s hver, mens de andre to gar 8 GB / s. Hvis enten hovedkortet ditt eller grafikkortet er begrenset til en PCIe 2.0-tilkobling, sitter du fast ved hjelp av det langsommere grensesnittet.

TechPowerUp gjorde en enorm roundup av PCIe ytelse i mai i fjor. De testet de to kraftigste single-GPU kortene pa den tiden – AMDs Radeon HD 7970 og Nvidias GeForce GTX 680 – ved x4, x8 og x16 ved hjelp av PCIe 1.1, 2.0 og 3.0, alle pa samme hovedkort. Dette er den aller beste eple-til-eple-testen jeg noensinne har sett pa PCIe-bandbredde skalering. Hele artikkelen er verdt a lese, men resultatoppsummeringssiden samler de relative resultatene pa et oyeblikk.

Sist arets mest kraftige grafikkort utforer bare bra pa PCIe 2.0 x8 eller til og med PCIe 3.0 x4.

Som du forventer, utforer ekvivalente bandbreddekonfigurasjoner omtrent det samme. Viktigst, for a sitere TechPowerUp-forfatterne, «Var testing bekrefter at moderne grafikkort fungerer fint i langsommere busshastighet, men ytelsen forringer jo langsommere busshastigheten er. Alt ned til x16 1,1 og dets ekvivalenter (x8 2,0, x4 3,0) gir tilstrekkelig spillytelse selv med den nyeste grafikkmaskinvaren, og mister bare 5% gjennomsnittlig i verste fall. [vektlegging lagt til] Bare ved enda lavere hastigheter ser vi drastiske framerate tap, noe som vil garantere handling. »

Den mest interessante delen i disse resultatene er funnet at fjorarets kraftigste grafikkort utforer helt fint pa PCIe 2.0 x8 eller til og med PCIe 3.0 x4. Det betyr at treveis SLI eller CrossFireX burde v re levedyktig, selv i x8 / x4 / x4, pa Ivy Bridge eller Haswell-stasjon re datamaskiner. Men selv om du ikke har PCIe 3.0, mangler du ikke mye ytelse som kjorer pa x8 pa en PCIe 2.0-tilkobling.

Den doble bandbredden til PCIe 3.0 x16, sammenlignet med PCIe 2.0, synes ikke a gjore mye av en forskjell enna. AnandTechs Ryan Smith testet to Nvidia GeForce GTX Titans, den nav rende raskeste single-GPU-korten, i SLI pa bade PCIe 3.0 og 2.0, og fant i beste fall en forbedring pa syv prosent ved 5760 x 1200.

Sa det er gode nyheter for folk med eldre hovedkort eller grafikkort. Forutsatt at du har minst PCI Express 2.0 x8, forlater du neppe noen ytelse pa bordet, selv pa de raskeste kortene.

Lyn.

Thunderbolt er et dataoverforingsgrensesnitt som kan passere gjennom bade PCI Express og DisplayPort-signaler, avhengig av hva det er plugget inn. En Thunderbolt-kontroller bestar av to toveisdatakanaler, hvor hver kanal inneholder en inngang og en utgangsside. Thunderbolt-sjetongene pa hver ende av kabelen tar i bade DisplayPort 1.1a og en fire-lane PCIe 2.0-buss. Hver kanal er uavhengig, og kan enten b re DisplayPort eller PCIe, men ikke begge. Hver retning i hver kanal har en teoretisk maksimal gjennomstromning pa 10 Gbps – det samme som to PCIe 2.0-baner. Som diskutert ovenfor, pa grunn av 8b / 10b koding, er 20 prosent av den teoretiske grensen for PCI Express 2.0 viet til signaloverhead, sa den maksimale teoretiske gjennomforingen av en enkelt Thunderbolt-kanal er 1 GB / s i hver retning. I forste generasjons Thunderbolt, det er sa fort som du skal fa, siden hver enhet kun har tilgang til en av de to kanalene, og du kan ikke kombinere dem. Det er fortsatt ganske j vla fort, siden du kan sende high-def-video til en DisplayPort-skjerm ved 10 Gbps ned en kanal mens du leser 1 GB / s fra en SSD RAID med den andre samtidig.

Sa hvor mye ytelse kan du faktisk vri ut av en Thunderbolt-forbindelse?

Gordon Ung ved maksimal PC-saw topplest overforingshastighet pa 931MB / s nar du leser fra en RAID 0 av fire 240GB SandForce SF-2281 SSDer i et Pegasus R4-chassis.

AnandTech fikk faktisk SSD RAID i et Pegasus-chassis helt opp til 1002 MB / s i sin topp, som synes a ligge oppe pa den praktiske grensen til en enkelt Thunderbolt-kanal, men det brukte en RAID 0 av fire 128 GB 6 GB SATA SSD , kjorer vedvarende 2 MB leser pa et kodybde pa 10.

En fire-veis RAID 0 av SSDs kommer til a v re for rask til en forste-generasjon Thunderbolt-tilkobling. En to-stasjons RAID 0 kan n rme seg to ganger hastigheten pa de enkelte stasjonene. Som vi diskuterte i forste del, kan en god 6Gbps SATA SSD treffe 515MB / s. En RAID 0 av to 6Gbps SSD-er kan lett metne 10Gbps-tilkoblingen tilgjengelig i First Gen Thunderbolt. En 4-veis RAID 0 kan ga langt raskere, men ikke samtidig festet via Thunderbolt.

En veldig kort notat om PCIe SSD-ytelse (sammenlignet med Thunderbolt)

Til tross for begrensningene til forste generasjon Thunderbolt, er det fortsatt et langt bedre eksternt lagringsgrensesnitt enn USB 3.0.

OCZ RevoDrive 3 x2, en PCIe-vedlagt SSD, kan treffe 1,5 GB / s topp i noen sekventielle lesetester pa en PCIe 2.0 x4-tilkobling. Den stasjonen bruker en SAS-to-PCIe-kontroller, i stedet for en SATA-kontroller til et RAID-kort til en PCIe-tilkobling, men det kan sikkert ikke forklare hele hastighetsforskjellen. Tross alt er Thunderbolt en PCIe 2.0 x4-tilkobling ogsa, ikke sant? Pa en mate. Hver Thunderbolt-lagringsenhet er begrenset til en kanal med en maksimal bandbredde pa 1 GB / s. RevoDrive 3 x2 kan bruke hele PCIe x4-tilkoblingen, med topp-bandbredde pa nesten 2 GB / s.

The Next Thunderbolt.

Den neste versjonen av Thunderbolt, som er smart kalt Thunderbolt 2, lar deg kombinere begge kanalene til en, med en teoretisk maksimal 20Gbps (2GB / s, postkoding), slik at enheter kan benytte alle fire PCIe 2.0-banene i Thunderbolt-tilkoblingen . Det gir ogsa okt bandbredde til skjermsiden av ting; Du kan streame 4K-video til den fancy 4K-skjermen du har ligget rundt. Sa langt er Thunderbolt 2 bare tilgjengelig pa et par hovedkort fra Asus, men det kommer ogsa til a sende pa den nye Mac Pro, om og nar den vakre, rar-ass-sylinderen noen gang kommer fra One Infinite Loop.

Til tross for begrensningene til forste generasjon Thunderbolt er det fortsatt et langt bedre eksternt lagringsgrensesnitt enn USB 3.0, som i beste fall bare er halvparten av hastigheten pa en forste-gen Thunderbolt-tilkobling (5 Gbps maksimal) og i det virkelige liv, som vi sa sist , slar ikke hvor som helst n r sin maksimale teoretiske gjennomstromning.

Top

Hei! Ønsker du å spille i det største kasinoet? Vi fant det for deg. Prøv her nå!