همه چیز دربارهی PCI Express 3.0 و 2.0، چه تفاوتی در سرعت کارت گرافیک ایجاد میشود؟ (بخش سوم)
توجه شما را به بخشهای دیگر این مطلب جلب مینماییم:
آمار و ارقام نسخهی 3.0 و مقایسه با PCI Express 2.0
در بخشهای قبلی به معرفی PCI Express و بررسی پهنای باند نسخههای گوناگون و اسلاتهای مختلف پرداختیم. در این بخش میخواهیم تفاوت عملکرد کارت گرافیکهای رده اول امروزی را مورد بررسی قرار دهیم و ببینیم اگر کارت گرافیکی با واسط PCI Express Gen 3.0 را در نسخهی دوم اسلات PCIe قرار دهیم، چه اتفاقی میافتد و چند درصد از توان واقعی کارت گرافیک هدر میرود. این سوالی است که اکثر کاربرانی که مادربوردهای قدیمیتر دارند و میخواهند برای اجرای بازیهای امروزی، بدون ارتقای پردازنده، مادربورد و رم، به نتیجهی مطلوب برسند، پیش میآید.
در ابتدا تکرار میکنیم که پهنای باند اسلات 16 مسیرهی PCIe 3.0 حدود 16 گیگابایت بر ثانیه است که نسبت به رکورد 8 گیگابایت بر ثانیهای نسخهی دوم، دو برابر بیشتر است. به بیان دیگر اگر PCIe 3.0 را به صورت 8 مسیره استفاده کنیم، پهنای باند برابر با PCIe 2.0 در حالت 16 مسیره خواهد بود. به جدول زیر توجه کنید:
پهنای باند اسلات PCI در حالت x16 و x8 | ||
نسخه | پهنای باند x8 (گیگابایت در ثانیه) | پهنای باند x16 (گیگابایت در ثانیه) |
PCIe 1.x | 2 | 4 |
PCIe 2.x | 4 | 8 |
PCIe 3.x | 7.87 | 15.75 |
PCIe 4.x | 15.77 | 31.51 |
نکتهی بسیار مهمی که بعداً مفصلاً در مقالهی دیگری به آن میپردازیم این است که اسلات واقعاً به صورت x16 فعالیت کند و نه به شکل x8 و پایینتر. محدودیت مادربورد، چیپست و پردازنده ممکن است به کاهش تعداد مسیرها بیانجامد، اما در بررسی ما، تنها یک کارت گرافیک برای آزمودن کاهش عملکرد مورد استفاده قرار میگیرد.
سختافزار و نرمافزار برای شروع بنچمارکها
سراغ سختافزار تست زومیت میرویم که مشخصاتی به شرح زیر دارد:
مشخصات نرمافزاری و سختافزاری سیستم تست | |
سیستم عامل | ویندوز 8.1 ویرایش 64 بیتی |
درایور کارت گرافیک | کاتالیست 14.4 |
مادربورد و چیپست | Z97: گیگابایت Z97X-UD7 TH LGA1150 - گارانتی آواژنگ |
کارت گرافیک | گیگابایت R9 290X WindForce 3X OC - گارانتی آواژنگ |
پردازنده | هسول Core i5-4570: سرعت کلاک 3.6 گیگاهرتز |
رم | ایدیتا XPG Gaming V2، سرعت 2400 مگاهرتز و تایمینگ CL11 -گارانتی آونگ |
فضای ذخیرهسازی | دیسک حالت جامد ایدیتا SX900 128 GB - گارانتی آونگ |
پاور | گرین 1275 وات، 80 پلاس پلاتینیوم |
مانیتور | الجی 1080p W2261vp |
تغییر لینک PCI Express در بایوس مادربورد انجام میشود و با توجه به اینکه R9 290x در حال حاضر یکی از سریعترین کارت گرافیکهای تکهستهای بازار است، تأثیر PCI Express 30 و پهنای باند دو برابری آن، بیش از مدلهای معمولی خواهد بود.
عکس کارت گرافیک گیگابایت R9 290X
بنچمارک با Crysis 3
کرایسیس 3 نمایشی از قدرت موتور گرافیکی CryEngine 3 است.
فقط بخش دوم تست که قسمتی از مرحلهی Root of All Evil را برای تست اجرا میکنیم. در این صحنه نورپردازی ذرات، سایهها، تسلیشن گیاهان و پردازش فیزیک حرکات، همگی دست به دست هم دادهاند تا کارت گرافیکها را به زانو درآورند.
آنتیالیاسینگ به صورت MSAA 4X و تنظیمات در بالاترین حالت ممکن هستند
با تغییر Gen 3 به Gen 2 سرعت اجرای بازی کمی تغییر میکند.
جالب است که نسخهی سوم نه تنها سرعت را افزایش نداده بلکه حدود 2 درصد کاهش هم ایجاد کرده است!
بنچمارک با 3DMark 2013
به جای گرفتن بنچمارک تکتک بازیهای سنگین امروزی، به 3DMark سری میزنیم تا یک بررسی کلی داشته باشیم. البته مجموعهی 3DMark تستهای متنوعی را در خود جای داده ولیکن با توجه به سنگین بودن بازیهای نسل جدید، فقط آزمون Firestrike Extreme را به عنوان ملاک ارزیابی در نظر گرفتهایم.
نتیجه با استفاده از Gen 2.0 و Gen 3.0 به ترتیب زیر است. با PCI Express 2.0:
با PCI Express 3.0:
و اما مقایسهی کلی تمام بخشهای 3DMark 2013 به صورت زیر خواهد بود:
سختافزار و نرمافزار برای دومین آزمون
موضوع به مادربورد باکیفیت گیگابایت مربوط نمیشود. سختافزارهای دیگر هم ممکن است همین نتیجه را تأیید کنند. بنابراین با یک سیستم دیگر بررسی میکنیم.
سختافزار و نرمافزار استفاده شده در این آزمون به شرح زیر است:
مشخصات نرمافزاری و سختافزاری دومین سیستم تست | |
سیستم عامل | ویندوز 8.1 پرو، ویرایش 64 بیتی |
درایور کارت گرافیک | جیفورس 337.88 (نسخه نهایی) |
مادربورد | Z87: ایسوس Z87 ماکسیموس 6 هیرو |
کارت گرافیک | ایسوس GTX 770 DirectCU II |
پردازنده | هسول Core i5 4670K اورکلاک شده به 4.2 گیگاهرتز |
فضای ذخیرهسازی | دیسک حالت جامد کینگستون، HyperX 3K 240 GB |
مانیتور | ایسوس ML229 IPS |
پاور | تاپپاور Twister ADJ، مدل 1100 وات |
بنچمارک در Crysis 3
در دو حالت اصلی، از تنظیمات پیشرفتهی PCIe برای کاهش مصرف انرژی استفاده شده است، این دو حالت با عنوان Optimized در تمامی نمودارها تمیز داده میشوند:
چرا ممکن است سرعت کاهش یابد؟
قبل از هر چیز به تنظیمات مادربورد رجوع کرده و صحت تنظیمات را بررسی میکنیم. گیگابایت و چیپست Z97 تضمینکنندهی کیفیت سختافزار و نرمافزار (بایوس) هستند اما به هر حال سازندگان بزرگ هم برای بهترین مادربوردهای خود، بستههای بروزرسانی نرمافزاری که شامل درایورها و بایوس است، عرضه میکنند. لذا ممکن است مشکل به مادربورد و بایوس مربوط شود.
پس از چک کردن تنظیمات، با اجرای Furmark به بررسی سرعت لینک PCI Express پرداختیم.
در بخش قبلی این مقاله سرعت نسخهی سوم و دوم به ترتیب 8 و 5 گیگاهرتز یا GT/s ذکر شده بود. بنابراین هنگام اجرای Furmark انتظار داریم لینک ارتباطی PCIe 3.0 در یک ثانیه 8 میلیارد عمل انتقال داده انجام دهد. در حالتی که در بایوس نسخهی دوم PCIe را انتخاب کرده باشیم هم به سرعت 5 گیگاهرتزی امیدوار هستیم.
بررسی سرعت لینک PCIe
نتیجه را با هم ببینیم، توجه کنید که از HWiNFO برای بررسی سرعت لینک PCIe استفاده شده است. برای بزرگنمایی عکسهای کوچک روی آن کلیک کنید:
نکتهی جالب توجه، حالت بیکار سیستم است که سرعت لینک به صورت خودکار به 2.5 گیگاهرتز که همان سرعت نسخهی اول PCI Express است، تقلیل مییابد تا مصرف انرژی بهینه شود.
همین نکته ما را به پاسخ نزدیک میکند. چرایی کمتر بودن سرعت اجرای بازیهای سنگین به فعال یا غیرفعال بودن تنظیمات مربوط به کاهش مصرف انرژی مرتبط میشود. بنابراین توان مصرفی و سرعت اجرا را به صورت دقیقتر بررسی میکنیم.
بررسی توان مصرفی مجموعهی سختافزار و R9 290X
سراغ سیستم بنچمارک زومیت میرویم و توان مصرف مجموعهی سختافزار را بررسی میکنیم.
در بهینهسازی PCI Express آنچه مهم است، افزایش بازدهی است. منظور از بازدهی این است که به ازای هر وات مصرف انرژی، چه سرعتی حاصل میشود. بنابراین بازدهی را با تقسیم سرعت اجرا بر توان مصرفی محاسبه میکنیم. نتیجهی مشخص میکند که برای رندر شدن یک فریم تصویر به طور متوسط چند ژول انرژی لازم است.
توان مصرفی مجموعه سختافزار:
در دو تصویر زیر توان VDDC کارت گرافیک را مشاهده میکنید. نکتهی جالب توجه در این دو تصویر این است که با استفاده از PCI Express 3.0 نه تنها توان مصرفی حدود 17 وات کاهش یافته بلکه ولتاژ هسته و بالطبع فرکانس کاری آن هم کاهش یافته است.
بنابراین توان، سرعت هسته و سرعت اجرای متوسط به صورت زیر است:
جالب این است که با وجود کاهش سرعت هسته حین اجرای Furmark، سرعت متوسط اجرای این آزمون ثابت باقی مانده است. موضوع این است که Furmark تنها به عنوان بنچمارکی جهت تعیین میزان مصرف انرژی کاربرد دارد و با فشار آوردن روی تمام بخشهای کارت گرافیک، توان مصرفی را به حداکثر میرساند. اما در بازیهای سنگین امروزی، تمام بخشهای کارت گرافیک به صورت کامل فعالیت نمیکنند.
نتیجهی محاسبهی بازدهی را باهم ببینیم:
بررسی توان مصرفی کارت گرافیک GTX 770
توان مصرفی کارت گرافیک به صورت درصدی از TDP در نرمافزار GPU-Z ارایه شده و نمودار بعدی، نشاندهنده آن است:
جالب توجهترین موضوعی که از بررسی دو نمودار فوق به آن میرسیم، بیشتر شدن سرعت اجرا همگام با افزایش توان مصرفی است. با توجه به اینکه PCI Express 3.0 و 2.0 از نظر تأمین پهنای باند مورد نیاز، با مشکل خاصی روبرو نیستند، منطقی است که با مصرف انرژی بیشتر، سرعت اجرا در حد بسیار کمی افزایش داشته باشد.
نکتهی جالب دیگر، پیشرفت نسخهی سوم از نظر بهینهسازی مصرف انرژی است. از بررسی نمودار آخر به این مهم میرسیم که Gen 3.0 در حالت عادی بیشتر از Gen 2.0 بهینه شده، انرژی مصرف میکند ولیکن با فعال کردن تنظیمات بهینهسازی مصرف انرژی در Gen 3.0، توان مصرفی آن کمتر از حالت بهینهی نسخهی دوم میشود.
نگاهی به دیگر بررسیها و بازیها
Crysis 3 را انتخاب کردیم و آن را در کنار 3DMark Fire Strike Extreme قرار دادیم به این علت که هر دو از سنگینترین آزمونهای سختافزاری هستند و علاوه بر پردازندهی گرافیکی، پردازندهی اصلی را هم به خوبی درگیر میکنند. ممکن است برخی بازیها از نسخهی سوم PCI Express استفادهی لازم را ببرند و افزایش سرعت چند درصدی را شاهد باشیم.
نتیجهی آزمون hardware canucks که با کارت گرافیک دو هستهای و قدرتمند GTX 690 انجام شده، تفاوت بسیار کم سرعت را در بیشتر بازیها نشان میدهد:
بررسی pugetsystems با موتور گرافیکی Unigine Heaven 4.0 که از جذابترین موتورهای گرافیکی حال حاضر است هم نشان از برتری نامحسوس PCIe 2.0 دارد و جالب است که در پلتفرم اکستریم X79، کاهش تعداد مسیرها از 16 عدد به 8 عدد، افزایش سرعت را به همراه داشته است:
نتیجهگیری
پاسخ این سوال که آیا PCI Express 3.0 در افزایش سرعت اجرای بازیهای فعلی، اثری دارد یا نه و اگر اثر دارد، چند درصد سرعت اجرای بازی را افزایش میدهد به طور خلاصه این است:
نسخه سوم PCI Express در حال حاضر ممکن است سرعت اجرای برخی بازیها را کم و برخی را بیشتر کند اما تفاوت زیر 3 درصد است. بازدهی نسخهی سوم در حد کمی بالاتر از نسخهی دوم است
لذا به راحتی میتوان با مادربوردها و پردازندههای رده متوسط که شاید 3 سال از کارکردشان گذشته است هم به اجرای روان بازیهای سنگین پرداخت. آنچه نیاز است، یک کارت گرافیک رده اول است و اینکه واسط آن PCI Express 3.0 باشد اما مادربورد چنین اسلاتی را نداشته باشد، موضوع مهمی نیست و نهایتاً 3 درصد روی سرعت اجرای بازی موثر است. گاهاً موضوع برعکس هم میشود و در عمل سرعت نسخهی دوم بالاتر به دست میآید که با مصرف توان بیشتر ممکن شده است.
بد نیست موضوع کارایی و بازدهی دو کارت گرافیک GTX 770 OC و R9 290X OC در بازی Crysis 3 را یکبار دیگر مرور کنیم:
در پایان باید ذکر کنیم که اگر مادربورد حرفهای با تنظیمات کامل و پیشرفته دارید، در منوهای بایوس به دنبال گزینهی انتخاب نسخهی PCIe باشید. مثلاً در ماکسیموس هیرو 6 ایسوس مسیر زیر تنظیمات لازم را در اختیار کاربر میگذارد:
اگر مادربورد شما از چیپستهای رده اول برخوردار است ولی چنین گزینهای را در بایوس پیدا نمیکنید، بهتر است به جستوجو در اینترنت پرداخته و پاسخ سوالات خود را پیدا کنید.
ادامه مطلب http://www.zoomit.ir/articles/hardware/12315-pci-pcie-agp-description-compare-card-slot-performance