پس از فاش شدن اطلاعاتی از پلی استیشن جدید و معرفی کنسول بعدی مایکروسافت در E3 2016 بود که بازار اخبار و گمانه زنی در مورد مقایسات و برتریهای احتمالی هر یک داغ شد. اما معیار پر تکرار ترافلاپس در این میان چیست و چه نقشی دارد؟
مدتها پیش از این وقتی که اولین مشخصات پلی استیشن 4 و ایکس باکس وان به بیرون درز کرد، در یک مقایسهی کلی تفاوت بارزی میان راندمان گرافیکی این دو کنسول محرز و برجسته شد. کنسول مایکروسافت –دست کم در ابتدا و قبل از بهینه سازیهای نهایی دارای ۱.۲۳ تِرافِلاپس (Teraflops) توان پردازشگر گرافیکی بود، در حالی که ماشین سونی با ۱.۸۴ ترافلاپس به میزان قابل توجهی جلوتر قرار داشت. دستِ کم روی کاغذ این تفاوت بسیار فاحش و با فاصله دیده میشد. با این اوصاف حتی قبل از این که اصلا کنسولی به فروش رسیده باشد، مایکروسافت به نظر به دردسر افتاده بود. آمار و ارقام ابتدایی برآورد میکردند که پلیاستیشن 4 به میزان ۵۰ درصد توان گرافیکی بیشتری نسبت به ایکسباکس وان دارد، یک معیار فوق العاده مهم برای گیمرها که مشتاق هستند تا ببینند نسل بعدی کنسولها قویترین سخت افزار ممکن را عرضه میکنند.
حالا به نظر میرسد که جایگاه برخورداری از مشخصات برتر با رونمایی از محصولات بعدی دچار دگرگونی شده است. پلی استیشن 4K Neo فعلا به صورت غیر رسمی ۴.۲ ترافلاپس توان دارد، در حالی که Project Scorpio، کنسول بعدی مایکروسافت آن را به حدود ۶ ترافلاپس ارتقا داده است، ارتقایی که نشانگرِ ۴۳ درصد برتری است. البته تمام این پیشرفتها فوق العاده و خوشحال کننده هستند، اما سوال این است که ترافلاپس چیست و تا چه حدی این تفاوت فاحش میان مشخصاتِ کنسولها نشان دهندهی تفاوت راندمان واقعی و سرانجام تفاوت تجربه در گیم پلی بازیهای هر یک از این کنسولها خواهد بود؟
در سطح پایه، یک ‘فلاپ’ یک عملیات اعشاری و واحد بنیادی توان محاسباتی است. وقتی که این معیار به فناوری گرافیکی AMD در قلب کنسولِ مایکروسافت و سونی اِعمال میشود، محاسبه بسیار ساده به نظر میرسد. میتوانید تعداد هستههای سایه زن یا پردازشگرهای گرافیکی را در فرکانسِ کاری یا کلاکِ GPU ضرب کنید. در سخت افزارِ AMD در هر CU (مخفف Compute Unit) تعداد ۶۴ واحد سایه زن تعبیه شده است و با این حساب کنسول مایکروسافت که ۱۲ واحد CU دارد باید تعداد کلِ ۷۶۸ هستهی سایه زن و کنسول سونی که ۱۸ واحد CU دارد باید ۱۱۵۲ سایه زن را داشته باشد. فرکانس کاری این دو کنسول نیز به ترتیب ۸۵۳ و ۸۰۰ مگاهرتز هستند.
دانلود با رزولوشن 360p | دانلود با رزولوشن 720p
همان طور که میبینید محاسبهی سادهای است، اما باید در آخر نتیجه را در ۲ ضرب کنیم، به این دلیل که در هر کلاک (تناوبِ فرکانسی) دو دستور متفاوت (یکی ضرب و یکی عملیات جمع) به صورت همزمان اجرا میشوند. نتایجِ حاصل معمولا اعداد بسیار بزرگی هستند و همانند محاسبات مربوط به ظرفیت فضای ذخیره سازی روی هارد دیسکها باید به شکل قابل درکی تبدیل شوند. بنابراین مقدار نهایی را به عدد یک میلیون تقسیم میکنیم تا بر حسب ترافلاپس بدست آید.
در اینجا محاسبهی مربوط به ایکسباکس وان و PlayStation 4 و همین طور محاسبه بر اساس مشخصات درز شده از PlayStation Neo را میبینید:
- ایکسباکس وان:768 shaders * 853MHz * 2 instructions per clock = 1,310,208 megaflops/1.31TF
- PlayStation 4:1280 shaders * 800MHz * 2 instructions per clock = 1,843,200 megaflops/1.84TF
- Neo:2304 shaders * 911MHz* 2 instructions per clock = 4,197,888 megaflops/4.2TF
مایکروسافت قبلا فاش کرده که کنسول جدید Project Scorpio دارای هستهی گرافیکی با توان محاسباتی حدود ۶ ترافلاپس خواهد بود، اما به جز این اطلاعات ناچیزی که از مشخصات تراشهی گرافیکی آن در دست داریم، فعلا اطلاعات دیگری در مورد آن منتشر نشده است. بنابراین فقط آخرین بخشِ این معادله مشخص است و اطلاعاتی در مورد فرکانس کاری یا تعداد هستههای سایه زن در دست نیست. در اینجا سعی میکنیم ترکیبی از دانستههای فعلی درمورد طراحی کنسولها را با مشخصات درز شده از تراشهی گرافیکی آیندهی AMD با نام وِگا ترکیب کنیم تا بهترین تخمینها در مورد سخت افزارِ جدید مایکروسافت حاصل شود.
سناریوی اول:
3584 shaders * 840MHz * 2 instructions per clock = 6,021,120 megaflops/6.02TF
سناریوی دوم:
3840 shaders * 800MHz * 2 instructions per clock = 6,144,000 megaflops/6.13TF
تصورِ ما این است که فرکانس کاری اسکورپیو پایینتر باشد، چون به نظر میرسد پردازندهاش به میزان قابل توجهی بزرگتر از کنسول PlayStation Neo باشد (تراشههای بزرگتر حرارت بیشتری تولید میکنند و عموما در فرکانسِ پایینتری تنظیم میشوند). همچنین برآورد میکنیم که مایکروسافت از معماری جدید رادئون Vega در اسکورپیو استفاده خواهد کرد، تراشهی رده بالایی که توسط اخبار فاش شده قرار است دارای ۶۴ واحد CU یا ۴۰۹۶ پردازشگر سایه زن باشد. از طرفی هم دستیابی به ۶ ترافلاپس توان با استفاده از فناوری پولاریس فعلی به مانند آنچه که در پلی استیشن نئو بکار رفته، نیازمند فرکانس کاری بسیار بالایی خواهد بود و به همین دلیل گمانه زنی ما در مورد استفاده از معماری وگا بیشتر تقویت میشود:
سناریوری سوم:
2304 shaders x 1302MHz x 2 instructions per clock = 5,999,616 megaflops/6TF
در واقع با این محاسبه، پردازندهی ما باید فرکانسی حتی بالاتر از تراشهی اصلی کارت RX 480 روی پیسی داشته باشد، اتفاقی که بعید است رخ دهد. به طور خلاصه با یک نسخهی تقلیل یافته از معماری Vega مواجه خواهیم بود، مگر اینکه مایکروسافت به یک تراشهی نسلِ بعدی ایامدی که در نقشهی راه Radeon وجود ندارد دسترسی داشته باشد.
دانلود با رزولوشن 360p | دانلود با رزولوشن 720p
ترافلاپ تا چه حدی راندمان سیستم را تعیین میکند؟
ترافلاپ مبنای ابتدایی اندازه گیری توان محاسباتی به شمار میرود و از بقیهی ابعاد طراحی GPU (واحد پردازش گرافیکی) مجزا و متمایز است. مثلا GCN (مخفف Graphic Core Next)، معماری مشهورِ ایامدی، همیشه در توانِ محاسباتی خام نسبت به همردههایش از انویدیا برتری داشته است و همین مورد توضیح میدهد که چرا کارتهای گرافیک رادئون ایامدی در اوجِ دوران شیوع عملیات استخراج پول الکترونیکی (Bitcoin mining) اینقدر خوب عمل کردند. با این حال مهم است که تاکید کنیم این موضوع لزوما به معنی راندمانِ بهتر در بازیها نیست.
نمونهی خوبی در این مورد مقایسهی کارت جدید GTX 1080 از انویدیا با توان ۹ ترافلاپس در برابر کارت گرافیک R9 Fury X با توان ۸.۶ ترافلاپس است. تنها با در نظر گرفتن توانِ ترافلاپس میتوانید انتظار این را داشته باشید که هر دو کارت گرافیکی راندمان بسیار مشابهای را در اختیار گذارند؛ اما همان گونه که بنچمارک مقایسهی راندمان رزولوشن 4K در پایین نشان میدهد، کارت GTX 1080 فقط مقدار ناچیزی سریعتر نیست، بلکه در تمام موارد به جز یکی بسیار سریعتر است. در واقع حتی کارت کندتر GTX 1070 با میزان ۶.۵ ترافلاپس هم به راحتی و با فاصله Fury X را در بسیاری بازیها از میدانِ رقابت به در میکند. به علاوه، به لحاظ ترافلاپس، GTX 1070 حتی بعد از کارت دیگر خود انویدیا با نام تایتان ایکس با توان ۷ ترافلاپسی قرار میگیرد و در اینجا هم یا با آن برابری کرده یا آن را شکست داده است.
درایور- نرم افزاری که به سخت افزار قدرت میبخشد- هم اهمیت دارد، اما حیاتیتر از آن خود طراحی معماری گرافیکی است، بدون در نظر گرفتن جنبههای دیگر سخت افزار مانند پهنای باند حافظه و میزان حافظهی کش داخل تراشه در سطوح مختلف. با این حال مقایسه بین قطعات کنسول میتواند به میزان زیادی تعیین کننده باشد، به دو دلیل: یکی این که اجزای پیرامونی تراشههای گرافیکی همگام با نیاز به راندمان پردازشی خودشان ارتقا پیدا میکنند و دوم این که هم تراشهی پلیاستیشن 4 و هم ایکسباکس وان از یک خانواده میآیند و مشترکات بسیار مشابهای در طراحی خود دارند.
دانلود با رزولوشن 360p | دانلود با رزولوشن 720p
GTX 1080 | GTX 1070 | Titan X | R9 Fury X | 3840×2160 (4K) |
32.5 | 25.4 | 25.6 | 22.6 | Assassin’s Creed Unity, Ultra High, FXAA |
53.3 | 43.1 | 40.9 | 49 | Ashes of the Singularity, Extreme, 0x MSAA, DX12 |
40.1 | 31.5 | 31.3 | 31.4 | Crysis 3, Very High, SMAA T2x |
37.3 | 31 | 30.7 | 31.1 | The Division, Ultra, SMAA |
42.4 | 33.5 | 33.5 | 34.5 | Far Cry Primal, Ultra, SMAA |
45.8 | 35.6 | 35.9 | 29.6 | Rise of the Tomb Raider, Ultra, SMAA, DX12 |
43.7 | 37.3 | 34 | 32.8 | The Witcher 3, Ultra, Post AA, No HairWorks |
38.5 | 33.6 | 29.8 | 20.9 | Project Cars, Ultra, SMAA |
با این اوصاف مقایسهی میان نسلی بین ایکسباکس وان با Scorpio از یک طرف و پلیاستیشن 4 با Neo از طرف دیگر ممکن است آنقدر هم دقیق و موثر نباشد. به بیان سادهتر، دو برابر شدن ترافلاپس به معنی دو برابر شدن نرخ فریم تولیدی نیست. دلایل بالقوهی زیادی برا آن وجود دارند اما به طور کلی، محدودیتهای پهنای باند حافظه یک عامل عمده در این جا است.
به عنوان نمونه کارت گرافیک R9 380X را در نظر بگیرید. این مدل یک نسخه از تراشهی Tonga با ۳۲ واحد کاملا فعال از واحدهای پردازشی یا CUهای آن است و وقتی که در برابر نسخهی تقلیل یافتهی R9 380 قرار میگیرد (مدلی که از همان تراشه استفاده کرده اما فقط ۲۸ واحدِ فعالِ CU دارد)، فقط حدود ۱۰ تا ۱۵ درصد افزایشِ راندمان را در نرخ فریم بازیها مشاهده میکنیم. این امر به جز واحدهای سایه زن بیشتر، با وجود فرکانس هستهی بالاتر و حافظهی سریعترِ این تراشهی گرافیکی رخ میدهد. اختلاف میان راندمان واقعی و توان ترافلاپس معین شده فقط زمانی افزایش مییابد که فاصله میان مشخصات تراشههای گرافیکی گسترش یابد. مایکروسافت بهترین کار ممکن را با Scorpio میکند و تراشهی ۶ ترافلاپسیش را با حافظهای که ۳۲۰ گیگابایت بر ثانیه پهنای باند دارد مجهز خواهد کرد، میزانی که در مدل Neo به ۲۱۸ گیگابایت بر ثانیه بالغ خواهد شد.
اختلاف میان ترافلاپس و راندمان داخل بازی تا حدودی میان پلیاستیشن 4 و ایکسباکس وان هم مشاهد شده است. بنچمارکهای خطی برای سنجش راندمان گرافیکی کنسولها تقریبا وجود خارجی ندارند و بازیها را بیشتر با قفلِ فریم عرضه میکنند. به علاوه بازیسازان هم گزینههای کیفی در بخشهای متعدد پردازش گرافیک یا رزولوشن اصلی اجرای بازی را به نحوی تنظیم میکنند که راندمان به هدفشان نزدیکتر باشد و ثبات بیشتری داشته باشد. اما استثناهایی هم مانند بازی هیتمن ساختهی شرکت Io Interactive وجود دارد. به نظر میرسد که این بازی روی هر دو کنسول با رزولوشن مشابهی 1080p اجرا میشود و کیفیت بصری یکسانی هم دارد، به علاوهی این که قفل فریم هم ندارد. بنابراین میتوان گفت شرایطی بسیار شبیه به یک بنچمارک ایدهآل دارد.
دانلود با رزولوشن 360p | دانلود با رزولوشن 720p
نتیجهی نهایی این است که در صحنههایی از بازی که GPU اولین عامل محدود کنندهی راندمان باشد ، پلی استیشن 4 به میزان ۳۰ درصد راندمان بیشتری دارد، با وجود این که میدانیم حدود ۴۰ درصد هم مزیت برتری توان پردازش دارد (۱.۸۴ ترافلاپس در مقابل ۱.۳۱ ترافلاپس)، حتی اگر برتری آن را در پهنای باند حافظه هم محاسبه نکنیم (بستگی دارد که شرکت IO چگونه از حافظهی یکپارچهی ESRAM در ایکسباکس وان استفاده کرده باشد). اما نکته این است که هیتمن در برخی سناریوها در واقع میتواند روی ایکسباکس وان سریعتر از پلیاستیشن 4 هم اجرا شود، مسالهای که ما را به مبحث بعدی رهنمون میکند.
توان پردازنده هم میتواند راندمان بازی را محدود کند
Hitman نمونهی جالبی است از اینکه چگونه راندمان بازی همانند محدودیتی که به توان GPU دارد، میتواند به پردازنده هم محدود باشد. مرحلهی پاریس در این بازی از نظر تعداد کاراکترهای غیر قابل بازی (NPC) غنی است، کاراکترهایی که به جز پردازش انیمیشنهایشان، نیاز است رفتارشان هم شبیه سازی شود. این کار بیشتر برای CPU مناسب است و هر دو کنسول پلیاستیشن 4 و ایکسباکس وان هم از پردازندههای نسبتا ضعیف AMD با هستههای Jaguar استفاده میکنند، معماریی که در اصل برای تراشههای موبایل ساخته شده بود. برای جبران راندمان ضعیف، هر دو پلتفرم از تعداد هستههای دو برابر استفاده کردهاند که صادقانه باید گفت بیهوده بوده است. تفاوتی که وجود دارد این است که کنسول مایکروسافت پردازنده را روی فرکانس ۱.۷۵ گیگاهرتز فعال کرده، در حالی که سونی فرکانس ۱.۶ گیگاهرتز را انتخاب کرده است و این برتری ۹.۴ درصدی را نشان میدهد که در واقع در برخی صحنههای بازی هیتمن هم قابل تشخیص است.
سونی تلاش کرده که این مشکل را با Neo برطرف کند. به نظر میرسد که فناوری نسل بعدی پردازندههای AMD با نام Zen هنوز برای یکپارچه سازی با تراشهی گرافیکی در یک تراشه و یک بستر آماده نباشد، بنابراین دارندهی این پلتفرم بهترین کارِ جایگزین را انجام داده است; همان ۸ هستهی فعلی را با فرکانس کاری بالاتر (۲.۱ گیگاهرتز در Neo در برابر ۱.۶ گیگاهرتز در پلیاستیشن 4) در نظر گرفته است که ۳۱.۳ درصد افزایش دارد. هنوز دقیقا نمیدانیم Project Scorpio چه معماری پردازندهای را استفاده میکند، اما بر اساس برآوردهای متعادل، احتمال زیادی وجود دارد که مایکروسافت هم استراتژی مشابهی در پیش گیرد و همین هستههای جاگوار یا یکی از گونههای آن را را با فرکانس کاری بالاتر به خدمت بگیرد.
این ابتداییترین نگرانی ما در رابطه با Neo و Scorpio تلقی میشود: افزایش بنیادی در توان گرافیکی با واحدهای گرافیکی قویتر و ترافلاپس بالاتری که با همان اندازه از افزایش در توان پردازندهی اصلی همراه نیست. این امر توضیح میدهد که چرا جدیدا تمرکز روی رزولوشن 4K را بیشتر از تاکید روی نرخ فریم بالاتر –مثل گذار از ۳۰ فریم به ۶۰ فریم در ثانیه (موردی که بیشتر ترجیح میدهیم)- مشاهده میکنیم. چرا که چنین تغییری نیاز به استفادهی سنگینتر از CPU را هم به دنبال خواهد داشت. حداقل روی Neo که مشخصات آن را در اختیار داریم، نشانهای که حاکی از وجود راندمان پردازشی دو برابر از سمت CPU باشد را مشاهده نمیکنیم.
دانلود با رزولوشن 360p | دانلود با رزولوشن 720p
سخن آخر
هیچ ارتباط مستقیم و خطی بین راندمان داخل بازی با توان محاسباتی که با ترافلاپس اندازه گیری میشود وجود ندارد و در عین این که میتوان ایدهای از راندمان متناظر در تراشهی گرافیکی داشت، این قضیه فقط در مقایسه میان سخت افزارهای گرافیکی متفاوتی که معماری هستههای یکسان داشته باشند مصداق دارد. حتی در این صورت نیز وقتی که مثلا گفته میشود یک GPU حدود ۴۰ درصد بر دیگری برتری دارد به معنی آن نیست که به همین میزان اختلاف نرخ فریم تولید شده میان این دو وجود دارد. قابلیتهای یک تراشهی گرافیکی به عواملی بیش از توان محاسباتیِ صرف وابسته است و پهنای باند حافظه به طور خاص یک عامل تعیین کننده است.
با این حال مسالهای که مشخص شده این است که تراشهی ۱.۳ ترافلاپسی با ۱۲ واحد CU در ایکسباکس وان در مقابل تراشهی ۱.۸۴ فلاپسی با ۱۸ واحد CU در پلیاستیشن 4 ضعیفتر ظاهر شده است، شرایطی که اغلب با پهنای باند کمتر حافظهی کنسول مایکروسافتی تشدید میشود. به خاطر داشته باشید با وجود این تفاوت در مشخصات، توسعه دهندگانِ بازیها مقابلهی تحسین برانگیزی را برای ارائهی تجربهی یکسان در بسیاری از بازیهای چند پلتفرمی داشتهاند. بیشتر وجه تمایز هم در این میان مربوط به رزولوشن بازی (720p, 1080p) بوده که پلیاستیشن 4 علاوه بر برتری عمومی در این زمینه، نرخ فریم پایدارتری هم تولید کرده است.
تمام نشانهها به تفاوت مشخصات مشابه بین PlayStation 4K Neo و Project Scorpio دلالت دارند، با این تفاوت که این بار ورق به نفع مایکروسافت برگشته است. اما این که برتری در مشخصات چقدر به برتری در گیم پلی منتهی میشود را باید صبر کرد و دید.
به نظر میرسد که مایکروسافت خودش قصد دارد بازی در رزولوشن ذاتی 4K را هدف گیری کند. این استراتژی را سونی هم مدنظر گرفته، با این تفاوت که در اینجا ارتقا از رزولوشنهای پایینتر (Upscaling) احتمال بیشتری دارد. آیا مواجه شدن با سخت افزار قویترِ رقیب، سونی و در واقع توسعه دهندگان بازی را مجبور به بازنگری و هدفگذاری مجدد برای بهره گیری بیشتر ازتجربهی بازی در رزولوشن 1080p خواهد کرد یا خیر؟ همان گونه که قبلا اشاره کردیم، برای کنسولهای جدید گزینههای دیگری به جز استفاده از رزولوشنهای بالاتر هم وجود دارد. در هر صورت ناشران بزرگ بازی از کنسولهای جدید استقبال کردهاند و قطعا روند توسعه و پیشرفت فنی بازیها با ورود کنسولهای جدیدسرعت بیشتری خواهد یافت.
منبع: Eurogamer
اخبار - زومیت - زومیت...
ما را در سایت اخبار - زومیت - زومیت دنبال می کنید
برچسب : نویسنده : محمد رضا جوادیان zoomit بازدید : 216 تاريخ : سه شنبه 29 تير 1395 ساعت: 23:32