ترافلاپ چیست و چه تاثیری در قدرت پردازشی دارد؟

ساخت وبلاگ

پس از فاش شدن اطلاعاتی از پلی استیشن جدید و معرفی کنسول بعدی مایکروسافت در E3 2016 بود که بازار اخبار و گمانه زنی در مورد مقایسات و برتری‌های احتمالی هر یک داغ شد. اما معیار پر تکرار ترافلاپس در این میان چیست و چه نقشی دارد؟

مدت‌ها پیش از این وقتی که اولین مشخصات پلی استیشن 4 و ایکس باکس وان به بیرون درز کرد، در یک مقایسه‌ی کلی تفاوت بارزی میان راندمان گرافیکی این دو کنسول محرز و برجسته شد. کنسول مایکروسافت –دست کم در ابتدا و قبل از بهینه سازی‌های نهایی دارای ۱.۲۳ تِرافِلاپس (Teraflops) توان پردازشگر گرافیکی بود، در حالی که ماشین سونی با ۱.۸۴ ترافلاپس به میزان قابل توجهی جلوتر قرار داشت. دستِ کم  روی کاغذ این تفاوت بسیار فاحش و با فاصله دیده می‌شد. با این اوصاف حتی قبل از این که اصلا کنسولی به فروش رسیده باشد، مایکروسافت به نظر به دردسر افتاده بود. آمار و ارقام ابتدایی برآورد می‌کردند که پلی‌استیشن 4 به میزان ۵۰ درصد توان گرافیکی بیشتری نسبت به ایکس‌باکس وان دارد، یک معیار فوق العاده مهم برای گیمرها که مشتاق هستند تا ببینند نسل بعدی کنسول‌ها قوی‌ترین سخت افزار ممکن را عرضه می‌کنند.

حالا به نظر می‌رسد که جایگاه برخورداری از مشخصات برتر با رونمایی از محصولات بعدی دچار دگرگونی شده است. پلی استیشن 4K Neo فعلا به صورت غیر رسمی ۴.۲ ترافلاپس توان دارد، در حالی که Project Scorpio، کنسول بعدی مایکروسافت آن را به حدود ۶ ترافلاپس ارتقا داده است، ارتقایی که نشانگرِ ۴۳ درصد برتری است. البته تمام این پیشرفت‌ها فوق العاده و خوشحال کننده هستند، اما سوال این است که ترافلاپس چیست و تا چه حدی این تفاوت فاحش میان مشخصاتِ کنسول‌ها نشان دهنده‌ی تفاوت راندمان واقعی و سرانجام تفاوت تجربه در گیم پلی بازی‌های هر یک از این کنسول‌ها خواهد بود؟

در سطح پایه، یک ‘فلاپ’  یک عملیات اعشاری و واحد بنیادی توان محاسباتی است. وقتی که این معیار به فناوری گرافیکی AMD در قلب کنسولِ مایکروسافت و سونی اِعمال می‌شود، محاسبه بسیار ساده به نظر می‌رسد. می‌توانید تعداد هسته‌های سایه زن یا پردازشگرهای گرافیکی را در فرکانسِ کاری یا کلاکِ GPU ضرب کنید. در سخت افزارِ AMD در هر CU (مخفف Compute Unit) تعداد ۶۴ واحد سایه زن تعبیه شده است و با این حساب کنسول مایکروسافت که ۱۲ واحد CU دارد باید تعداد کلِ ۷۶۸ هسته‌ی سایه زن و کنسول سونی که ۱۸ واحد CU دارد باید ۱۱۵۲ سایه زن را داشته باشد. فرکانس کاری این دو کنسول نیز به ترتیب ۸۵۳ و ۸۰۰ مگاهرتز هستند.

دانلود با رزولوشن 360p | دانلود با رزولوشن 720p 

همان طور که می‌بینید محاسبه‌ی ساده‌ای است، اما باید در آخر نتیجه را در ۲ ضرب کنیم، به این دلیل که در هر کلاک (تناوبِ فرکانسی) دو دستور متفاوت (یکی ضرب و یکی عملیات جمع) به صورت همزمان اجرا می‌شوند. نتایجِ حاصل معمولا اعداد بسیار بزرگی هستند و همانند محاسبات مربوط به ظرفیت فضای ذخیره سازی روی هارد دیسک‌ها باید به شکل قابل درکی تبدیل شوند. بنابراین مقدار نهایی را به عدد یک میلیون تقسیم می‌کنیم تا بر حسب ترافلاپس بدست آید.

در اینجا محاسبه‌ی مربوط به ایکس‌باکس وان و PlayStation 4 و همین ‌طور محاسبه بر اساس مشخصات درز شده از PlayStation Neo را می‌بینید:

  • ایکس‌باکس وان:768 shaders * 853MHz * 2 instructions per clock = 1,310,208 megaflops/1.31TF
  • PlayStation 4:1280 shaders * 800MHz * 2 instructions per clock = 1,843,200 megaflops/1.84TF
  • Neo:2304 shaders * 911MHz* 2 instructions per clock = 4,197,888 megaflops/4.2TF

مایکروسافت قبلا فاش کرده که کنسول جدید Project Scorpio دارای هسته‌ی گرافیکی با توان محاسباتی حدود ۶ ترافلاپس خواهد بود، اما به جز این اطلاعات ناچیزی که از مشخصات تراشه‌ی گرافیکی آن در دست داریم، فعلا اطلاعات دیگری در مورد آن منتشر نشده است. بنابراین فقط آخرین بخشِ این معادله مشخص است و اطلاعاتی در مورد فرکانس کاری یا تعداد هسته‌های سایه زن در دست نیست. در اینجا سعی می‌کنیم ترکیبی از دانسته‌های فعلی درمورد طراحی کنسول‌ها را با مشخصات درز شده از تراشه‌ی گرافیکی آینده‌ی AMD با نام وِگا ترکیب کنیم تا بهترین تخمین‌ها در مورد سخت افزارِ جدید مایکروسافت حاصل شود.

سناریوی اول:

3584 shaders * 840MHz * 2 instructions per clock = 6,021,120 megaflops/6.02TF

سناریوی دوم:

3840 shaders * 800MHz * 2 instructions per clock = 6,144,000 megaflops/6.13TF

تصورِ ما این است که فرکانس کاری اسکورپیو پایین‌تر باشد، چون به نظر می‌رسد پردازنده‌اش به میزان قابل توجهی بزرگتر از کنسول  PlayStation Neo باشد (تراشه‌های بزرگتر حرارت بیشتری تولید می‌کنند و عموما در فرکانسِ پایین‌تری تنظیم می‌شوند). همچنین برآورد می‌کنیم که مایکروسافت از معماری جدید رادئون Vega در اسکورپیو استفاده خواهد کرد، تراشه‌ی رده بالایی که توسط اخبار فاش شده قرار است دارای ۶۴ واحد CU یا ۴۰۹۶ پردازشگر سایه زن باشد. از طرفی هم دستیابی به ۶ ترافلاپس توان با استفاده از فناوری پولاریس فعلی به مانند آنچه که در پلی استیشن نئو بکار رفته، نیازمند فرکانس کاری بسیار بالایی خواهد بود و به همین دلیل گمانه زنی ما در مورد استفاده از معماری وگا بیشتر تقویت می‌شود:

سناریوری سوم:

2304 shaders x 1302MHz x 2 instructions per clock = 5,999,616 megaflops/6TF

در واقع با این محاسبه، پردازنده‌ی ما باید فرکانسی حتی بالاتر از تراشه‌ی اصلی کارت RX 480 روی پی‌سی داشته باشد، اتفاقی که بعید است رخ دهد. به طور خلاصه با یک نسخه‌ی تقلیل یافته از معماری Vega مواجه خواهیم بود، مگر اینکه مایکروسافت به یک تراشه‌ی نسلِ بعدی ای‌ام‌دی که در نقشه‌ی راه Radeon وجود ندارد دسترسی داشته باشد.

دانلود با رزولوشن 360p | دانلود با رزولوشن 720p 

ترافلاپ‌ تا چه حدی راندمان سیستم را تعیین می‌کند؟

ترافلاپ مبنای ابتدایی اندازه گیری توان محاسباتی به شمار می‌رود و از بقیه‌ی ابعاد طراحی GPU (واحد پردازش گرافیکی) مجزا و متمایز است. مثلا GCN (مخفف Graphic Core Next)، معماری مشهورِ ای‌ام‌دی، همیشه در توانِ محاسباتی خام نسبت به همرده‌هایش از انویدیا برتری داشته است و همین مورد توضیح می‌دهد که چرا کارت‌های گرافیک رادئون ای‌ام‌دی در اوجِ دوران شیوع عملیات استخراج پول الکترونیکی (Bitcoin mining) این‌قدر خوب عمل کردند. با این حال مهم است که تاکید کنیم این موضوع لزوما به معنی راندمانِ بهتر در بازی‌ها نیست.

نمونه‌ی خوبی در این مورد مقایسه‌ی کارت جدید GTX 1080 از انویدیا با توان ۹ ترافلاپس در برابر کارت گرافیک R9 Fury X با توان ۸.۶ ترافلاپس است. تنها با در نظر گرفتن توانِ ترافلاپس می‌توانید انتظار این را داشته باشید که هر دو کارت گرافیکی راندمان بسیار مشابه‌ای را در اختیار گذارند؛ اما همان گونه که بنچمارک مقایسه‌ی راندمان رزولوشن 4K در پایین نشان می‌دهد، کارت GTX 1080 فقط مقدار ناچیزی سریع‌تر نیست، بلکه در تمام موارد به جز یکی بسیار سریع‌تر است. در واقع حتی کارت کندتر GTX 1070 با میزان ۶.۵ ترافلاپس هم به راحتی و با فاصله Fury X را در بسیاری بازی‌ها از میدانِ رقابت به در می‌کند. به علاوه، به لحاظ ترافلاپس، GTX 1070 حتی بعد از کارت دیگر خود انویدیا با نام تایتان ایکس با توان ۷ ترافلاپسی قرار می‌گیرد و در اینجا هم یا با آن برابری کرده یا آن را شکست داده است.

درایور- نرم افزاری که به سخت افزار قدرت می‌بخشد- هم اهمیت دارد، اما حیاتی‌تر از آن خود طراحی معماری گرافیکی است، بدون در نظر گرفتن جنبه‌های دیگر سخت افزار مانند پهنای باند حافظه و میزان حافظه‌ی کش داخل تراشه در سطوح مختلف. با این حال مقایسه بین قطعات کنسول می‌تواند به میزان زیادی تعیین کننده باشد، به دو دلیل: یکی این که اجزای پیرامونی تراشه‌های گرافیکی همگام با نیاز به راندمان پردازشی خودشان ارتقا پیدا می‌کنند و دوم این که هم تراشه‌ی پلی‌استیشن 4 و هم ایکس‌باکس وان از یک خانواده می‌آیند و مشترکات بسیار مشابه‌ای در طراحی خود دارند.

دانلود با رزولوشن 360p | دانلود با رزولوشن 720p 

GTX 1080

GTX 1070

Titan X

R9 Fury X

3840×2160 (4K)

32.5

25.4

25.6

22.6

Assassin’s Creed Unity, Ultra High, FXAA

53.3

43.1

40.9

49

Ashes of the Singularity, Extreme, 0x MSAA, DX12

40.1

31.5

31.3

31.4

Crysis 3, Very High, SMAA T2x

37.3

31

30.7

31.1

The Division, Ultra, SMAA

42.4

33.5

33.5

34.5

Far Cry Primal, Ultra, SMAA

45.8

35.6

35.9

29.6

Rise of the Tomb Raider, Ultra, SMAA, DX12

43.7

37.3

34

32.8

The Witcher 3, Ultra, Post AA, No HairWorks

38.5

33.6

29.8

20.9

Project Cars, Ultra, SMAA

با این اوصاف مقایسه‌ی میان نسلی بین ایکس‌باکس وان با Scorpio از یک طرف و پلی‌استیشن 4 با Neo از طرف دیگر ممکن است آنقدر هم دقیق و موثر نباشد. به بیان ساده‌تر، دو برابر شدن ترافلاپس به معنی دو برابر شدن نرخ فریم تولیدی نیست. دلایل بالقوه‌ی زیادی برا آن وجود دارند اما به طور کلی، محدودیت‌های پهنای باند حافظه یک عامل عمده در این جا است.

به عنوان نمونه کارت گرافیک R9 380X را در نظر بگیرید. این مدل یک نسخه از تراشه‌ی Tonga با ۳۲ واحد کاملا فعال از واحدهای پردازشی یا CUهای آن است و وقتی که در برابر نسخه‌ی تقلیل یافته‌ی R9 380 قرار می‌گیرد (مدلی که از همان تراشه استفاده کرده اما فقط ۲۸ واحدِ فعالِ CU دارد)، فقط حدود ۱۰ تا ۱۵ درصد افزایشِ راندمان را در نرخ فریم بازی‌ها مشاهده می‌کنیم. این امر به جز واحد‌های سایه زن بیشتر، با وجود فرکانس هسته‌ی بالاتر و حافظه‌ی سریع‌تر‌ِ این تراشه‌ی گرافیکی رخ می‌دهد. اختلاف میان راندمان واقعی و توان ترافلاپس معین شده فقط زمانی افزایش می‌یابد که فاصله میان مشخصات تراشه‌های گرافیکی گسترش یابد. مایکروسافت بهترین کار ممکن را با Scorpio می‌کند و تراشه‌ی ۶ ترافلاپسیش را با حافظه‌ای که ۳۲۰ گیگابایت بر ثانیه پهنای باند دارد مجهز خواهد کرد، میزانی که در مدل Neo به ۲۱۸ گیگابایت بر ثانیه بالغ خواهد شد.

اختلاف میان ترافلاپس و راندمان داخل بازی تا حدودی میان پلی‌استیشن 4 و ایکس‌باکس وان هم مشاهد شده است. بنچمارک‌های خطی برای سنجش راندمان گرافیکی کنسول‌ها تقریبا وجود خارجی ندارند و بازی‌ها را بیشتر با قفلِ فریم عرضه می‌کنند. به علاوه بازی‌سازان هم گزینه‌های کیفی در بخش‌های متعدد پردازش گرافیک یا رزولوشن اصلی اجرای بازی را به نحوی تنظیم می‌کنند که راندمان به هدفشان نزدیک‌تر باشد و ثبات بیشتری داشته باشد. اما استثناهایی هم مانند بازی هیتمن ساخته‌ی شرکت Io Interactive وجود دارد. به نظر می‌رسد که این بازی روی هر دو کنسول با رزولوشن مشابه‌ی 1080p  اجرا می‌شود و کیفیت بصری یکسانی هم دارد، به علاوه‌ی این که قفل فریم هم ندارد. بنابراین می‌توان گفت شرایطی بسیار شبیه به یک بنچمارک ایده‌آل دارد.

دانلود با رزولوشن 360p | دانلود با رزولوشن 720p 

نتیجه‌ی نهایی این است که در صحنه‌هایی از بازی که GPU اولین عامل محدود کننده‌‌ی راندمان باشد ، پلی استیشن 4 به میزان ۳۰ درصد راندمان بیشتری دارد، با وجود این که می‌دانیم حدود ۴۰ درصد هم مزیت برتری توان پردازش دارد (۱.۸۴ ترافلاپس در مقابل ۱.۳۱ ترافلاپس)، حتی اگر برتری آن را در پهنای باند حافظه هم محاسبه نکنیم (بستگی دارد که شرکت IO چگونه از حافظه‌ی یکپارچه‌ی ESRAM در ایکس‌باکس وان استفاده کرده باشد). اما نکته این است که هیتمن در برخی سناریوها در واقع می‌تواند روی ایکس‌باکس وان سریع‌تر از پلی‌استیشن 4 هم اجرا شود، مساله‌ای که ما را به مبحث بعدی رهنمون می‌کند.

توان پردازنده هم می‌تواند راندمان بازی را محدود کند

Hitman نمونه‌ی جالبی است از اینکه چگونه راندمان بازی همانند محدودیتی که به توان GPU دارد، می‌تواند به پردازنده هم محدود باشد. مرحله‌ی پاریس در این بازی از نظر تعداد کاراکترهای غیر قابل بازی (NPC) غنی است، کاراکترهایی که به جز پردازش انیمیشن‌هایشان، نیاز است رفتارشان هم شبیه سازی شود. این کار بیشتر برای CPU مناسب است و هر دو کنسول پلی‌استیشن 4 و ایکس‌باکس وان هم از پردازنده‌های نسبتا ضعیف AMD با هسته‌های Jaguar استفاده می‌کنند، معماریی که در اصل برای تراشه‌های موبایل ساخته شده بود. برای جبران راندمان ضعیف، هر دو پلتفرم از تعداد هسته‌های دو برابر استفاده کرده‌اند که صادقانه باید گفت بیهوده بوده است. تفاوتی که وجود دارد این است که کنسول مایکروسافت پردازنده را روی فرکانس ۱.۷۵ گیگاهرتز فعال کرده، در حالی که سونی فرکانس ۱.۶ گیگاهرتز را انتخاب کرده است و این برتری ۹.۴ درصدی را نشان می‌دهد که در واقع در برخی صحنه‌های بازی هیتمن هم قابل تشخیص است.

سونی تلاش کرده که این مشکل را با Neo برطرف کند. به نظر می‌رسد که فناوری نسل بعدی پردازنده‌های AMD با نام Zen هنوز برای یکپارچه سازی با تراشه‌ی گرافیکی در یک تراشه و یک بستر آماده نباشد، بنابراین دارنده‌ی این پلتفرم بهترین کارِ جایگزین را انجام داده است; همان ۸ هسته‌ی فعلی را با فرکانس کاری بالاتر (۲.۱ گیگاهرتز در Neo در برابر ۱.۶ گیگاهرتز در پلی‌استیشن 4) در نظر گرفته است که ۳۱.۳ درصد افزایش دارد. هنوز دقیقا نمی‌دانیم Project Scorpio چه معماری پردازنده‌ای را استفاده می‌کند، اما بر اساس برآوردهای متعادل، احتمال زیادی وجود دارد که مایکروسافت هم استراتژی مشابهی در پیش گیرد و همین هسته‌های جاگوار یا یکی از گونه‌های آن را را با فرکانس کاری بالاتر به خدمت بگیرد.

این ابتدایی‌ترین نگرانی ما در رابطه با Neo و Scorpio تلقی می‌شود: افزایش بنیادی در توان گرافیکی با واحدهای گرافیکی قوی‌تر و ترافلاپس بالاتری که با همان اندازه از افزایش در توان پردازنده‌ی اصلی همراه نیست. این امر توضیح می‌دهد که  چرا جدیدا تمرکز روی رزولوشن 4K را بیشتر از تاکید روی نرخ فریم بالاتر –مثل گذار از ۳۰ فریم به ۶۰ فریم در ثانیه (موردی که بیشتر ترجیح می‌دهیم)- مشاهده می‌کنیم. چرا که چنین تغییری نیاز به استفاده‌ی سنگین‌تر از CPU را هم به دنبال خواهد داشت. حداقل روی Neo که مشخصات آن را در اختیار داریم، نشانه‌ای که حاکی از وجود راندمان پردازشی دو برابر از سمت CPU باشد را مشاهده نمی‌کنیم.

دانلود با رزولوشن 360p | دانلود با رزولوشن 720p 

سخن آخر

هیچ ارتباط مستقیم و خطی بین راندمان داخل بازی با توان محاسباتی که با ترافلاپس اندازه گیری می‌شود وجود ندارد و در عین این که می‌توان ایده‌ای از راندمان متناظر در تراشه‌ی گرافیکی داشت، این قضیه فقط در مقایسه میان سخت افزارهای گرافیکی متفاوتی که معماری هسته‌های یکسان داشته باشند مصداق دارد. حتی در این صورت نیز وقتی که مثلا گفته می‌شود یک GPU حدود ۴۰ درصد بر دیگری برتری دارد به معنی آن نیست که به همین میزان اختلاف نرخ فریم تولید شده میان این دو وجود دارد. قابلیت‌های یک تراشه‌ی گرافیکی به عواملی بیش از توان محاسباتیِ صرف وابسته است و پهنای باند حافظه به طور خاص یک عامل تعیین کننده است.

با این حال مساله‌ای که مشخص شده این است که تراشه‌ی ۱.۳ ترافلاپسی با ۱۲ واحد CU در ایکس‌باکس وان در مقابل تراشه‌ی ۱.۸۴ فلاپسی با ۱۸ واحد CU در پلی‌استیشن 4 ضعیف‌تر ظاهر شده است، شرایطی که اغلب با پهنای باند کمتر حافظه‌ی کنسول مایکروسافتی تشدید می‌شود. به خاطر داشته باشید با وجود این تفاوت در مشخصات، توسعه دهندگانِ بازی‌ها مقابله‌ی تحسین برانگیزی را برای ارائه‌ی تجربه‌ی یکسان در بسیاری از بازی‌های چند پلتفرمی داشته‌اند. بیشتر وجه تمایز هم در این میان مربوط به رزولوشن بازی (720p, 1080p) بوده که پلی‌استیشن 4 علاوه بر برتری عمومی در این زمینه، نرخ فریم پایدارتری هم تولید کرده است.

تمام نشانه‌ها به تفاوت مشخصات مشابه بین PlayStation 4K Neo و Project Scorpio دلالت دارند، با این تفاوت که این بار ورق به نفع مایکروسافت برگشته است. اما این که برتری در مشخصات چقدر به برتری در گیم پلی منتهی می‌شود را باید صبر کرد و دید.

به نظر می‌رسد که مایکروسافت خودش قصد دارد بازی در رزولوشن ذاتی 4K را هدف گیری کند. این استراتژی را سونی هم مدنظر گرفته، با این تفاوت که در اینجا ارتقا از رزولوشن‌های پایین‌تر (Upscaling) احتمال بیشتری دارد. آیا مواجه شدن با سخت افزار قوی‌ترِ رقیب، سونی و در واقع توسعه دهندگان بازی را مجبور به بازنگری و هدفگذاری مجدد برای بهره گیری بیشتر ازتجربه‌ی بازی  در رزولوشن 1080p خواهد کرد یا خیر؟ همان گونه که قبلا اشاره کردیم، برای کنسول‌های جدید گزینه‌های دیگری به جز استفاده از رزولوشن‌های بالاتر هم وجود دارد. در هر صورت ناشران بزرگ بازی از کنسول‌های جدید استقبال کرده‌اند و قطعا روند توسعه و پیشرفت فنی بازی‌ها با ورود کنسول‌های جدیدسرعت بیشتری خواهد یافت.

منبع: Eurogamer

اخبار - زومیت - زومیت...
ما را در سایت اخبار - زومیت - زومیت دنبال می کنید

برچسب : نویسنده : محمد رضا جوادیان zoomit بازدید : 214 تاريخ : سه شنبه 29 تير 1395 ساعت: 23:32