Architettura PS4 Pro, Cerny: 'con Polaris più potenza alla GPU in form factor piccolo'

Architettura PS4 Pro, Cerny: 'con Polaris più potenza alla GPU in form factor piccolo'

Mark Cerny, responsabile principale dell'architettura delle PlayStation, ha fornito una serie di dettagli rimasti ancora inediti in un'intervista a Digital Foundry.

di Rosario Grasso pubblicata il , alle 09:09 nel canale Videogames
SonyPlaystation
 

"Polaris è un'architettura per la GPU molto efficiente dal punto di vista energetico che ci permette di aumentare la potenza della GPU in maniera considerevole, mantenendo sostanzialmente lo stesso form factor della console precedente", ha detto Mark Cerny, responsabile dell'achitettura hardware per le console PlayStation, in un'intervista a Digital Foundry in cui ha rivelato una consistente serie di informazioni circa l'hardware della nuova PS4 Pro. "La tecnologia di Delta Colour Compression è stata migliorata con Polaris e fa il suo debutto nel mondo PlayStation proprio con PS4 Pro".

"La DCC consente la compressione dei dati al volo mentre vengono trasferiti al framebuffer e al processo di renderizzazione, il che si traduce in una riduzione della bandwidth usata per l'accesso a questi dati. Dato che con PS4 aumenta di più la potenza della GPU rispetto alla bandwidth, tutto questo ha un potenziale molto elevato". PS4 Pro condivide con Polaris altri elementi al di là della Delta Colour Compression, anche se il set di funzionalità finale che si avrà su PS4 differirà leggermente rispetto a quello delle schede video discrete basate su Polaris. Le tecniche di compressione riducono la bandwitdh della memoria grafica necessaria contenendo la quantità di dati scritti sulla memoria, come abbiamo già visto in questo articolo.

PS4 Pro

Cerny: "Se normalmente avremmo 4,2 teraflop di potenza massima, con le nuove ottimizzazioni nell'elaborazione a 16 bit arriviamo a 8,4 teraflop"
Questo tipo di ottimizzazione consente di avere due tipi di benefici, spiega ancora Cerny. Innanzitutto nel caso i triangoli da renderizzare siano troppo piccoli, il che consente di avere vantaggi prestazionali soprattutto in quei giochi che usano filtri di anti-aliasing come MSAA. Inoltre, la precedente architettura GCN senza DCC gestiva in maniera non ottimale le operazioni in virgola mobile, andando a occupare più bandwidth del necessario. Una variabile a 16 bit, infatti, occupava lo stesso spazio di una variabile a 32 bit, mentre con la nuova DCC due variabili a 16 bit possono essere accoppiate e risiedere nello stesso registro, il che permette di usarne il doppio senza che aumenti il consumo di bandwidth.

Le migliorie di Polaris consentono di sfruttare meglio le Compute Unit su cui sono basate le architetture AMD. "Il fatto di poter gestire differenti flussi di operazioni permette di migliorare sensibilmente le prestazioni. Perché, per esempio, se uno di questi si sta occupando di caricare le texture o altro in memoria, un altro flusso di operazioni può essere assegnato alla computazione"-

Ogni flusso di operazioni deve essere gestito da un registro: quindi, ottimizzare la gestione di questi ultimi così come fa la DCC permette di gestire una maggiore quantità di flussi di operazioni e sfruttare conseguentemente al meglio la struttura parallelizzata delle Compute Unit. In soldoni, più AMD va avanti nella rifinitura della sua architettura hardware e meglio riesce a sfruttare i vantaggi in termini di calcolo parallelo che le DirectX 12 riescono a offrire.

"I tecnici di AMD sono assolutamente collaborativi", ha proseguito Cerny. "È stato un vero piacere lavorare con loro. In pratica, siamo stati liberi nella scelta del numero di CU che volevamo e di quali feature implementare. Abbiamo anche ottenuto un paio di caratteristiche peculiari che non ci sono ancora in nessuna scheda video discreta".

"La prima di queste caratteristiche riguarda la gestione delle variabili a 16 bit, come ho detto prima. In altre parole, a pieno carico, se normalmente avremmo 4,2 teraflop di potenza massima, con le nuove ottimizzazioni nell'elaborazione a 16 bit arriviamo a 8,4 teraflop", il che sembra una risposta agli annunci di Microsoft che con Scorpio ha promesso 6 teraflop. D'altra parte sembra che questo scenario possa concretizzarsi solo in particolari condizioni e a patto che lo sviluppatore del gioco lavori in un certo modo.

Per sfruttare al meglio queste novità è necessario che la distribuzione del carico di lavoro alle varie risorse della GPU venga fatta nel migliore dei modi. "Una volta che la GPU arriva a un certo potenziale, è necessario che un cervello centralizzato distribuisca il carico di lavoro in modo intelligente e gestisca opportunamente le geometrie da renderizzare".

"Il distributore del carico di lavoro di PS4 Pro è molto avanzato. Non solo gode dei miglioramenti alla gestione della tassellatura introdotti da Polaris, ma può vantare funzionalità successive a Polaris che accelerano il rendering nelle scene con oggetti piccoli. Quindi i calcoli alla base della gestione di un piccolo elemento dello scenario possono essere distribuiti tra differenti Compute Unit. Il che non è semplice come può sembrare in un primo momento perché il processo di sub-divisione di un task di rendering è decisamente complesso".

PS4 Pro nasce come una console in grado di gestire i contenuti, e anche i videogiochi, a 4K. Per ottenere questo traguardo non basta aumentare la potenza di calcolo tramite accorgimenti architetturali, ma bisogna di conseguenza migliorare il software e affinare gli algoritmi di rendering. Sony introdurrà nuovi buffer che potranno essere sfruttati in vario modo e rivedrà la gestione di tecniche di anti-aliasing come FXAA e SMAA.

"Quando si esegue l'anti-aliasing spaziale è molto importante conoscere la posizione dei bordi che vanno smussati", ha continuato Cerny. "Per svolgere questo lavoro, però, i tradizionali buffer come lo Z-buffer non sono l'ideale. Inoltre, per gestire soluzioni come l'anti-aliasing temporale diventa molto importante tracciare le informazioni da un frame all'altro, quindi conoscere il rapporto e i cambiamenti tra il frame attuale e quello successivo. La nostra soluzione a questo problema di lunga data per la computer grafica prende nome di ID buffer. Consiste in un buffer separato e gestito da hardware personalizzato che contiene l'ID di ciascun oggetto".

Cerny lo descrive come un equivalente dello Z-buffer, scritto nello stesso momento in cui viene scritto quest'ultimo, che non richiede chiamate al pixel shader e che opera alla stessa risoluzione dello Z-buffer. Per la prima volta, aggiunge Cerny, le coordinate spaziali degli oggetti possono essere tracciate e memorizzate, e anche i triangoli individuali possono essere identificati. Le GPU più moderne, secondo Cerny, non possono fare un lavoro del genere, a meno di consumare grossa parte delle loro risorse di elaborazione.

"Questo sistema consente di conoscere la posizione dei bordi degli oggetti e dei triangoli e di tracciare il tutto da frame a frame perché si usa lo stesso ID per ciascun oggetto al di là del frame". Due sistemi useranno il nuovo principio dell'ID buffer, ovvero il rendering delle geometrie e quella che Cerny definisce "scacchiera", "checkerboard".

Il rendering delle geometrie sfrutta l'ID buffer per gestire le immagini alla risoluzione 4K. Si tratta di una sorta di upscaling avanzato che, a partire dalle immagini renderizzate a 1080p, crea immagini in 4K senza evidente perdita di qualità. Il sistema, al momento dell'upscaling, estrapola i dati mancanti sfruttando il processo di propagazione del colore sulla base dei dati contenuti nell'ID buffer. La tecnica aumenta sensibilmente la qualità dell'immagine ma non permette di migliorare la risoluzione delle texture e gli effetti speculari, come ammette lo stesso Cerny.

La modalità scacchiera, invece, accede anche ai dati sulla posizione dei triangoli e degli oggetti memorizzati nell'ID buffer, oltre a quelli sulla propagazione del colore. Inoltre, richiede che il rendering nativo venga fatto almeno a 1920x2160. Sulla base dei dati su colori e posizione del frame precedente la tecnica riesce a fare delle stime sul frame successivo e, nelle condizioni in cui la telecamera non si muove, di riprodurre un frame a 4K senza nessuna perdita di qualità. Ma, anche nelle condizioni di movimento della telecamera, gli ID, congiuntamente alle informazioni sui frame precedenti, offrono sufficienti strumenti per anticipare cosa può succedere nel frame successivo.

Per poter usare la "scacchiera", dunque, i giochi devono essere renderizzati almeno a 1920x2160: pertanto, 9, e non tutti, dei titoli per PS4 Pro sfrutteranno questa funzionalità. Tra questi, troviamo Days Gone, Call of Duty Infinite Warfare, Rise of the Tomb Raider e Horizon Zero Dawn.

Come già visto in precedenza, inoltre, PS4 Pro disporrà di 1 Gigabyte di RAM DDR3 in più rispetto agli annunci iniziali. Non ci saranno, invece, modifiche lato CPU rispetto alla PS4 originale, mentre le Compute Unit risulteranno raddoppiate: 36 contro 18 di PS4. Questo per quanto riguarda l'architettura, mentre in fatto di frequenze di funzionamento si passa da 1,6GHz a 2,1GHz per quanto riguarda la CPU, e da 800MHz a 911MHz per la GPU. La bandwidth della memoria aumenta da 176GB/s a 218GB/s, ovvero del 24%.

PS4 Pro potrà scalare verso il basso quando si eseguiranno giochi non ottimizzati per il nuovo hardware e invece pensati per l'originale PS4. In questo caso le CU aggiuntive rispetto a PS4 si disattiveranno e verranno ripristinate le frequenze operative della vecchia console. PS4 Pro godrà allo stesso modo di tecniche per ottimizzare la grafica in VR: multi-resolution, infatti, consente di renderizzare i bordi della schermata a una risoluzione inferiore rispetto alle parti centrali, perché queste sezioni devono essere ridimensionate per via della necessità di piegare gli angoli delle schermate per la visione in realtà virtuale.

9 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
fraquar25 Ottobre 2016, 09:48 #1
Wanna Marchi è finita in carcere per molto meno.
emiliano8425 Ottobre 2016, 10:14 #2
ma poi scorpio non dovrebbe arrivare a "12 teraflop" avendo le stesse se non migliori ottimizzazioni? quindi il discorso comunque non regge

EDIT: per evitare euivoci, premetto che a me della grafica mi e' sempre interessato poco
gridracedriver25 Ottobre 2016, 10:22 #3
Originariamente inviato da: emiliano84
ma poi scorpio non dovrebbe arrivare a "12 teraflop" avendo le stesse se non migliori ottimizzazioni? quindi il discorso comunque non regge


essendo una caratteristica che non c'è sulle attuali gpu discrete potrebbe essere in collaborazione con sony, quindi non è scontato che ci sia anche sulla scorpio.

poi che sia solo marketing da parte di sony è molto probabile
Cloud7625 Ottobre 2016, 10:24 #4
Innanzitutto nel caso i triangoli da renderizzare siano troppo piccoli, il che consente di avere vantaggi prestazionali soprattutto in quei giochi che usano filtri di anti-aliasing come MSAA.

Mi sembra che in questa frase manchi qualche pezzo, non ha molto senso.
Ton90maz25 Ottobre 2016, 10:27 #5
Originariamente inviato da: gridracedriver
essendo una caratteristica che non c'è sulle attuali gpu discrete potrebbe essere in collaborazione con sony, quindi non è scontato che ci sia anche sulla scorpio.

poi che sia solo marketing da parte di sony è molto probabile

Tecnicamente c'è ma non raddoppia le performance come di wanno marchi, perfino il nintendo ha questa caratteristica.
calabar25 Ottobre 2016, 11:43 #6
Dai, fa un po' spot per PS4 Pro, ma alla fine è una disamina abbastanza interessante delle novità.

Piuttosto immagino che questa frase sia da attribuire alla redazione:
"In soldoni, più AMD va avanti nella rifinitura della sua architettura hardware e meglio riesce a sfruttare i vantaggi in termini di calcolo parallelo che le DirectX 12 riescono a offrire"
La PS4 non usa certo le DirectX 12, quindi mi pare un po' campata in aria.

@Ton90maz
Nell'articolo la spacciano come una caratteristica peculiare del chip Sony, hai qualche fonte che confermi la sua presenza anche sul chip di Microsoft?

@Cloud76
Credo che sia da interpretare come: "Questo avviene in particolare nel caso in cui i triangoli da renderizzare... ". Il legame tra i triangoli piccoli e l'uso di MSAA poi non è spiegato (ossia per quale motivo si dovrebbe avere un vantaggio in questo caso), ma questo è un altro discorso.
fraquar25 Ottobre 2016, 12:07 #7
Se non ricordo male è stata introdotta questa possibilità dalla 3dfx e c'è sia sulle schede consumer che professionali, sia nvidia che amd.
Poi che qualche motore grafico la sfrutti è un altro discorso.
Su Unreal e CryEngine di fatto non serve a nulla applicare questa "tecnica".
sweetlou25 Ottobre 2016, 14:55 #8
Don't believe the hype come dicevano i P.E. "qualche" anno fa
ilario328 Ottobre 2016, 17:15 #9

Domanda di curiosità

Ragazzi, ho una domanda per quanto concerne la scelta di Sony e di MS di adottare le gpu AMD e non Nvidia, nel senso, è solo un discorso legato ad un contratto di partnership con costi diversi, o vi è anche un altro motivo? Tecnico, performance, cose del genere.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^