LightSpeed Memory Architecture II

LightSpeed Memory Architecture II (LMA II)

Na versão anterior da GeForce, foi usada a versão 1 desta tecnologia com a intenção de eliminar o estrangulamento na largura de banda da memória RAM. Essa arquitectura foi melhorada e é constituída pelos seguintes 6 segmentos:

Crossbar Memory Controller
Para além do GPU, outro componente vital no 3D rendering é o controlador de memória lógico. Devido aos gráficos 3D estarem dependentes da largura de banda da memória, se esta estiver a ser ineficientemente usada, isto vai dar origem a engarrafamentos, o que reduz a performance.
O NV25 utiliza 4 controladores de memória. Estes controladores de memória independentes acedem à RAM, não com blocos de 128bits mas sim com um número reduzido, de modo a que se possa obter um ganho aproximado de 50% da largura de banda disponível.

Quad Cache
A LMA-II também tem um subsistema de caches que captura os dados primários, dos vértices, das textures e dos pixels e envia-os para o NV25 sem necessitar de aceder à memória.

Lossless Z Compression
Guardando a profundidade das cenas 3D, o buffer Z pode atingir valores na ordem dos 60fps em alta resolução. A nVidia comprime estes dados a uma taxa de 1:4 em tempo real, o que reduz a utilização de largura de banda em 1:4.

Z-Occlusion Culling
As arquitecturas gráficas convencionais processam todos os pixels e triangulos numa cena 3D, o que significa que até os dados que não vão ser mostrados no ecrã vão ser processados. O que o Z-Occlusion Culling faz é eliminar esses dados desnecessários. Como resultado, a utilização do GPU e da largura de banda é menor, podendo assim serem utilizados por outros processos.

Auto Pre-Charge
É um sistema desenhado para reduzir o Miss Penalty de quando o GPU tenta aceder a uma zona de memória da DRAM inválida.

Fast Z-Clear
Como os dados do buffer-Z ocupavam muito espaço e ele era usado para guardar a profundidade 3D, era necessário transferir mais rapidamente e comprimir ainda mais estes dados, pois iria haver um ganho na largura de banda disponível. Um método de aumentar a performance é de escrever os dados novos por cima dos dados velhos. Mesmo que nada haja para escrever, a GF4 elimina os dados escrevendo "0" por cima.