A nova memória Flash de alta largura de banda da SanDisk permite 4 TB de VRAM em GPUs, corresponde à largura de banda HBM em maior capacidade

(Crédito da imagem: SanDisk)

A SanDisk apresentou na quarta-feira uma nova memória interessante que poderia unir a capacidade do 3D NAND e a largura de banda extrema habilitada pela memória de alta largura de banda (HBM). A memória flash de alta largura de banda (HBF) da SanDisk permite acesso a vários arrays 3D NAND de alta capacidade em paralelo, fornecendo assim bastante largura de banda e capacidade. A empresa posiciona o HBF como uma solução para aplicativos de inferência de IA que exigem alta largura de banda e capacidade, juntamente com baixos requisitos de energia. O HBF de primeira geração pode habilitar até 4 TB de capacidade de VRAM em uma GPU e mais capacidade em revisões futuras. A SanDisk também prevê que essa tecnologia chegue aos celulares e outros tipos de dispositivos. A empresa ainda não anunciou uma data de lançamento.

"Estamos chamando isso de tecnologia HBF para aumentar a memória HBM para cargas de trabalho de inferência de IA", disse Alper Ilkbahar, chefe de tecnologia de memória da SanDisk. "Vamos igualar a largura de banda da memória HBM ao mesmo tempo em que entregamos de 8 a 16 vezes a capacidade a um ponto de custo semelhante."

(Crédito da imagem: SanDisk)

Conceitualmente, o HBF é semelhante ao HBM. Ele empilha vários núcleos flash de alta capacidade e alto desempenho interconectados usando vias through-silicone (TSVs) em cima de um dado lógico que pode acessar matrizes flash (ou melhor, submatrizes flash) em paralelo. A arquitetura subjacente do HBF é o BICS 3D NAND da SanDisk usando o design CMOS diretamente vinculado ao Array (CBA) que vincula um conjunto de memória NAND 3D em cima de um dado de E/S feito usando tecnologia de processo lógico. Essa lógica pode ser a chave para habilitar o HBF.

"Nós desafiamos nossos engenheiros e dissemos, o que mais você poderia fazer com esse poder de escalabilidade", disse Alper Ilkbahar. "A resposta que eles encontraram [...] foi mudar para uma arquitetura onde dividimos esse array massivo em muitos, muitos arrays e acessamos cada um desses arrays em paralelo. Quando você faz isso, você obtém quantidades enormes de largura de banda. Agora, o que podemos construir com isso? Vamos construir flash de alta largura de banda."

(Crédito da imagem: SanDisk)

Os designs tradicionais de matriz NAND geralmente tratam o conjunto de memória flash NAND principal como planos, páginas e blocos. Um bloco é a menor área apagável, e uma página é a menor área gravável. O HBF parece dividir a matriz em "muitas, muitas matrizes" para que possam ser acessadas simultaneamente. Cada submatriz (com suas próprias páginas e blocos) presumivelmente tem seu próprio caminho dedicado de leitura/gravação. Embora isso se assemelhe a como os dispositivos NAND multiplanos funcionam, o conceito HBF parece ir muito além deles.

Por enquanto, a SanDisk diz que seu HBF de 1ª geração usará 16 dies de núcleo HBF. Para habilitar tais dispositivos, a SanDisk diz que inventou uma tecnologia de empilhamento proprietária que apresenta distorção mínima para habilitar o empilhamento de 16 dies de núcleo HBF e um die lógico que pode acessar simultaneamente dados de vários dies de núcleo HBF. A complexidade da lógica que pode lidar com centenas ou milhares de fluxos de dados simultâneos deve ser maior do que a de um controlador SSD típico.

Infelizmente, a SanDisk não divulga os números reais de desempenho de seus produtos HBF, então só podemos imaginar se o HBF corresponde ao desempenho por pilha do HBM original (~ 128 GB/s) ou do novo HBM3E, que fornece 1 TB/s por pilha no caso do B200 da Nvidia.

(Crédito da imagem: SanDisk)

(Crédito da imagem: SanDisk)

A única coisa que sabemos de um exemplo fornecido pela SanDisk é que oito pilhas HBF apresentam 4 TB de memória NAND, então cada pilha pode armazenar 512 GB (21x mais do que uma pilha 8-Hi HBM3E que tem capacidade de 24 GB). Uma pilha 16-Hi 512 GB HBF significa que cada die de núcleo HBF é um dispositivo NAND 3D de 256 Gb com alguma lógica complexa permitindo paralelismo em nível de die. Canalizar centenas de gigabytes de dados por segundo de 16 ICs NAND 3D ainda é um grande negócio, e só podemos imaginar como a SanDisk pode conseguir isso.

O que temos certeza é que o HBF nunca igualará o DRAM em latência por bit, e é por isso que a SanDisk enfatiza que os produtos HBF são voltados para aplicações de leitura intensiva e alto rendimento, como grandes conjuntos de dados de inferência de IA. Para muitas tarefas de inferência de IA, o fator crítico é alto rendimento a um custo viável, em vez da latência ultrabaixa que o HBM (ou outros tipos de DRAM) fornece. Portanto, embora o HBF possa não substituir o HBM tão cedo, ele pode ocupar um lugar no mercado que requer alta capacidade, alta largura de banda, custo semelhante ao NAND, mas não latência ultrabaixa. Para simplificar a transição do HBM, o HBF tem a mesma interface elétrica com algumas mudanças de protocolo, embora o HBF não seja compatível com o HBM.

"Tentamos torná-lo o mais próximo possível do HBM, mecânica e eletricamente, mas serão necessárias pequenas alterações de protocolo que precisam ser habilitadas nos dispositivos host", disse Ilkbahar.

(Crédito da imagem: SanDisk)

A SanDisk não tocou na resistência de gravação. O NAND tem uma vida útil finita que só pode tolerar um certo número de gravações. Embora as tecnologias SLC e pSLC ofereçam maior resistência do que o TLC e o QLC NAND usados ​​em SSDs de consumo, isso ocorre às custas da capacidade e adiciona custo. O NAND também é normalmente gravado em granularidade de bloco, enquanto a memória é endereçável por bit. Esse é outro desafio importante.

A SanDisk tem uma visão de como seu HBF evoluirá ao longo de três gerações. No entanto, por enquanto, o HBF da SanDisk é, em grande parte, um trabalho em andamento. A SanDisk quer que o HBF se torne um padrão aberto com um ecossistema aberto, então está formando um conselho técnico consultivo composto por 'luminares e parceiros da indústria.

Fonte: tomshardware

Nenhum comentário:

Postar um comentário

Mais notícias