A d-Matrix revelou o Corsair, um paradigma de computação totalmente novo, projetado do zero para a próxima era de inferência de IA em datacenters modernos. O Corsair aproveita a inovadora arquitetura Digital In-Memory Compute (DIMC) da d-Matrix, uma novidade no setor, para acelerar cargas de trabalho de inferência de IA com desempenho em tempo real, eficiência energética e economia de custos líderes do setor em comparação com GPUs e outras alternativas.
O surgimento de agentes de raciocínio e geração de vídeo interativo representa o próximo nível de recursos de IA. Eles aproveitam mais poder de computação de inferência para permitir que os modelos "pensem" mais e produzam saídas de maior qualidade. O Corsair é a solução de computação de inferência ideal com a qual as empresas podem desbloquear novos níveis de automação e inteligência sem comprometer o desempenho, o custo ou a potência.
"Vimos transformadores e IA generativa chegando, e fundamos a d-Matrix para abordar desafios de inferência em torno da maior oportunidade de computação do nosso tempo", disse Sid Sheth, cofundador e CEO da d-Matrix. "A primeira plataforma de computação Corsair do gênero traz geração de tokens extremamente rápida para aplicativos de alta interatividade com vários usuários, tornando a Gen AI comercialmente viável."
A empresa de análise Gartner prevê um aumento de 160% no consumo de energia do data center nos próximos dois anos, impulsionado pela IA e GenAI. Como resultado, a Gartner estima que 40% dos data centers de IA existentes serão operacionalmente limitados pela disponibilidade de energia até 2027. A implantação de modelos de IA em escala pode torná-los rapidamente proibitivos em termos de custo.
Primeiras e inovações do setor d-Matrix
O d-Matrix combina várias inovações pioneiras do mundo em silício, software, encapsulamento de chiplets e tecidos de interconexão para acelerar a inferência de IA.
A inferência generativa é inerentemente limitada à memória. O d-Matrix rompe essa barreira de largura de banda de memória com uma nova arquitetura DIMC que integra firmemente a memória e a computação. O dimensionamento é obtido usando o DMX Link para conectividade die-to-die de alta velocidade e eficiência energética em chiplets em um pacote, e o DMX Bridge para conectar pacotes em dois cartões. O d-Matrix está entre os primeiros do setor a oferecer suporte nativo a formatos numéricos de ponto flutuante de bloco, agora um padrão OCP chamado Micro-scaling (MX), para maior eficiência de inferência. Essas inovações pioneiras no setor são perfeitamente integradas sob o capô pelo pacote de software Aviator da d-Matrix, que oferece aos desenvolvedores de IA uma experiência de usuário e ferramentas familiares.
A Corsair vem em um formato de placa PCIe Gen 5 de altura total e comprimento total padrão do setor, com pares de placas conectadas por meio de placas DMX Bridge. Cada placa Corsair é alimentada por núcleos de computação DIMC com 2400 TFLOPs de computação de pico de 8 bits, 2 GB de memória de desempenho integrada e até 256 GB de memória de capacidade fora do chip. A arquitetura DIMC oferece largura de banda de memória ultra-alta de 150 TB/s, significativamente maior do que a HBM. A Corsair oferece velocidade interativa até 10x mais rápida, desempenho 3x melhor por custo total de propriedade (TCO) e eficiência energética 3x maior.
"A d-Matrix está na vanguarda de uma mudança monumental na Gen AI como a primeira empresa a abordar totalmente os pontos problemáticos da IA na empresa", disse Michael Stewart, sócio-gerente da M12, o fundo de risco da Microsoft. "Construída por uma equipe de classe mundial e apresentando inovações que definem a categoria, a plataforma de computação da d-Matrix muda radicalmente a capacidade das empresas de acessar a infraestrutura para operações de IA e permite que elas escalem gradualmente as operações sem as restrições de energia e preocupações com latência que impediram a adoção da IA pelas empresas. A d-Matrix está democratizando o acesso ao hardware necessário para alimentar a IA em um formato padrão para tornar a IA de geração finalmente acessível a todos."
Disponibilidade das soluções de inferência Corsair da d-Matrix
A Corsair está testando para clientes de acesso antecipado e estará amplamente disponível no segundo trimestre de 2025. A d-Matrix tem orgulho de colaborar com OEMs e integradores de sistemas para levar soluções baseadas na Corsair ao mercado.
"Estamos entusiasmados em colaborar com a d-Matrix em sua solução de computação em memória de largura de banda ultra-alta Corsair, que é desenvolvida especificamente para IA generativa, e acelerar a adoção de computação de IA sustentável", disse Vik Malyala, vice-presidente sênior de tecnologia e IA da Supermicro. "Nossos sistemas de ponta a ponta de alto desempenho resfriados a líquido e a ar que incorporam a Corsair são ideais para computação de IA de próximo nível."
"Combinar a placa Corsair PCIe da d-Matrix com a arquitetura de expansão líder do setor da GigaIO SuperNODE cria uma solução transformadora para empresas que implantam inferência de IA de última geração em escala", disse Alan Benjamin, CEO da GigaIO. "Nosso servidor de nó único suporta 64 ou mais Corsairs, fornecendo poder de processamento massivo e comunicação de baixa latência entre placas. O Corsair SuperNODE elimina configurações complexas de vários nós e simplifica a implantação, permitindo que as empresas se adaptem rapidamente às cargas de trabalho de IA em evolução, ao mesmo tempo em que melhoram significativamente seu TCO e eficiência operacional."
Ao integrar o d-Matrix Corsair, a Liqid permite capacidade, flexibilidade e eficiência inigualáveis, superando limitações tradicionais para fornecer desempenho de inferência excepcional. No cenário de IA em rápido avanço, permitimos que os clientes atendam às rigorosas demandas de inferência com a solução de latência ultrabaixa da Corsair", disse Sumit Puri, cofundador da Liqid.
Fonte: techpowerup
Nenhum comentário:
Postar um comentário