O modelo de IA da DeepSeek supostamente executa cargas de trabalho de inferência nos mais novos chips Ascend 910C da Huawei, mostrando como a indústria de IA da China evoluiu nos últimos meses.
O portfólio de computação de IA da DeepSeek também inclui os chips de IA Ascend da Huawei, executando cargas de trabalho de inferência por meio deles
Bem, a empresa chinesa de IA DeepSeek certamente conseguiu perturbar os mercados globais de IA nos últimos dias, já que seu modelo R1 LLM recentemente anunciado conseguiu cortar US$ 2 trilhões do mercado de ações dos EUA, uma vez que criou uma sensação de pânico entre os investidores. Embora as alegações sobre o poder de computação que a DeepSeek usou para treinar seu modelo R1 sejam bastante controversas, parece que a Huawei desempenhou um grande papel nisso, pois, de acordo com @dorialexander , o DeepSeek R1 está executando inferência nos chips Ascend 910C, adicionando uma nova reviravolta ao fiasco.
I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou
— Alexander Doria (@Dorialexander) January 28, 2025
Para quem não sabe, o chip de IA Ascend 910C da Huawei é considerado um rival direto dos aceleradores de IA Hopper H100 da NVIDIA e, embora as especificações do chip da Huawei não sejam certas por enquanto, foi alegado que a empresa planejava iniciar a produção em massa no primeiro trimestre de 2025, vendo o interesse de empresas chinesas de IA tradicionais como ByteDance e Tencent. Os chips de IA da Huawei são conhecidos por serem a alternativa de primeira linha ao hardware da NVIDIA na China e conseguiram engolir uma grande fatia de mercado, então parece que eles se tornarão muito mais populares.
Os recursos de computação usados em torno do modelo de IA R1 da DeepSeek não são específicos por enquanto, e há muito equívoco na mídia sobre isso. Primeiro, o valor de "US$ 5 milhões" não é o custo total do treinamento, mas sim a despesa de execução do modelo final, e segundo, alega-se que a DeepSeek tem acesso a mais de 50.000 H100s da NVIDIA , o que implica que a empresa realmente exigiu recursos semelhantes a outros modelos de IA equivalentes.
Utilizar os chips da Huawei para inferência ainda é interessante, pois eles não só estão disponíveis em grandes quantidades para empresas nacionais, mas o preço é bem decente comparado às variantes "reduzidas" da NVIDIA ou mesmo aos aceleradores disponíveis por meio de fontes ilegais. Dizem que a Huawei está desenvolvendo a próxima geração de chips Ascend AI, que supostamente rivalizam com os produtos Blackwell AI da Team Green e, sem dúvida, aumentarão a competição global.
Fonte: wccftech
Nenhum comentário:
Postar um comentário