DeepSeek chuta o traseiro do ChatGPT

terça-feira, 28 de janeiro de 2025

DeepSeek chuta o traseiro do ChatGPT

O lançamento dos últimos modelos de IA da startup chinesa DeepSeek, que ela diz estarem no mesmo nível ou melhores do que os modelos líderes da indústria nos Estados Unidos por uma fração do custo, está ameaçando perturbar a ordem mundial da tecnologia.

A empresa atraiu a atenção nos círculos globais de IA após escrever em um artigo no mês passado que o treinamento do DeepSeek-V3 exigiu menos de US$ 6 milhões em poder de computação dos chips Nvidia H800.

O AI Assistant da DeepSeek, alimentado pelo DeepSeek-V3, ultrapassou o rival ChatGPT para se tornar o aplicativo gratuito mais bem avaliado disponível na App Store da Apple nos Estados Unidos.

Isso levantou dúvidas sobre o raciocínio por trás da decisão de algumas empresas de tecnologia dos EUA de prometer bilhões de dólares em investimentos em IA e as ações de vários grandes players de tecnologia, incluindo a Nvidia, foram atingidas.

Abaixo estão alguns fatos sobre a empresa que está sacudindo o setor de IA em todo o mundo.

CAUSA DO ALVOROÇO

O lançamento do ChatGPT da OpenAI no final de 2022 causou uma confusão entre as empresas de tecnologia chinesas, que se apressaram para criar seus próprios chatbots movidos por inteligência artificial.

Mas após o lançamento do primeiro equivalente chinês do ChatGPT, feito pelo gigante dos mecanismos de busca Baidu (9888.HK), abre uma nova aba, houve uma decepção generalizada na China com a lacuna nas capacidades de IA entre as empresas dos EUA e da China.

A qualidade e a eficiência de custos dos modelos do DeepSeek inverteram essa narrativa. Os dois modelos que foram elogiados por executivos do Vale do Silício e engenheiros de empresas de tecnologia dos EUA, DeepSeek-V3 e DeepSeek-R1, estão no mesmo nível dos modelos mais avançados da OpenAI e da Meta, disse a startup chinesa.

Eles também são mais baratos de usar. O DeepSeek-R1, lançado na semana passada, é de 20 a 50 vezes mais barato de usar do que o modelo OpenAI o1, dependendo da tarefa.

Mas alguns jornais ocidentais expressaram publicamente ceticismo sobre a história de sucesso do DeepSeek.

O CEO da Scale AI, Alexandr Wang, disse durante uma entrevista à CNBC na quinta-feira, sem fornecer evidências, que a DeepSeek tem 50.000 chips Nvidia H100, que ele alegou que não seriam divulgados porque isso violaria os controles de exportação de Washington que proíbem a venda de tais chips avançados de IA para empresas chinesas. A DeepSeek não respondeu imediatamente a um pedido de comentário sobre a alegação.

Os analistas da Bernstein destacaram na segunda-feira em uma nota de pesquisa que os custos totais de treinamento da DeepSeek para seu modelo V3 eram desconhecidos, mas eram pouco mais do que os US$ 5,58 milhões que a startup disse ter sido usado para poder de computação. Os analistas também disseram que os custos de treinamento do igualmente aclamado modelo R1 não foram divulgados.

COMO PEQUIM VÊ O DEEPSEEK?

O sucesso do DeepSeek já foi notado nos principais círculos políticos da China. Em 20 de janeiro, dia em que o DeepSeek-R1 foi lançado ao público, o fundador Liang participou de um simpósio a portas fechadas para empresários e especialistas organizado pelo premiê chinês Li Qiang, de acordo com a agência de notícias estatal Xinhua.

A presença de Liang no encontro é potencialmente um sinal de que o sucesso do DeepSeek pode ser importante para a meta política da China comunista de superar os controles de exportação de Washington e alcançar a autossuficiência em indústrias estratégicas como IA.