Os modelos de linguagem de grande porte chineses dominaram os rankings globais de uso durante a semana de 30 de março a 5 de abril, com todos os seis principais modelos em consumo de tokens originários da China, de acordo com a OpenRouter, uma plataforma global de agregação de modelos de linguagem de grande porte (LLM). Dois modelos da série Alibaba Qwen 3.6 figuraram entre os três primeiros. O Qwen3.6 Plus (gratuito) liderou a lista com 4,6 trilhões de tokens semanais, enquanto o Qwen3.6 Plus Preview ficou em terceiro lugar com 1,64 trilhão de tokens, segundo a OpenRouter.
A tendência também se refletiu no nível dos modelos. O Qwen3.6-Plus , lançado na quinta-feira, liderou o ranking diário da OpenRouter no sábado, com mais de 1,4 trilhão de tokens em uso em um único dia, estabelecendo um recorde para a plataforma, de acordo com dados da OpenRouter e reportagens da mídia.
Segundo cálculos da mídia baseados em dados da OpenRouter, o uso global de LLM com inteligência artificial (IA) atingiu 27 trilhões de tokens durante o mesmo período, um aumento de 18,9% em relação à semana anterior.
Os modelos chineses representaram 12,96 trilhões de tokens, um aumento de 31,48%, enquanto os modelos americanos totalizaram 3,03 trilhões de tokens, um aumento de 0,76%. A China ultrapassou os EUA em uso semanal por cinco semanas consecutivas, informou o National Business Daily.
Dados da Administração Nacional de Dados mostraram que a média diária de chamadas de tokens na China saltou de 100 bilhões no início de 2024 para 140 trilhões no mês passado.
"Na China, grandes modelos são rapidamente incorporados a plataformas de alta frequência, como comércio eletrônico, mídias sociais e serviços públicos, enquanto estratégias agressivas de preços, incluindo acesso gratuito, reduziram significativamente as barreiras de adoção e expandiram a base de usuários", disse Wang Peng, pesquisador associado da Academia de Ciências Sociais de Pequim, ao Global Times na segunda-feira.
"O consumo de tokens é estruturalmente maior devido à rápida expansão de agentes de IA e fluxos de trabalho de várias etapas", observou Wang. "Esses sistemas dependem de raciocínio iterativo, processamento de contexto extenso e chamadas encadeadas, o que significa que uma única tarefa pode consumir várias vezes mais tokens do que as interações tradicionais."
"Mais fundamentalmente, a China se beneficia de vantagens coordenadas em poder computacional, fornecimento de energia e implantação com custo-benefício", disse Wang.
Clusters de data centers em larga escala, integração de infraestrutura de computação e eletricidade e a otimização contínua da eficiência de inferência permitem maior taxa de transferência a um custo menor. Mais importante ainda, a China possui um dos ecossistemas de aplicativos de internet mais ricos do mundo, onde modelos de linguagem complexos estão profundamente inseridos em cenários da economia real, traduzindo-se diretamente em uma demanda sustentada e robusta por tokens, de acordo com Wang.
Para impulsionar o crescimento da IA, o relatório de trabalho do governo chinês deste ano revelou planos para lançar novos projetos de infraestrutura focados em clusters de computação inteligente em hiperescala, juntamente com o desenvolvimento coordenado da capacidade de computação e do fornecimento de energia, de acordo com a Agência de Notícias Xinhua.