Nvidia apresenta um novo modelo NVLM 1.0 AI que compete com GPT-4 OpenAI

A Nvidia lançou seu poderoso modelo de inteligência artificial de código aberto que pode superar o GPT-4 da OpenAI.

A nova família NVLM 1.0 de grandes modelos de linguagem multimodal (LLMs) da empresa tem quase 72 bilhões de parâmetros com o principal modelo NVLM-D-72B.

De acordo com a equipe de pesquisa da Nvidia, o novo modelo de IA se destaca em tarefas de linguagem de visão e mantém e até melhora o desempenho somente de texto em comparação com seus equivalentes LLM. Neles papelOs pesquisadores afirmam: “Apresentamos o NVLM 1.0, uma família de modelos de linguagem multimodais de grande escala e nível de fronteira que alcançam resultados de última geração em tarefas de linguagem de visão, com modelos proprietários líderes (por exemplo, GPT-4o) e modelos abertos modelos de origem.”

Ao contrário de alguns outros modelos proprietários que tiveram uma queda significativa no desempenho do texto ao longo do tempo, o NVLM-D-72B aumentou sua precisão em uma média de 4,3 pontos nas principais métricas de texto.

O LLM também foi capaz de interpretar gráficos e tabelas, analisar imagens, entender memes, codificar software e também resolver problemas matemáticos. Os pesos dos modelos estão disponíveis no Hugging Face, e a Nvidia diz que eventualmente lançará o código de treinamento.

O que a comunidade de IA pensa sobre o modelo NVLM da Nvidia

Os pesquisadores de IA da X chamaram o lançamento de “selvagem” e elogiaram sua capacidade de compreender dados visuais. Um usuário escreveu: “Uau! A Nvidia acaba de lançar um modelo 72B que está no mesmo nível do lhama 3.1 405B em matemática e codificação e também tem visão? “

Diz-se que a própria Nvidia usou código aberto para desenvolver o NVLM 1.0, obtendo insights de outros modelos de IA e vários dados de treinamento. No entanto, o modelo NVLM-D-72B é limitado pelos seus termos de licenciamento. Não pode ser utilizado para fins comerciais ou modificado para venda. Basicamente, a Nvidia oferece este modelo apenas para fins de pesquisa e para amadores que desejam testar os limites de suas placas gráficas topo de linha.

Portanto, o uso do termo “aberto” pelos pesquisadores é muito intencional. Embora as descobertas da Nvidia agreguem valor, as restrições de uso comercial significam que ele não pode ser considerado verdadeiramente de código aberto, exigindo a liberdade de usar, modificar e distribuir o modelo sem restrições.

ReadWrite entrou em contato com a Nvidia para comentar.

Imagem em destaque: meio da viagem

O posto Nvidia revela seu novo modelo NVLM 1.0 AI para competir com o GPT-4 da OpenAI apareceu pela primeira vez em ReadWrite.



Fonte