A Nvidia lançou seu poderoso modelo de inteligência artificial de código aberto que pode superar o GPT-4 da OpenAI.
A nova família NVLM 1.0 de grandes modelos de linguagem multimodal (LLMs) da empresa tem quase 72 bilhões de parâmetros com o principal modelo NVLM-D-72B.
De acordo com a equipe de pesquisa da Nvidia, o novo modelo de IA se destaca em tarefas de linguagem de visão e mantém e até melhora o desempenho somente de texto em comparação com seus equivalentes LLM. Neles papelOs pesquisadores afirmam: “Apresentamos o NVLM 1.0, uma família de modelos de linguagem multimodais de grande escala e nível de fronteira que alcançam resultados de última geração em tarefas de linguagem de visão, com modelos proprietários líderes (por exemplo, GPT-4o) e modelos abertos modelos de origem.”
Ao contrário de alguns outros modelos proprietários que tiveram uma queda significativa no desempenho do texto ao longo do tempo, o NVLM-D-72B aumentou sua precisão em uma média de 4,3 pontos nas principais métricas de texto.
O LLM também foi capaz de interpretar gráficos e tabelas, analisar imagens, entender memes, codificar software e também resolver problemas matemáticos. Os pesos dos modelos estão disponíveis no Hugging Face, e a Nvidia diz que eventualmente lançará o código de treinamento.
O que a comunidade de IA pensa sobre o modelo NVLM da Nvidia
Os pesquisadores de IA da X chamaram o lançamento de “selvagem” e elogiaram sua capacidade de compreender dados visuais. Um usuário escreveu: “Uau! A Nvidia acaba de lançar um modelo 72B que está no mesmo nível do lhama 3.1 405B em matemática e codificação e também tem visão? “
NVLM é desenvolvido pela NVIDIA. E aberto. Confira. pic.twitter.com/r9V8uamGVf
– Alex Zhavoronkov, MD (também conhecido como Alexander Zavoronkov) (@biogerentology) 2 de outubro de 2024
Uau. O novo modelo 72B da NVIDIA rivaliza com o 405B Llama! pic.twitter.com/TUZ378S4tz
-Jeremy Howard (@jeremyphoward) 1º de outubro de 2024
Uau, a nvidia acaba de lançar um modelo 72B que está no mesmo nível do lhama 3.1 405B em matemática e codificação e também tem visão. pic.twitter.com/c46DeXql7s
-Phil (@phill__1) 1º de outubro de 2024
Diz-se que a própria Nvidia usou código aberto para desenvolver o NVLM 1.0, obtendo insights de outros modelos de IA e vários dados de treinamento. No entanto, o modelo NVLM-D-72B é limitado pelos seus termos de licenciamento. Não pode ser utilizado para fins comerciais ou modificado para venda. Basicamente, a Nvidia oferece este modelo apenas para fins de pesquisa e para amadores que desejam testar os limites de suas placas gráficas topo de linha.
Portanto, o uso do termo “aberto” pelos pesquisadores é muito intencional. Embora as descobertas da Nvidia agreguem valor, as restrições de uso comercial significam que ele não pode ser considerado verdadeiramente de código aberto, exigindo a liberdade de usar, modificar e distribuir o modelo sem restrições.
ReadWrite entrou em contato com a Nvidia para comentar.
Imagem em destaque: meio da viagem
O posto Nvidia revela seu novo modelo NVLM 1.0 AI para competir com o GPT-4 da OpenAI apareceu pela primeira vez em ReadWrite.