A VMware e a NVIDIA revelam a IA generativa para empresas

Nova VMware Private AI Foundation com NVIDIA permite que organizações preparem seus negócios para a IA generativa

Salvador, 30/10/2023 – A VMware e a NVIDIA anunciaram a expansão de sua parceria estratégica com o objetivo de preparar centenas de milhares de empresas que operam na infraestrutura em nuvem da VMware para a era da inteligência artificial (IA) generativa.

Por meio da VMware Private AI Foundation com NVIDIA, as organizações poderão personalizar modelos e executar aplicações generativas de IA, incluindo chatbots inteligentes, assistentes, pesquisas e resumo. A plataforma será uma solução totalmente integrada com software de IA generativa e computação acelerada da NVIDIA com base na VMware Cloud Foundation e otimizada para IA.

“A IA generativa e a multi-cloud são a combinação perfeita”, afirma Raghu Raghuram, CEO da VMware. “Os dados dos clientes estão em todo lugar, em seus data centers, na borda e nas suas nuvens. Juntamente com a NVIDIA, as empresas poderão executar cargas de trabalho generativas de IA adjacentes aos seus dados com confiança. Além disso, será possível abordar suas preocupações de privacidade, segurança e controle de dados corporativos.”

“As organizações do mundo inteiro estão correndo para integrar a IA generativa em seus negócios”, comenta Jensen Huang, fundador e CEO da NVIDIA. “Nossa colaboração ampliada com a VMware oferecerá a centenas de milhares de clientes, nas áreas de serviços financeiros, saúde, manufatura e muito mais, o software e a computação full-stack de que precisam para aproveitar o potencial da IA generativa usando aplicações personalizadas criadas com seus próprios dados.”

Computação full-stack para melhorar a IA generativa

Para obter benefícios comerciais mais rapidamente, as companhias procuram agilizar o desenvolvimento, os testes e a implantação de aplicações generativas de IA. A McKinsey estima que a IA generativa poderá adicionar até 4,4 biliões de dólares anualmente à economia global.

A VMware Private AI Foundation com NVIDIA permitirá que as empresas aproveitem esse recurso, personalizando grandes modelos de linguagem, produzindo templates mais seguros e privados para uso interno, oferecendo a IA generativa como serviço aos seus usuários e executando cargas de trabalho de inferência em escala com mais segurança.

A expectativa é que a solução inclua ferramentas integradas de IA para capacitar as organizações a executar modelos comprovados e treinados nos seus dados privados de modo econômico. Usando a VMware Cloud Foundation e o software NVIDIA AI Enterprise, os benefícios esperados da plataforma vão incluir:

•  Privacidade: permitirá que os clientes executem facilmente serviços de IA adjacentes a qualquer lugar onde tenham dados, com uma arquitetura que preserva a privacidade dos dados e permite acesso seguro;
•  Escolha: as empresas terão uma ampla escolha de onde construir e executar seus modelos, do NVIDIA NeMo ao Llama 2 e além, incluindo configurações de hardware OEM líderes e, no futuro, ofertas de nuvem pública e de provedores de serviços;
•  Desempenho: a execução na infraestrutura acelerada da NVIDIA proporcionará desempenho igual e até mesmo superior ao bare metal em alguns casos de uso, conforme comprovado pelos benchmarks mais recentes do setor;
•  Escala do data center: as otimizações de escala da GPU em ambientes virtualizados permitirão que as cargas de trabalho de IA sejam dimensionadas em até 16 vGPUs/GPUs em uma única máquina virtual e vários nós para acelerar o ajuste fino e a implantação do modelo de IA generativo
•  Custo mais baixo: maximizará o uso de todos os recursos de computação em GPUs, DPUs e CPUs para reduzir os custos gerais e criar um ambiente de recursos agrupados que pode ser compartilhado de forma eficiente entre as equipes;
•  Armazenamento acelerado: a Express Storage Architecture do VMware vSAN fornecerá armazenamento NVMe com desempenho otimizado e suporte ao armazenamento GPUDirect sobre RDMA, permitindo a transferência direta de E/S do armazenamento para GPUs sem envolvimento da CPU;
•  Rede acelerada: a integração profunda entre a tecnologia do vSphere e do NVIDIA NVSwitch permitirá que modelos com várias GPUs sejam executados sem gargalos entre GPUs;
•  Implantação rápida e time to value: as imagens da máquina virtual (VM) e o repositório de imagens do vSphere Deep Learning permitirão recursos de prototipagem rápida, oferecendo uma imagem de solução pronta e estável que inclui estruturas e bibliotecas com desempenho otimizado pré-instaladas.

A plataforma contará com a NVIDIA NeMo, uma estrutura nativa da nuvem completa incluída no NVIDIA AI Enterprise, o sistema operacional da plataforma NVIDIA AI, que permite às empresas criar, personalizar e implantar modelos generativos de IA praticamente em qualquer lugar. A NeMo combina estruturas de personalização, kits de ferramentas de proteção, ferramentas de curadoria de dados e modelos pré-treinados para oferecer às organizações uma maneira fácil, econômica e rápida de adotar a IA generativa.

Para implantar a IA generativa em produção, a NeMo usa o TensorRT for Large Language Models (TRT-LLM), que acelera e otimiza o desempenho de inferência nas LLMs mais recentes em GPUs da NVIDIA. Com a NeMo, a VMware Private AI Foundation com NVIDIA permitirá que as companhias obtenham seus próprios dados para construir e executar modelos de IA generativos personalizados na infraestrutura em nuvem híbrida da VMware.

No VMware Explore 2023, em Las Vegas, a NVIDIA e a VMware destacaram como os desenvolvedores nas empresas podem usar o novo NVIDIA AI Workbench para extrair modelos de comunidade, como Llama 2, disponível no Hugging Face, personalizando-os remotamente e implantando a IA generativa de nível de produção nos ambientes da VMware.

Amplo suporte de ecossistema para VMware Private AI Foundation com NVIDIA

A VMware Private AI Foundation com NVIDIA terá suporte da Dell Technologies, da Hewlett Packard Enterprise e da Lenovo, que estarão entre as primeiras a oferecer sistemas que potencializam a personalização da LLM empresarial, e cargas de trabalho de inferência com GPUs NVIDIA L40S, DPUs NVIDIA BlueField-3 e SmartNICs NVIDIA ConnectX-7.

A VMware Private AI Foundation com NVIDIA se baseia na parceria de uma década entre as empresas. O trabalho de coengenharia otimizou a infraestrutura em nuvem da VMware para executar o NVIDIA AI Enterprise com desempenho comparável ao bare metal. Os clientes mútuos se beneficiam ainda mais do gerenciamento e da flexibilidade de recursos e infraestrutura proporcionados pela VMware Cloud Foundation.

Disponibilidade

A VMware pretende lançar o VMware Private AI Foundation com NVIDIA no início de 2024.

Últimas notícias