A NVIDIA anunciou hoje (8) as novas GPUs para desktop GeForce RTX™ SUPER focadas em desempenho de IA generativa, novos notebooks de IA de todos os principais fabricantes e novos softwares e ferramentas de IA aceleradas pela NVIDIA RTX™ para desenvolvedores e consumidores.
Com base em décadas de liderança em PCs, com mais de 100 milhões de suas GPUs RTX impulsionando a era da Inteligência Artificial, a NVIDIA agora oferece essas ferramentas para aprimorar experiências de PC com IA generativa: Aceleração NVIDIA TensorRT™ do popular modelo Stable Diffusion XL para conversão de texto em fluxos de trabalho de imagem; NVIDIA RTX Remix com ferramentas generativas de textura de IA; microsserviços NVIDIA ACE e mais jogos que utilizam tecnologia DLSS 3 com Frame Generation.
Além disso, a NVIDIA TensorRT-LLM (TRT-LLM), uma biblioteca de código aberto que acelera e otimiza o desempenho de inferência dos mais recentes modelos de linguagem grande (LLMs), agora oferece suporte a mais modelos pré-otimizados para PCs. Acelerado pelo TRT-LLM, o Chat with RTX, uma demonstração tecnológica da NVIDIA também lançada este mês, permite que os entusiastas da IA interajam com suas notas, documentos e outros conteúdos.
“A IA generativa é a transição de plataforma mais significativa na história da computação e transformará todos os setores, inclusive o de jogos”, disse Jensen Huang, fundador e CEO da NVIDIA. “Com mais de 100 milhões de PCs e estações de trabalho RTX IA, a NVIDIA é uma enorme base instalada para desenvolvedores e jogadores aproveitarem a magia da IA generativa.”
Executar IA generativa localmente em um PC é fundamental para privacidade, latência e aplicativos sensíveis a custos. Tal ação requer uma grande base de sistemas prontos para IA instalada, bem como as ferramentas de desenvolvedor certas para ajustar e otimizar modelos de IA para PC.
Para atender a essas necessidades, a NVIDIA está oferecendo inovações em toda a sua linha de tecnologias, promovendo novas experiências e aproveitando os mais de 500 jogos e softwares para PC habilitados para IA, já acelerados pela tecnologia NVIDIA RTX.
PCs e estações de trabalho RTX AI
As GPUs NVIDIA RTX — capazes de executar uma ampla variedade de softwares com o mais alto desempenho — liberam todo o potencial da IA generativa em PCs. Os Tensor Cores nessas GPUs aceleram drasticamente o desempenho da Inteligência Artificial nos softwares e aplicativos mais exigentes para trabalho e lazer.
As novas placas de vídeo GeForce RTX Série 40 SUPER, anunciadas hoje na CES, incluem a GeForce RTX 4080 SUPER, 4070 Ti SUPER e 4070 SUPER para desempenho superior de IA. A GPU GeForce RTX 4080 SUPER gera vídeos 1,5x mais rápido — e imagens 1,7x mais rápido — do que a GPU GeForce RTX 3080 Ti, com o auxílio de IA. Os Tensor Cores nas GPUs SUPER oferecem até 836 trilhões de operações por segundo, trazendo recursos transformadores de IA para jogos, atividades criativas e produtividade diária.
Os principais fabricantes do mercado – como Acer, ASUS, Dell, HP, Lenovo, MSI, Razer e Samsung – estão lançando uma nova onda de notebooks RTX IA, trazendo um conjunto completo de recursos de Inteligência Artificial generativa para os usuários. Os novos sistemas, que proporcionam um aumento de desempenho que varia de 20x a 60x em comparação com o uso de unidades de processamento neural, começarão a ser comercializados neste mês.
Estações de trabalho móveis equipadas com GPUs RTX são capazes de executar o software NVIDIA AI Enterprise, incluindo TensorRT e NVIDIA RAPIDS™ para uma simplificada e segura IA generativa e desenvolvimento de ciência de dados. Uma licença de três anos para NVIDIA AI Enterprise está inclusa em cada GPU NVIDIA A800 de 40 GB ativa , fornecendo uma plataforma de desenvolvimento de estação de trabalho ideal para IA e ciência de dados.
Novas ferramentas de desenvolvedor de PC para construção de modelos de IA
Para ajudar os desenvolvedores a criarem, testarem e personalizarem rapidamente modelos de IA generativos pré-treinados e LLMs usando alto desempenho de PC e consumo de memória, a NVIDIA anunciou o NVIDIA AI Workbench, um kit de ferramentas unificado e fácil de usar.
O AI Workbench, que será lançado em versão beta ainda este mês, oferece acesso simplificado a repositórios populares como: Hugging Face, GitHub e NVIDIA NGC™, juntamente com uma interface de usuário simplificada que permite aos desenvolvedores reproduzir, colaborar e migrar projetos facilmente.
Os projetos podem ser ampliados para praticamente qualquer lugar — seja o data center, uma nuvem pública ou a nuvem NVIDIA DGX™ — e depois trazidos de volta para sistemas RTX locais em um PC ou estação de trabalho para inferência e personalização.
Em colaboração com a HP, a NVIDIA também está simplificando o desenvolvimento de modelos de IA integrando modelos e endpoints NVIDIA AI Foundation, que incluem modelos de IA acelerados por RTX e kits de desenvolvimento de software no HP AI Studio, uma plataforma centralizada para ciência de dados. Isso permitirá que os usuários pesquisem, importem e implantem facilmente modelos otimizados em PCs e na nuvem.
Depois de criar modelos de IA para casos de uso de PC, os desenvolvedores podem otimizá-los usando NVIDIA TensorRT para aproveitar ao máximo os Tensor Cores das GPUs RTX.
A NVIDIA estendeu recentemente o TensorRT para softwares baseados em texto com o TensorRT-LLM para Windows, uma biblioteca de código aberto para acelerar LLMs. A atualização mais recente do TensorRT-LLM já disponível adiciona Phi-2 e Zephyr 7B à lista crescente de modelos pré-otimizados para PC.
IA generativa acelerada por RTX potencializa novas experiências de PC
Durante a CES, a NVIDIA e seus parceiros desenvolvedores lançaram novos softwares e serviços generativos baseados em IA para PCs, incluindo:
- NVIDIA RTX Remix, uma plataforma para criar remasterizações RTX de jogos clássicos. Com lançamento beta para o final deste mês, ele oferece ferramentas generativas de IA que podem transformar texturas básicas de jogos clássicos em materiais de renderização modernos com resolução 4K e baseados em física.
- Microsserviços NVIDIA ACE, incluindo modelos generativos de fala e animação alimentados por IA, que permitem aos desenvolvedores adicionar avatares digitais inteligentes e dinâmicos aos jogos.
- Aceleração TensorRT para Stable Diffusion XL (SDXL) Turbo e modelos de consistência latente, dois dos métodos de aceleração de difusão estável mais populares. O TensorRT melhora o desempenho de ambos em até 60% em comparação com a implementação anterior mais rápida. Uma versão atualizada da extensão Stable Diffusion WebUI TensorRT também está disponível, incluindo aceleração para SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) e suporte LoRA aprimorado.
- NVIDIA DLSS 3 com geração de quadros, que utiliza IA para aumentar as taxas de quadros em até 4x em comparação com a renderização nativa, será apresentado em uma dúzia dos 14 novos jogos RTX anunciados, incluindoHorizon Forbidden West, Pax Dei e Dragon’s Dogma 2.
- Chat with RTX, uma demonstração técnica da NVIDIA disponível no final deste mês, permite que os entusiastas de IA conectem facilmente PC LLMs aos seus próprios dados usando uma técnica popular conhecida como geração aumentada de recuperação (RAG). A demonstração, acelerada pelo TensorRT-LLM, permite que os usuários interajam rapidamente com suas notas, documentos e outros conteúdos. Também estará disponível como um projeto de referência de código aberto, para que os desenvolvedores possam implementar facilmente os mesmos recursos em seus próprios aplicativos.
Saiba mais sobre as mais recentes inovações em IA generativa juntando-se à NVIDIA na CES.