
엔비디아가 로컬 AI를 위한 구글 딥마인드 디퓨전젬마를 가속화했다. 2026년 6월 12일, 엔비디아는 엔비디아 지포스 RTX GPU, 엔비디아 RTX PRO 플랫폼, 엔비디아 DGX 스파크 시스템을 최적화하여 빠르게 실행할 수 있도록 했다. 이를 통해 로컬 PC부터 클라우드 환경까지 다양한 활용이 가능해졌다.
디퓨전젬마는 텍스트를 병렬로 생성하여 텍스트 블록 전체를 출력하는 혁신적인 방식을 제공한다. 이는 개발자와 연구자, AI 애호가들에게 저지연 AI 경험을 제공한다. 디퓨전젬마는 최대 256개의 토큰을 병렬로 처리하며, 젬마 4를 기반으로 구축되어 최대 4배 빠른 성능을 제공한다.
엔비디아 GPU를 통해 더욱 강력해진 디퓨전젬마는 메모리의 영향을 크게 받지 않고, 대규모 병렬 연산을 가속화한다. 이로써 엔비디아 H100 텐서 코어 GPU에서 초당 1,000개 토큰, 엔비디아 DGX 스파크에서 초당 150개 토큰, 엔비디아 DGX 스테이션에서 최대 초당 2,000개 토큰의 성능을 제공한다.
또한, 엔비디아의 제품군 전반에서 디퓨전젬마의 성능상 이점이 확인되었다. 엔비디아 DGX 스파크, RTX PRO 6000 워크스테이션, DGX 스테이션에서 각각 다양한 성능을 제공하며, 허깅페이스 트랜스포머를 활용하여 모델을 테스트하고 프로토타이핑할 수 있다.
또한, RTX AI 개러지는 SANA-WM을 공개하여 정밀한 6-DoF 제어가 가능한 720p 해상도의 비디오 생성을 제공한다. 또한, 윈도우 에이전트 구축 환경이 강화되었고, DGX 스파크는 에이전트를 빠르게 실행할 수 있는 환경을 제공한다.

리플 페이지 이동 1 link추천 퀵 링크
냥코대전쟁
페이트 그랜드 오더
원피스 트레저 크루즈
점프 어셈블
우마무스메 PRETTY DERBY
리니지2 레볼루션
원스휴먼
등록순 최신순 댓글순