NVIDIA debiutuje z rodziną otwartych modeli Nemotron 3


Firma NVIDIA ogłosiła dzisiaj rodzinę otwartych modeli, danych i bibliotek NVIDIA Nemotron 3, których zadaniem jest zapewnienie przejrzystego, wydajnego i wyspecjalizowanego rozwoju agentycznej sztucznej inteligencji w różnych branżach. Modele Nemotron 3 — w rozmiarach Nano, Super i Ultra — wprowadzają przełomową hybrydową ukrytą architekturę mieszanki ekspertów (MoE), która pomaga programistom budować i wdrażać niezawodne systemy wieloagentowe na dużą skalę.

W miarę jak organizacje przechodzą od chatbotów jednomodelowych do współpracujących, wieloagentowych systemów sztucznej inteligencji, programiści stają przed coraz większymi wyzwaniami, takimi jak obciążenie komunikacyjne, zmiana kontekstu i wysokie koszty wnioskowania. Ponadto programiści wymagają przejrzystości, aby zaufać modelom, które zautomatyzują ich złożone przepływy pracy. Nemotron 3 bezpośrednio odpowiada na te wyzwania, zapewniając klientom wydajność i otwartość potrzebne do tworzenia wyspecjalizowanej, agentycznej sztucznej inteligencji.

„Otwarte innowacje są podstawą postępu AI” – powiedział Jensen Huang, założyciel i dyrektor generalny NVIDIA. „Dzięki Nemotron przekształcamy zaawansowaną sztuczną inteligencję w otwartą platformę, która zapewnia programistom przejrzystość i wydajność, których potrzebują do tworzenia systemów agentowych na dużą skalę”.

NVIDIA Nemotron wspiera szersze wysiłki firmy NVIDIA w zakresie suwerennej sztucznej inteligencji, w ramach której organizacje od Europy po Koreę Południową przyjmują otwarte, przejrzyste i wydajne modele, które pozwalają im budować systemy sztucznej inteligencji dostosowane do ich własnych danych, przepisów i wartości.

Pierwsi użytkownicy, w tym Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys i Zoom, integrują modele z rodziny Nemotron, aby usprawnić przepływy pracy AI w produkcji, cyberbezpieczeństwie, tworzeniu oprogramowania, mediach, komunikacji i innych branżach.

„NVIDIA i ServiceNow od lat kształtują przyszłość sztucznej inteligencji, a najlepsze dopiero przed nami” – Bill McDermott, prezes i dyrektor generalny ServiceNow. „Dzisiaj robimy duży krok naprzód, umożliwiając liderom wszystkich branż szybkie śledzenie strategii agentycznej sztucznej inteligencji. Inteligentna automatyzacja przepływu pracy ServiceNow w połączeniu z NVIDIA Nemotron 3 będzie w dalszym ciągu definiować standard z niezrównaną wydajnością, szybkością i dokładnością”.

W miarę rozwoju wieloagentowych systemów sztucznej inteligencji programiści w coraz większym stopniu polegają na zastrzeżonych modelach w celu uzyskania najnowocześniejszego rozumowania, korzystając jednocześnie z bardziej wydajnych i konfigurowalnych modeli otwartych w celu obniżenia kosztów. Kierowanie zadań pomiędzy modelami pionierskimi a Nemotronem w ramach jednego przepływu pracy zapewnia agentom największą inteligencję przy jednoczesnej optymalizacji tokenomiki.

„Zagubienie opiera się na założeniu, że ludzka ciekawość zostanie wzmocniona przez dokładną sztuczną inteligencję wbudowaną w wyjątkowe narzędzia, takie jak asystenci AI” – powiedział Aravind Srinivas, dyrektor generalny Perplexity. „Dzięki naszemu routerowi agentów możemy kierować obciążenia do najlepiej dostosowanych modeli otwartych, takich jak Nemotron 3 Ultra, lub wykorzystywać wiodące, zastrzeżone modele, gdy zadania korzystają z ich unikalnych możliwości – zapewniając, że nasi asystenci AI działają z wyjątkową szybkością, wydajnością i skalą”.

Reklama

Otwarte modele Nemotron 3 umożliwiają start-upom szybsze budowanie i iterację agentów AI oraz przyspieszanie innowacji od prototypu do wdrożenia w przedsiębiorstwie. General Catalyst i spółki portfelowe Mayfield badają Nemotron 3, aby zbudować członków zespołu AI, którzy będą wspierać współpracę człowieka i sztucznej inteligencji.

„Otwarty stos modeli NVIDIA i program NVIDIA Inception zapewniają firmom na wczesnym etapie rozwoju modele, narzędzia i opłacalną infrastrukturę do szybkiego eksperymentowania, różnicowania i skalowania” – powiedział Navin Chaddha, partner zarządzający w Mayfield. „Nemotron 3 daje założycielom możliwość szybkiego startu w tworzeniu agentycznych aplikacji AI i członkom zespołu AI, a także pomaga im wykorzystać ogromną bazę zainstalowanych rozwiązań NVIDIA”.

Nemotron 3 na nowo odkrywa wieloagentową sztuczną inteligencję, zapewniając wydajność i dokładność
Rodzina modeli MoE Nemotron 3 obejmuje trzy rozmiary:

  • Nemotron 3 Nano, mały model z 30 miliardami parametrów, który aktywuje do 3 miliardów parametrów jednocześnie w celu realizacji ukierunkowanych, wysoce wydajnych zadań.
  • Nemotron 3 Super, model wnioskowania o wysokiej dokładności, zawierający około 100 miliardów parametrów i do 10 miliardów aktywnych na token, do zastosowań wieloagentowych.
  • Nemotron 3 Ultra, duży silnik wnioskowujący z około 500 miliardami parametrów i do 50 miliardami aktywności na token, do złożonych aplikacji AI.

Dostępny obecnie Nemotron 3 Nano to najbardziej ekonomiczny model obliczeniowy, zoptymalizowany pod kątem takich zadań, jak debugowanie oprogramowania, podsumowywanie treści, przepływ pracy asystentów AI i wyszukiwanie informacji przy niskich kosztach wnioskowania. W modelu zastosowano unikalną hybrydową architekturę MoE, aby zapewnić większą wydajność i skalowalność.

Konstrukcja ta pozwala osiągnąć do 4 razy większą przepustowość tokenów w porównaniu z Nemotron 2 Nano i redukuje generowanie tokenów wnioskowania nawet o 60%, znacznie obniżając koszty wnioskowania. Dzięki oknu kontekstowemu zawierającemu 1 milion tokenów Nemotron 3 Nano zapamiętuje więcej, dzięki czemu jest dokładniejszy i lepiej potrafi łączyć informacje w ramach długich, wieloetapowych zadań.

Artificial Analysis, niezależna organizacja porównująca sztuczną inteligencję, uznała ten model za najbardziej otwarty i wydajny spośród modeli tej samej wielkości, charakteryzujący się wiodącą dokładnością.

Nemotron 3 Super doskonale sprawdza się w zastosowaniach wymagających wielu współpracujących agentów w celu realizacji złożonych zadań przy niskim opóźnieniu. Nemotron 3 Ultra służy jako zaawansowany silnik wnioskowania dla przepływów pracy AI, które wymagają głębokich badań i planowania strategicznego.

Nemotron 3 Super i Ultra wykorzystują ultrawydajny 4-bitowy format szkoleniowy NVFP4 firmy NVIDIA na architekturze NVIDIA Blackwell, znacznie zmniejszając wymagania dotyczące pamięci i przyspieszając szkolenie. Ta wydajność umożliwia uczenie większych modeli w istniejącej infrastrukturze bez pogarszania dokładności w porównaniu z formatami o większej precyzji.

Dzięki rodzinie modeli Nemotron 3 programiści mogą wybrać otwarty model dostosowany do ich konkretnych obciążeń, skalowany od kilkudziesięciu do setek agentów, korzystając jednocześnie z szybszego i dokładniejszego wnioskowania długoterminowego w przypadku złożonych przepływów pracy.

Nowe otwarte narzędzia i dane do dostosowywania agentów AI
Firma NVIDIA udostępniła także kolekcję szkoleniowych zbiorów danych i najnowocześniejszych bibliotek uczenia się przez wzmacnianie, dostępnych dla każdego, kto tworzy wyspecjalizowanych agentów AI.

Trzy biliony tokenów nowych zbiorów danych Nemotron przed szkoleniem, po szkoleniu i uczeniu się przez wzmacnianie dostarczają bogatych przykładów wnioskowania, kodowania i wieloetapowego przepływu pracy potrzebnych do tworzenia wysoce wydajnych agentów wyspecjalizowanych w danej dziedzinie. Zestaw danych dotyczących bezpieczeństwa agentów Nemotron zapewnia telemetrię w świecie rzeczywistym, aby pomóc zespołom ocenić i wzmocnić bezpieczeństwo złożonych systemów agentów.

Aby przyspieszyć rozwój, NVIDIA udostępniła biblioteki open source NeMo Gym i NeMo RL, które zapewniają środowiska szkoleniowe i podstawy poszkoleniowe dla modeli Nemotron, wraz z NeMo Evaluator w celu sprawdzenia bezpieczeństwa i wydajności modeli. Wszystkie narzędzia i zbiory danych są teraz dostępne w GitHubie i Hugging Face.

Nemotron 3 jest obsługiwany przez LM Studio, llama.cpp, SGLang i vLLM. Ponadto Prime Intellect i Unsloth integrują gotowe do użycia środowiska szkoleniowe NeMo Gym bezpośrednio ze swoimi przepływami pracy, zapewniając zespołom szybszy i łatwiejszy dostęp do skutecznych szkoleń w zakresie uczenia się przez wzmacnianie.

Rozpocznij pracę z otwartymi modelami NVIDIA
Nemotron 3 Nano jest już dostępny w Hugging Face oraz u dostawców usług wnioskowania, w tym Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter i Together AI.

Nemotron jest oferowany na platformach sztucznej inteligencji i infrastruktury danych dla przedsiębiorstw, w tym Couchbase, DataRobot, H2O.ai, JFrog, Lambda i UiPath. Dla klientów korzystających z chmur publicznych Nemotron 3 Nano będzie dostępny na AWS za pośrednictwem Amazon Bedrock (bezserwerowo), a wkrótce będzie obsługiwany w Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale i Yotta.

Nemotron 3 Nano jest dostępny jako mikrousługa NVIDIA NIM umożliwiająca bezpieczne, skalowalne wdrożenie w dowolnym miejscu w infrastrukturze akcelerowanej przez firmę NVIDIA, zapewniającą maksymalną prywatność i kontrolę.

Oczekuje się, że Nemotron 3 Super i Ultra będą dostępne w pierwszej połowie 2026 roku.



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

Niezależna aplikacja w centrum uwagi: „Radiance” to fantastyczna, bezpłatna aplikacja do tapet dla użytkowników iPhone’a

Witamy w Prezentacja aplikacji niezależnych. To cotygodniowa seria 9to5Mac, w której prezentujemy najnowsze aplikacje ze świata niezależnych aplikacji. Jeśli jesteś programistą i chcesz,...

Kiedy rozgrywa się akcja Rycerza Siedmiu Królestw? Wyjaśniono oś czasu Gry o Tron

Rycerz Siedmiu Królestw jest najnowszy Gra o tron spin-off HBO, ale to drastycznie inny serial w porównaniu do wszystkiego, co widzieliśmy...

Praktyczny zestaw akumulatorów Anker Prime 20K: kompaktowa konstrukcja, moc wyjściowa 220 W

Anker powraca do tego ponownie z nowy power bank o pojemności 20 100 mAhpod marką Anker Prime. Ten power bank ma trzy porty,...
Advertisment