Najnowsze Google Gemini 2.5 Pro dominuje w testach porównawczych AI i zadania rozumowania



Google właśnie wydał swój najnowszy flagowy model AI Gemini 2.5 Pro. Na wypadek, gdybyś nie wiedział, to Google stworzył Oryginalna architektura modelu transformatora Używają Chatgpt Openai, Grok Xai, antropic Claude i inne modele. Google od dłuższego czasu iterowało serię modeli Gemini, a firma wydała jak dotąd najpotężniejszą wersję-Gemini 2.5 Pro. Będąc rodziną v2.5, jest to część modeli myślenia, zdolna do rozumowania ich myśli przed wyprodukcją produkcji, pozwalając mu powtórzyć swoje „myśli” przed uzyskaniem optymalnych wyników. Rozumowanie, wykonane poprzez uczenie się wzmacniające i mianie, zmusza model do analizy i rysowania logicznych rozwiązań krok po kroku, zapewniając lepsze wyniki.

W LMAREA, który daje użytkownikom wyniki modelu AI, które oceniają i decydują, który jest lepszy, Gemini 2.5 Pro wspinał się na szczyt w rankingu, z numerem jeden w obszarach takich jak twarde podpowiedzi, kodowanie, matematyka, kreatywne pisanie, instruktaż, dłuższe zapytanie i wielokrotne odpowiedzi. Jest to imponujący wynik dla Google, ponieważ prowadzi teraz tablicę liderów we wszystkich tych obszarach i bije Xai Grok 3 i Openai GTP-4.5. W standaryzowanych testach porównawczych branży AI Gemini 2.5 Pro jest również liderem w większości punktów odniesienia, takich jak Aime, LiveCodeBench, Aider, SWE-Bench, Simpleqa i inne. Co ciekawe, 18,8% w ostatnim egzaminie ludzkości jest obecnie najtrudniejszym punktem odniesienia AI. Co ciekawe, Google Gemini 2.5 Pro może przetwarzać ogromny kontekst za pomocą jednego miliona tokenów, które wkrótce rozciągnie się do dwóch milionów tokenów. Dosłownie wystarczy przetworzyć całe książki kontekstu, aby podać model. Gemini 2.5 Pro jest teraz dostępny w Google AI Studio, a zaawansowani użytkownicy Gemini mogą wybrać je w rozwijaniu modelu na komputerze stacjonarnym i mobilnym.



Source link

Advertisment

Więcej

Advertisment

Podobne

Advertisment

Najnowsze

TechPowerup uwalnia NVCLEANstall v1.19.0 | TechPowerup

TechPowerup wydał dziś najnowszą wersję NVCleanstall, naszego lekkiego narzędzia, która pozwala pobierać i zainstalować sterowniki NVIDIA GeForce o znacznie wyższym poziomie dostosowywania niż...

Uruchamianie gier Windows na MAC po prostu stało się droższe

Jeśli chcesz uruchomić Okna gra na twoim Prochowiecmiałeś do tej pory dwie opcje - bezpłatną aplikację whisky i płatną crossover. Niestety, ale zrozumiałe,...

Sprawa korupcji Erica Adamsa się skończyła, ale prokuratorzy DOJ nadal rezygnują

Coś jest zepsute w Departamencie Sprawiedliwości. Trzej prokuratorzy federalni powiedzieli swoim przełożonym, że wolą rezygnować, niż przyznać się do wykroczenia w związku z...
Advertisment