Na I/O 2025 Google ogłosił mnóstwo aktualizacji aplikacji Gemini, w tym uruchomienie aparatu na żywo 2.5 Flash i Gemini i udostępnianie ekranu na iOS.
Model aktualizacje
Aktualizacja do Flash Gemini 2.5które Google ogłosił po raz pierwszy w kwietniupoprawia wydajność rozumowania, multimodalności, kodu i długiego kontekstu, jednocześnie zwiększając wydajność o 20-30% mniejszych tokenów. Jest teraz dostępny dla wszystkich w aplikacji Gemini, podczas gdy zaktualizowana wersja podglądu (05-20) jest teraz na żywo w Google AI Studio i Vertex AI. Będzie on ogólnie dostępny dla produkcji dla programistów i klientów korporacyjnych na początku czerwca ”. Gemini 2.5 Pro uderzy GA „Wkrótce potem”.
Ogłoszono Google GEMINI 2.5 Deep Think Z zaawansowanymi możliwościami myślenia, które prowadzą w odniesieniu do matematyki (Usamo 2025), kodem (LiveCodeBench V6) i multimodalności (MMMU). Ten „ulepszony tryb rozumowania” wykorzystuje „nowe techniki badawcze umożliwiające model rozważenia wielu hipotez przed odpowiedzią”.
Firma poświęca „dodatkowy czas na przeprowadzenie większej liczby ocen bezpieczeństwa granicznego i uzyskanie dalszych informacji od ekspertów ds. Bezpieczeństwa”. Najpierw będzie dostępny dla zaufanych testerów za pośrednictwem interfejsu API GEMINI w celu uzyskania informacji zwrotnej „przed ich powszechnym udostępnieniem”. Po zakończeniu tryb Think GEMINI 2.5 Będzie dostępny dla konsumentów w ramach subskrypcji Google AI Ultra.

Będziemy nadal ulepszać głębokie myślenie w oparciu o nasze oceny bezpieczeństwa na granicy i opinii użytkowników, zanim wydamy je szersze.
Ogłoszono także Google Imagen 4 Z „realistycznymi szczegółami” i lepszymi wynikami tekstowymi/typograficznymi, a także ulepszeniami prędkości. Jest dostępny w aplikacji Bliźnięta. Veo 3 z natywnym generowaniem dźwięku jest dostępne w aplikacji Gemini (USA), jeśli masz Google AI Ultra. Obejmuje to efekty dźwiękowe, dźwięki w tle i dialog między postaciami.
Nowe funkcje Gemini
Jeśli chodzi o nowe funkcje aplikacji Gemini na I/O 2025, Google wprowadza projekt i udostępnianie iPhone’a i ekran Aplikacja iPada Po debiutu dla Androida w zeszłym miesiącu. Interfejs na żywo na żywo pełnometrażowy wyświetli nowe przyciski, aby to uruchomić. Jest dostępny dla wszystkich (bezpłatnych) użytkowników i zacznie się rozwijać iOS Dzisiaj.
Patrząc w przyszłość, Gemini Live otrzyma obsługę aplikacji/rozszerzeń Gemini dla map Google, kalendarza, zadań i zatrzymania w „nadchodzących tygodniach”. Z rozmowy możesz mieć na żywo zdarzenia kalendarzowe i mapy wyszukiwania, a w przyszłości możesz spodziewać się wsparcia dla większej liczby usług.
Głębokie badania mogą teraz (od dziś) łączyć dane publiczne z prywatnymi formalniami PDF i obrazami w celu „całościowego zrozumienia, odniesienia swojej unikalnej wiedzy z szerszymi trendami”. Integracje Gmaila i Drive „już wkrótce”.
Na przykład badacz rynku może teraz przesyłać wewnętrzne dane dotyczące sprzedaży (jako PDF) do odniesienia z trendami na rynku publicznym, wszystko w głębokich badaniach. Lub akademicki może przyciągnąć konkretne, trudne do znalezienia artykuły w czasopismach, aby wzbogacić swój przegląd literatury.
Tymczasem, kiedy napisasz coś z Canvas Gemini, nowe menu „Utwórz” pozwoli ci wygenerować stronę internetową, infografikę i quiz, a także istniejące Przegląd dźwiękuz tego. Istnieje również otwarte pole wejściowe „Opisz własną aplikację”.

Bliźnięta dodaje również interaktywne quizy:
Na przykład po prostu poproś Gemini o „stworzenie quizu ćwiczeń na termodynamice”, a następnie zanurz się w dostosowanym doświadczeniu edukacyjnym. Podczas odpowiedzi Gemini dostarcza natychmiastową opinię, podkreślając tematy, które wymagają większej uwagi. Po zakończeniu Gemini proaktywnie oferuje spersonalizowany quiz uzupełniający, koncentrujący się na obszarach, które uznałeś za trudne, pomagając przekształcić słabości w mocne strony.
Subskrybenci Google AI Ultra wkrótce otrzymają „tryb agenta” w gemini.google.com Project Mariner: „Wyobraź sobie, że po prostu podając swój cel, a Bliźnięta inteligentnie organizuje kroki, aby to osiągnąć”. Będziesz miał czat po lewej, a prawa strona pokazuje okno przeglądarki. To łączy „przeglądanie internetowe, dogłębne badania i inteligentne integracje z aplikacjami Google”
FTC: Używamy dochodów z automatycznych linków partnerskich. Więcej.