GPT-5 już jest!

Spis treści

Wczoraj, 7 sierpnia, firma OpenAI ogłosiła wprowadzenie swojego nowego modelu GPT-5 i rozpoczęła udostępnianie go użytkownikom. Oczywiście zanim model nie zostanie przetestowany przez licznych użytkowników, to niewiele będzie można powiedzieć, jednak zapowiada się ciekawie. W tym krótkim artykule chcielibyśmy podzielić się z Wami pierwszymi informacjami jakie udostępniło OpenAI, jak również naszymi bardzo wczesnymi, ogólnymi wrażeniami.

Nowy model GPT-5
#

Zacznijmy od tego, że model GPT-5 zastąpi wszystkie dotychczas nam znane modele, a zatem skończy się zastanawianie nad tym czy wybrać o3, o4 czy 4o, co było niemałą udręką dla niejednego użytkownika. Teraz będziemy mieli jeden model, który sam będzie decydował z jakich narzędzi skorzystać, w jaki sposób rozwiązać nasz problem i jak pomóc nam w zrealizowaniu projektu. Wszystkie stare modele zostaną wycofane.

I faktycznie, gdy otrzymamy dostęp do nowego modelu wszystkie pozostałe znikają, a w ich miejsce pojawia się GPT-5.

Gdy spojrzymy w menu, to mamy tam co prawda dwie opcje: GPT-5 oraz GPT-5 Thinking, jednak nie trzeba ich wybierać ręcznie, ponieważ ChatGPT może wybierać je w sposób dynamiczny, zależnie od tego nad czym pracujemy. GPT-5 Thinking ma wykazywać nieco większe zdolności wnioskowania niż GPT-5.

OpenAI twierdzi, że GPT-5 jest ich najmądrzejszym modelem, który dużo lepiej radzi sobie w porównaniu do poprzednich modeli wnioskujących, w szczególności w zadaniach związanych z programowaniem oraz wymagających rozumowania czy umiejętności matematycznych. Oczywiście na podparcie tych tez pokazują wyniki benchmarków, natomiast pamiętajmy, że testy to jedno, a realne zastosowania to drugie. Trzeba będzie poczekać aż sami użytkownicy przetestują ten model i wskażą dobre i złe strony. Jak na razie mamy silne zapewnienie dużo lepszego modelu potrafiącego stworzyć gotowy projekt programistyczny na podstawie pojedynczego zapytania. Brzmi imponująco, na prezentacji działa, ale czy zadziała w realnych zastosowaniach, zobaczymy.

Firma zapewnia również, że GPT-5 doskonale programuje w wielu językach. Nie jest to nowość, ponieważ poprzednie modele również radziły sobie z pisaniem kodu w przeróżnych językach. Jednak jak dobrze to wychodziło zależało głównie od tego czy język był bardziej czy mniej popularny, a zatem wiele zależało do danych treningowych. W przypadku popularnych języków, jak C++, gdzie danych jest od metra, modele radziły sobie lepiej, niż w przypadku języków mniej znanych i rzadziej używanych. Zobaczymy jak będzie tym razem, ale przypuszczam, że nadal programiści mało popularnych języków będą mieli przekichane.

W ramach nieskomplikowanego testu poprosiłem GPT-5 o napisanie bardzo prostej gry w języku Python, w której niedźwiedź chodzi po lesie i zbiera monety. Proste zadanie. Wykonał je bezbłędnie w ciągu kilkudziesięciu sekund. Następnie poprosiłem o dodanie innych elementów, gór, skrzyni z monetami, diamentów, a także, aby po wejściu do wody następowała utrata punktów, -1 punkt na sekundę. Zajęło mu to nieco dłużej, jednak gra działa poprawnie, ma około 400 linii kodu. Oczywiście nie jest to żaden wielki test umiejętności GPT-5, ale patrząc jak pisze kod wydaje się, że rzeczywiście jest sprawniejszy niż poprzednie modele. Czy byłbym w stanie napisać to sam? Tak, ale nie w takim tempie. Na pewno nie w ciągu 5 minut.

Obrazek przedstawiający prostą grę z niedźwiedziem — Screenshot prostej gry z niedźwiedziem

Kiedy i dla kogo
#

Nowy model będzie dostępny dla wszystkich użytkowników, bez wyjątków. Dla użytkowników korzystających z ChatGPT za darmo, jak również dla planów płatnych Plus, Team oraz Pro wdrożenie (ang. rollout) rozpoczął się 7 sierpnia, natomiast dla planów Enterprise oraz Edu nastąpi w przyszłym tygodniu.

W przypadku użytkowników korzystających z darmowego dostępu będzie istniał pewien limit zapytań. Po jego przekroczeniu model zostanie zmieniony z GPT-5 na GPT-5-mini, który jest modelem mniejszym, choć nadal zaawansowanym i dorównującym modelowi o3. Dla użytkowników planu Plus limit zapytań będzie wyższy, natomiast użytkownicy planu Pro będą mieli nieograniczony dostęp do GPT-5.

Narzędzia i tryb głosowy
#

Jeśli chodzi o dostęp do narzędzi, to GPT-5 będzie mógł korzystać ze wszystkich, które były dostępne dotychczas w poprzednich modelach. Będzie zatem potrafił pracować na tekście, obrazie, plikach zewnętrznych, a także będzie miał dostęp do Canvas, pamięci itd. Wszystko co znamy z poprzednich modeli znajdzie się również w GPT-5. Nowa wersja będzie również miała możliwość integracji z kalendarzem oraz pocztą e-mailową Google’a. Z jednej strony ciekawe, z drugiej rodzi poważne pytania o zachowanie prywatności, jednak nie jest to opcja włączona domyślnie, a zatem żeby z niej skorzystać trzeba wyrazić zgodę.

Ulepszony został również tryb głosowy, tak aby konwersacja była jeszcze bardziej naturalna. Oznacza to, że GPT-5 będzie miał te same możliwości co GPT-4o (omni), czyli interaktywnej komunikacji zarówno głosowej jak i video. Komunikacja głosowa będzie również dostępna dla użytkowników korzystających z darmowego dostępu, z pewnym limitem, który będzie umożliwiał prowadzenie rozmów przez wiele godzin. W przypadku planów płatnych rozmowy głosowe będą niemal nieograniczone czasowe. Zapewne będzie tam jakiś limit, ale na tyle duży, że nie sposób będzie go wyczerpać. No chyba, że zaśniemy z telefonem w ręku.

Halucynacje
#

Według zapewnień OpenAI GPT-5 wykazuje jeszcze niższy poziom halucynacji niż dotychczas dostępne modele ChatGPT, czyli mniej zmyśla. Jest również bardziej precyzyjny w wykonywaniu poleceń, czyli mówiąc wprost robi to o co go poprosimy, a nie to co mu się wydaje. Pamiętajmy jednak, że halucynacje są nieodłączną cechą dużych modeli językowych, a zatem jest mała szansa na całkowite wyeliminowanie tego problemu. Pisałem o tym ostatnio w poniższym artykule.

GPT-5 ma również rzadziej opowiadać dyrdymały, że wszystko się udało, że wszystko działa, gdy tymczasem w kodzie źródłowym jest wszechogarniający pożar, a nasz cały projekt przypomina jedno wielkie spaghetti.

Rzeczywiście w kilku zapytaniach, które przetestowałem odpowiedzi były lepsze niż w przypadku poprzednich modeli. Wygląda na to, że dłuższa analiza daje znacząco lepsze efekty. Model dużo częściej weryfikuje dane w dokumentacji i materiałach online, dając bardziej poprawne wyniki. Oczywiście to tylko moje subiektywne odczucie po krótkich testach. W przypadku poprzednich modeli bardzo często zdarzało mi się jednak natrafiać na radosną twórczość modelu na temat nieistniejących parametrów i ustawień. Tutaj, nie chcę zapeszać, ale jak na razie wygląda to lepiej.

Pewnym sposobem na uzyskanie lepszych wyników w GPT-5 może być poproszenie go, aby się nad czymś głębiej zastanowił. Pomocne mogą być zapytania w stylu:

Zastanów się głębiej nad następującym problemem

lub

Przeanalizuje problem wnikliwie zanim odpowiesz

Dzięki temu model może wydłużyć czas analizy i dać bardziej precyzyjną odpowiedź.

GPT-5 i opieka zdrowotna
#

Opieka zdrowotna i AI to ciągle śliski temat, stąd z pewnym zdziwieniem słuchałem Sama Altmana mówiącego, że GPT-5 świetnie nadaje się do analizy wyników medycznych i konsultacji. Nie neguję, że może być to pewnego rodzaju narzędzie do weryfikacji danych medycznych i ich analizy i może być pomocne. W wielu przypadkach zapewne AI jest w stanie znaleźć wiele zależności czy zasugerować ciekawe rozwiązania. Sam GPT-5 był testowany przez 250 lekarzy na przeróżnych zadaniach. Jednak moim zdaniem powinniśmy nadal używać go jako pewnego narzędzia dodatkowego, czegoś co zweryfikuje to co mówią lekarze, może znajdzie to, co lekarze przeoczyli. W takich zadaniach może być świetny. AI może również sprawdzić się w tłumaczeniu pacjentowi procedur medycznych i schematów leczenia. Może być to doskonałe narzędzie pomocnicze, ale mam nadzieję, że jak na razie nikomu nie przyjdzie do głowy leczenie się samemu, w szczególności w przypadku poważnych schorzeń, z pomocą GPT. Jako dodatek i weryfikacja, alternatywne spojrzenie, jasne, że tak, ale nie jako substytut służby zdrowia.

GPT-5 API
#

W API dostępne będą trzy modele GPT-5, GPT-5-mini oraz GPT-5-nano.

Rozmiar okna kontekstowego dla tych modeli wynosi 400k tokenów, a maksymalny rozmiar odpowiedzi 128k tokenów. Ceny za 1M tokenów w API wyglądają następująco:

Model	Wejście (input)	Zbuforowane wejście (cached input)	Wyjście (output)
gpt-5	$1.25	$0.125	$10.00
gpt-5-mini	$0.25	$0.025	$2.00
gpt-5-nano	$0.05	$0.005	$0.40

Podsumowanie
#

Nowy model wygląda bardzo obiecująco, jednak jak się rzeczywiście sprawuje będzie można powiedzieć dopiero po dłuższych testach przy tworzeniu rzeczywistych zastosowań. Na razie jest na to za wcześnie.
Jednak reasumując, w GPT-5 mamy:

⭐ Jeden model – dzięki czemu nie będziemy musieli się zastanawiać w co kliknąć
💻 Znacząco rozszerzone umiejętności programowania, wnioskowania i umiejętności matematyczne
🔉 Poprawiony tryb głosowy udostępniony również użytkownikom w planie darmowym
🚑 Poprawione odpowiedzi dotyczące zdrowia
🎯 Mniejszy poziom halucynacji i bardziej dokładne podążanie za poleceniami użytkownika

Nowy model GPT-5 #

Kiedy i dla kogo #

Narzędzia i tryb głosowy #

Halucynacje #

GPT-5 i opieka zdrowotna #

GPT-5 API #

Podsumowanie #

Zobacz także