Drodzy,
dzisiaj bez owijania w bawełnę. Tak zwane samo mięcho.
Przygotowuję się właśnie do przeprowadzenia całego dnia wykładów na studiach podyplomowych na temat, szeroko pojętej, sztucznej inteligencji (dacie wiarę?!) i pomyślałem, że konkretne, praktyczne przypomnienie najlepszych praktyk oraz rzeczowych porad promptowania każdemu może się przydać. Dobrego czytania:
1. Place zabaw są w modzie
Warto mieć nieustającą świadomość, że komercyjne modele (ChatGPT, Claude, Gemini), do których dostęp otrzymujemy przez starannie zaprojektowany interfejs chatu, to nic innego, jak produkt (źródełko funduszy) gigantycznych przedsiębiorstw. Jest on uśrednioną wersją danego modelu dostosowaną tak, by odpowiadał najszerszej rzeszy odbiorców.
Słowem - jeśli wchodzisz i korzystasz z Chat’aGPT, ma on pod spodem zaimplementowaną wiadomość systemową, by odpowiadać w statystycznie najbardziej zadowalający sposób.
Jeśli zależy Ci na rzetelnym przetestowaniu modelu (bez wiadomości systemowej ani wpływu historii Twojego konta), zrobisz to na tzw. “placu zabaw” wewnątrz natywnej platformy OpenAI. Możesz tam porównywać modele bezpośrednio, bawić się temperaturą, promptami i szeregiem innych, bardziej zaawansowanych zastosowań. Odpowiednikiem dla googlowskich modeli jest Google AI Studio, o którym miałem przyjemność nagrać cały materiał w tym tygodniu [LINK]
2. Zagęszczaj przekaz
Im więcej słów, tym gorszy wynik. Szanuj swoje opuszki palców, nie powtarzaj tego samego na trzy, coraz to bardziej wyszukane, sposoby. AI ma gdzieś, jak elokwentny jesteś. Lepiej dać sensowny przykład, o czym mowa poniżej.
3. Jeden-strzał vs Zero-strzał
Mowa tu o technice promptowania, która po angielsku nazywa się One-shot prompting i sprowadza się do bardzo prostej zasady, którą szybko potwierdzę poniższym wykresem:
One Shot, czy też Few Shot to po prostu Jeden Przykład, lub Kilka Przykładów, czyli:
Załączaj przykłady rezultatów, które chcesz uzyskać!
4. System, user & asystent
3 podstawowe typy promptów, które obowiązują przy większości powszechnie stosowanych modeli, które warto znać:
Sytem prompt - to, w wielkim skrócie, odpowiadanie modelowi sztucznej inteligencji na pytanie “Kim jestem”. Nadajemy tutaj kierunek, rolę i niezbędne ograniczenia. Wiadomość systemowa w komercyjnych interfejsach jest ustawiona automatycznie. Nie możemy jej modyfikować.
User prompt - to nasze polecenie. Za każdym, jednym razem, kiedy wpisujesz “Wytłumacz mi to, jakbym miał 5 lat. Szybko.” w okno chatu, wysyłasz właśnie wiadomość użytkownika.
Assistent prompt - to odpowiedź modelu. Staje się ona cześcią polecenia, gdy kontynuujemy rozmowę w tym samym oknie.
5. Niejednoznaczość
Jesteś w brytyjskim pubie. Kolega namawia cię na grę w rzutki. Świetnie. Załóżmy, że na trzeźwo jesteś naprawdę przyzwoitym graczem. Trafiasz 8/10 rzutów w sam środek (lub potrójną 19-stkę). Jednak, z każdym kolejnym ‘napojem alkoholwym’ częstotliwość trafnych rzutów zmniejsza się o 1.
Niejednoznaczne instrukcje w Twoim poleceniu (prompcie) są dokładnie tym, bliżej niezdefiniowanym, napojem alkoholowym. Rozrzedzają twoją koncentrację i prawdopodobieństwo trafienia dokładnie tam, gdzie chcesz.
❌ "Bądź kreatywny"
✅ "Podaj minimum 5 różnych wariantów"
✅ "ZAWSZE dołącz jedną nietypową opcję"
❌ "Odpowiadaj zwięźle"
✅ "Maksymalnie 3 zdania na odpowiedź"
✅ "NIGDY więcej niż 150 słów"
❌ "Pisz prosto"
✅ "NIGDY nie używaj słów dłuższych niż 4 sylaby"
✅ "ZAWSZE wyjaśnij terminy techniczne w nawiasach"
✅ "Maksymalnie 20 słów na zdanie"
6. Unikaj wykluczających się zwrotów
Drobny niuans, ale może wprowadzić zamęt w odpowiedzi. Tutaj, mój ulubiony przykład: “Przygotuj mi wyczerpujące streszczenie”… Polecałbym się jednak zdecydować na jedno :)
7. Schemat, który rzadko zawodzi
Frameworków promptowania jest całe mnóstwo. Dobrze się sprzedają, bo każdy ma swój unikalny, łatwy do zapamiętania akronim (RTF, TAG, BAB, CARE, RISE, AIM, GRO, FIT, LED). Ja jednak jestem zwolennikiem zakodowania sobie jednego, który rzadko zawodzi:
Kontekst (określasz, kim jesteś i czego chcesz)
Instrukcje (precyzyjnie opisujesz zadanie)
Format wyjściowy (wskazujesz, jak ma wyglądać finalny wynik)
Zasady (podajesz listę rzeczy dozwolonych i zabronionych)
Przykłady (dostarczasz parę przykładów)
💡 Ile z siedmu powyższych punktów znasz i regularnie stosujesz?
Najważniejsze newsy z minionego tygodnia:
1. Dario Amodei przestrzega przed masowym bezrobociem
CEO Anthropic przewiduje, że AI wyeliminuje 50% juniorskich posad w ciągu 5 lat, a 90% kodu będzie pisane przez sztuczną inteligencję już za 6 miesięcy. Proponuje "podatek tokenowy" dla firm AI jako rozwiązanie. Warto pamiętać, że to jeden z niewielu ‘ojców założycieli’, który faktycznie przejmuje się ludzkością.
2. Zjednoczone Emiraty Arabskie wykupiły subskrypcję GPT Plus dla wszystkich swoich obywateli
Zjednoczone Emiraty Arabskie jako pierwszy kraj na świecie zapewniają darmowy dostęp do ChatGPT Plus (normalnie $20/miesiąc) dla całej populacji w ramach partnerstwa z OpenAI. Dodatkowo budują gigantyczne centrum danych Stargate UAE o mocy 1GW, które ruszy w 2026 roku.
3. Anthropic wprowadza tryb głosowy do Claude'a
Funkcja rozmowy głosowej trafi do aplikacji mobilnych Claude'a w najbliższych tygodniach, z 5 osobowościami głosowymi i integracją z Google Workspace dla płatnych użytkowników. Darmowi użytkownicy dostaną 20-30 wiadomości głosowych miesięcznie. Anthropic jako ostatni z gigantów dołącza do wyścigu głosowego.
4. Kling wypuscza nowy model filmowy
Kuaishou Technology (firma stojąca za Kling) przedstawiła najnowszy model do tworzenia filmów na podstawie zdjęć. Nowy Kling 2.1 jest lepszy, tańszy i szalenie imponujący.
Uśmiech na koniec
Dzięki za dziś!
Wszystkiego dobrego,
Mikołaj Abramczuk
„CEO Anthropic przewiduje, że AI wyeliminuje 50% juniorskich posad w ciągu 5 lat, a 90% kodu będzie pisane przez sztuczną inteligencję już za 6 miesięcy” to brzmi bardzo niepokojąco. Czy zawód programisty czeka totalna rewolucja? Czy pozycja ta odejdzie do lamusa tak jak „żywe komputery” - kobiety które ręcznie obliczały np. położenie ciał niebieskich dla NASA w latach 40.?