Metodologia badawcza
Quiz autorefleksji OnTilt jest zbudowany na recenzowanych badaniach z dziedzin uzależnień behawioralnych, warunkowania sprawczego, wzorców projektowych HCI oraz dobrostanu w pracy. Ta strona wyjaśnia, jak zaprojektowaliśmy narzędzie, co mierzy i na jakim etapie walidacji się znajdujemy.
Podstawy badawcze
Nasza wyjściowa obserwacja: pętla interakcji z agentycznymi narzędziami do kodowania (Claude Code, Cursor, Copilot) może wykazywać strukturalne podobieństwa do automatów do gier — niski koszt próby, nieprzewidywalna jakość wyniku, natychmiastowa możliwość powtórzenia i efekt „prawie udało się”, który napędza kontynuację. Nazywamy to „hipotezą automatu do gier.”
To nie jest metafora wyjęta z powietrza. Opiera się na bazie 32 recenzowanych źródeł z badań nad hazardem, uzależnieniem od mediów społecznościowych, projektowaniem produktów cyfrowych i psychologii klinicznej. To jest hipoteza badawcza, nie ustalony fakt kliniczny. Mechanizmy zaczerpnięto z recenzowanych badań nad uzależnieniami w innych domenach (hazard, media społecznościowe) i zastosowano przez analogię do narzędzi AI do kodowania. Bezpośrednia walidacja empiryczna dla tej populacji jest w toku. Na ich podstawie zaproponowaliśmy sześć mechanizmów jako ramę interpretacyjną wzorców podczas intensywnej pracy programistów z narzędziami AI:
- Wzmocnienie o zmiennym stosunku — AI dostarcza wartościowe outputy w nieprzewidywalnych odstępach, ten sam schemat, który sprawia, że automaty do gier są angażujące [3]
- Efekt near-miss — kod, który „prawie działa”, silniej napędza kontynuację niż całkowite niepowodzenie [4]
- Eskalacja kosztów utopionych — zainwestowany czas i uwaga utrudniają wycofanie się [5]
- Niezamierzona immersja („dark flow”) — kodowanie z AI tworzy szybką pętlę wyzwanie-feedback, która może tworzyć wzorzec przypominający to, co badacze hazardu nazywają „dark flow” [6]
- Nawyk sprawdzania / nagroda przerywana — krótkie, powtarzalne interakcje wzmacniane szybkim „informacyjnym rewardem” [7]
- Awersja do straty — brak dostępu do narzędzia odczuwany jest jako strata, nie powrót do normy [5]
Nasza struktura wymiarowa czerpie z modelu komponentowego uzależnień behawioralnych Griffithsa [8], kryteriów zaburzenia grania ICD-11 [9] i kryteriów zaburzenia hazardowego DSM-5 [10]. Uwzględniliśmy również najnowsze skale problematycznego użycia ChatGPT [11] oraz zależności od konwersacyjnej AI [12].
Sześć wymiarów
Każdy wymiar mapuje się na jeden lub więcej mechanizmów z badań nad uzależnieniami, które mogą mieć paralele we wzorcach korzystania z narzędzi AI. Razem tworzą wielowymiarowy profil, a nie pojedynczy wynik.
Utrata kontroli
Mierzy: Rozbieżność między intencją zaprzestania a faktycznym zachowaniem. „Planowałem skończyć o 18:00 — jest 22:30.”
Mechanizm: Wzmocnienie o zmiennym stosunku + nagroda przerywana. AI dostarcza dobre outputy w nieprzewidywalnych momentach, tworząc ten sam wzorzec wzmocnienia co automaty do gier.
Dlaczego to ważne: Upośledzona kontrola wolicjonalna to centralne kryterium uzależnienia behawioralnego w ramach DSM-5 i ICD-11. Trzy pytania celują w ten wymiar ze względu na jego wagę diagnostyczną.
Eskalacja sesji
Mierzy: Tendencję do wydłużania sesji, szczególnie gdy wyniki „prawie działają.” „Prawie przechodzi — jeszcze jedna próba” powtórzone piętnaście razy.
Mechanizm: Efekt near-miss + koszty utopione. Kod z 1–2 niezdanymi testami wygląda jak „prawie wygrana”, nie porażka. Już zainwestowany czas sprawia, że przerwanie wydaje się marnotrawstwem.
Dlaczego to ważne: Near-miss jest jednym z najsilniejszych driverów kontynuacji zachowań hazardowych. W kodowaniu z AI stan „prawie działa” to norma, nie wyjątek.
Dark flow / Immersja
Mierzy: Utratę kontaktu z fizyczną rzeczywistością podczas sesji AI — zniekształcenie poczucia czasu, zaniedbywanie jedzenia, picia i odpoczynku. „Nie jadłem 6 godzin i tego nie zauważyłem.”
Mechanizm: Wzorzec przypominający to, co badacze hazardu nazywają „dark flow.” Kodowanie z AI tworzy idealną pętlę — prompt, natychmiastowy output, kolejny prompt — z dramatycznie szybszym feedbackiem niż tradycyjne programowanie. Stawiamy hipotezę, że ta szybka pętla może tworzyć niezamierzoną immersję, w której tempo narzędzia prowadzi sesję, a nie intencja użytkownika.
Dlaczego to ważne: Flow sam w sobie jest pozytywny. Ale niezamierzona, przedłużona immersja, która przesłania sygnały ciała, wchodzi w strefę dysregulacji. Odróżniamy produktywny flow od „dark flow” — absorpcji bez świadomej intencji.
Zależność operacyjna
Mierzy: Reakcję na niedostępność narzędzia AI — lęk, irytację, niezdolność do pracy — oraz to, czy zacząłeś polegać na nim w zadaniach, które kiedyś realizowałeś samodzielnie.
Mechanizm: Awersja do straty + nagroda przerywana. Brak AI odczuwany jest jako strata, nie powrót do wcześniejszej normy. Nieprzewidywalna dostępność (rate limits, awarie) może paradoksalnie wzmacniać zachowania sprawdzające.
Dlaczego to ważne: Objawy odstawienne to kluczowy komponent uzależnienia behawioralnego. Jeśli przez lata kodowałeś bez AI, a teraz nie jesteś w stanie ruszyć bez niego — ta zmiana jest warta zbadania.
Negatywne konsekwencje
Mierzy: Obserwowalne skutki dalszego planu — zaburzony sen, komentarze rodziny lub współpracowników, kontynuowanie mimo świadomości szkód.
Mechanizm: Wszystkie sześć mechanizmów tu się zbiegają. Ten wymiar rejestruje ich skumulowane efekty, a nie pojedynczy czynnik napędzający.
Dlaczego to ważne: „Kontynuowanie mimo negatywnych konsekwencji” to kluczowe kryterium diagnostyczne w ramach uzależnień behawioralnych. Trzy pytania celują w ten wymiar, a jedno (kontynuowanie mimo świadomości szkód) pełni rolę red flag niezależnie od sumy punktów.
Przesunięcie na antycypację
Mierzy: Czy źródło satysfakcji przesunęło się z wyniku na proces — streaming outputu bardziej ekscytuje niż to, czy kod działa; odpalanie promptów bez jasnego celu.
Mechanizm: Wzmocnienie o zmiennym stosunku + nagroda przerywana. Wzorzec behawioralny sugeruje, że nagroda może pojawiać się w nieprzewidywalnych momentach procesu, więc sam proces staje się wzmacniający. Streaming outputu może wzmacniać antycypację i częste sprawdzanie postępów, analogicznie do pull-to-refresh w mediach społecznościowych.
Dlaczego to ważne: To najsubtelniejszy wymiar i najtrudniejszy do samodzielnego wykrycia. Gdy sam akt generowania ma większe znaczenie niż output, nagroda przesunęła się z wyniku na antycypację — cecha charakterystyczna zachowań kompulsywnych.
Konstrukcja quizu
| Pytania | 14 scoringowanych + 4 kontekstowe (niescoringowane) |
| Skala | 5-stopniowa Likerta (0–4): Nigdy / Rzadko / Czasami / Często / Zawsze |
| Kotwica czasowa | „W ciągu ostatnich 30 dni” |
| Zakres punktowy | 0–56 (procent mapowany na cztery poziomy) |
| Czas wypełniania | ~3 minuty |
| Zbieranie danych | Anonimowe |
Zasady projektowe
- Autorefleksja, nie diagnoza. Quiz jest narzędziem przesiewowym. Nie diagnozuje żadnego zaburzenia. W DSM-5 ani ICD-11 nie istnieje uznana kategoria kliniczna „uzależnienia od narzędzi AI.”
- Kotwiczenie behawioralne. Każdy item opisuje konkretne, obserwowalne zachowanie (nie emocję czy cechę), z wbudowanym markerem dysregulacji, np. „mimo planu zaprzestania” czy „mimo świadomości szkód.”
- Okno 30 dni. Odpowiedzi są zakotwiczone w ostatnich 30 dniach, aby zmniejszyć bias pamięciowy i uchwycić aktualne wzorce.
- System red flag. Dwa itemy — kontynuowanie mimo świadomości szkód (csq-3) i powtarzające się niepowodzenie w dotrzymywaniu własnych limitów (ctrl-3) — wyzwalają specjalny komunikat niezależnie od sumy punktów. Odpowiadają kluczowym kryteriom uzależnienia w ICD-11 i DSM-5.
Rozkład pytań
Utrata kontroli i Negatywne konsekwencje mają po 3 pytania (21,4% wagi każdy). Pozostałe cztery wymiary mają po 2 pytania (14,3%). To celowe: upośledzona kontrola jest centralnym konstruktem uzależnienia behawioralnego, a konsekwencje dostarczają najtwardszych dowodów (obserwowalnych, zewnętrznych).
Status walidacji
Wierzymy w transparentność co do tego, na jakim etapie znajduje się nasz instrument.
Obecnie: v2 (research preview)
- Sformułowania itemów oparte na recenzowanych instrumentach (Problematic ChatGPT Use Scale, skale zależności od CAI) i ramach klinicznych (ICD-11, DSM-5)
- Ulepszone właściwości psychometryczne względem v1: czystsza separacja itemów, kotwiczenie behawioralne, rozróżnienie flow vs. dysregulacja
- Wstępne progi scoringowe (25/50/75%) — to racjonalne cut-offy, nie normy empiryczne
Planowana ścieżka walidacji
- Wywiady kognitywne (5–10 uczestników) — czy respondenci interpretują itemy zgodnie z zamierzeniem?
- Eksploracyjna i konfirmacyjna analiza czynnikowa (EFA/CFA) — czy struktura 6 czynników utrzymuje się empirycznie?
- Kalibracja IRT (Item Response Theory / GRM) — które itemy najlepiej różnicują w kontinuum nasilenia?
- Niezmienniczość pomiarowa — czy instrument działa równoważnie w wersji PL/EN i różnych trybach użycia (IDE copilot vs. chat vs. agent)?
- Normy empiryczne — zastąpienie arbitralnych progów procentowych cut-offami opartymi na percentylach z rzeczywistych danych kohortowych
Znane ograniczenia
- Bias samooceny — respondenci najbardziej dotknięci mogą minimalizować swoje odpowiedzi
- Brak walidacji klinicznej — test-retest reliability, construct validity i analiza czynnikowa są w toku
- Wrażliwość kontekstowa — wyniki mogą się wahać w zależności od deadline'ów, dostępności narzędzia i nastroju
- Zaangażowanie vs. dysregulacja — niektóre rejestrowane zachowania (długie sesje skupienia) mogą być zdrowe w odpowiednim kontekście
- Specyficzność populacji — quiz celuje w power userów AI (programistów, 10+ godzin/tydzień). Casual users lub osoby niekodujące mogą uznać itemy za mało trafne
Nasz framing: higiena, nie abstynencja
OnTilt nie jest projektem anty-AI. Sami intensywnie korzystamy z narzędzi AI. Framing jest celowy:
- Higiena, nie abstynencja. Jak higiena snu czy higiena jamy ustnej — chodzi o zrównoważone praktyki, nie zakazy.
- Świadomość, nie patologizowanie. Celowo unikamy etykietowania intensywnego użycia jako „uzależnienia.” Wynikiem jest profil behawioralny i red flagi, nigdy etykieta kliniczna [14].
- Uznana dualność. Narzędzia AI do kodowania są naprawdę potężne. Te same mechanizmy, które czynią je angażującymi, sprawiają, że warto je badać. Obie rzeczy są prawdą.
- Oparcie na danych. Zbieramy anonimowe dane badawcze, by docelowo zastąpić intuicję dowodami.
Wybrana bibliografia
- [3] Lindström et al. (2021). A computational reward learning account of social media engagement. PMC7910435
- [4] Clark et al. (2009). Gambling near-misses enhance motivation to gamble and recruit win-related brain circuitry. PMC2658737
- [5] Arkes & Blumer (1985). The psychology of sunk cost. Organizational Behavior and Human Decision Processes
- [6] Abuhamdeh (2020). Investigating the "flow" experience: Key conceptual and operational issues. PMC7033418
- [7] Oulasvirta et al. (2012). Habits make smartphone use more pervasive. Personal and Ubiquitous Computing
- [8] Griffiths, M.D. (2005). A 'components' model of addiction within a biopsychosocial framework. Journal of Substance Use, 10(4), 191-197
- [9] WHO. Gaming Disorder FAQ. WHO
- [10] APA. What Is Gambling Disorder? (patient-facing resource). APA. For research, see: DSM-5-TR (2022).
- [11] Zhao, Y. et al. (2024). Development and validation of the Problematic ChatGPT Use Scale. Current Psychology. Turkish CFA/IRT validation: IJMHA 2025
- [12] CAI dependence scale — uncontrollability, withdrawal, mood modification, negative impacts. Frontiers in Psychology
- [13] Compulsive ChatGPT use and associations with anxiety, burnout, and sleep. Acta Psychologica
- [14] "People are not becoming 'AIholic'" (2025). Caution against premature "addiction" labels for AI use. Addictive Behaviors
Pełna bibliografia (32 źródła) jest dostępna na stronie Badania.
Chcesz sprawdzić swoje wzorce?
3 minuty. 14 pytań. Anonimowo. Oparte na badaniach.
Rozpocznij autorefleksję →