Metodologia badawcza

Quiz autorefleksji OnTilt jest zbudowany na recenzowanych badaniach z dziedzin uzależnień behawioralnych, warunkowania sprawczego, wzorców projektowych HCI oraz dobrostanu w pracy. Ta strona wyjaśnia, jak zaprojektowaliśmy narzędzie, co mierzy i na jakim etapie walidacji się znajdujemy.

Podstawy badawcze

Nasza wyjściowa obserwacja: pętla interakcji z agentycznymi narzędziami do kodowania (Claude Code, Cursor, Copilot) może wykazywać strukturalne podobieństwa do automatów do gier — niski koszt próby, nieprzewidywalna jakość wyniku, natychmiastowa możliwość powtórzenia i efekt „prawie udało się”, który napędza kontynuację. Nazywamy to „hipotezą automatu do gier.”

To nie jest metafora wyjęta z powietrza. Opiera się na bazie 32 recenzowanych źródeł z badań nad hazardem, uzależnieniem od mediów społecznościowych, projektowaniem produktów cyfrowych i psychologii klinicznej. To jest hipoteza badawcza, nie ustalony fakt kliniczny. Mechanizmy zaczerpnięto z recenzowanych badań nad uzależnieniami w innych domenach (hazard, media społecznościowe) i zastosowano przez analogię do narzędzi AI do kodowania. Bezpośrednia walidacja empiryczna dla tej populacji jest w toku. Na ich podstawie zaproponowaliśmy sześć mechanizmów jako ramę interpretacyjną wzorców podczas intensywnej pracy programistów z narzędziami AI:

Wzmocnienie o zmiennym stosunku — AI dostarcza wartościowe outputy w nieprzewidywalnych odstępach, ten sam schemat, który sprawia, że automaty do gier są angażujące [3]
Efekt near-miss — kod, który „prawie działa”, silniej napędza kontynuację niż całkowite niepowodzenie [4]
Eskalacja kosztów utopionych — zainwestowany czas i uwaga utrudniają wycofanie się [5]
Niezamierzona immersja („dark flow”) — kodowanie z AI tworzy szybką pętlę wyzwanie-feedback, która może tworzyć wzorzec przypominający to, co badacze hazardu nazywają „dark flow” [6]
Nawyk sprawdzania / nagroda przerywana — krótkie, powtarzalne interakcje wzmacniane szybkim „informacyjnym rewardem” [7]
Awersja do straty — brak dostępu do narzędzia odczuwany jest jako strata, nie powrót do normy [5]

Nasza struktura wymiarowa czerpie z modelu komponentowego uzależnień behawioralnych Griffithsa [8], kryteriów zaburzenia grania ICD-11 [9] i kryteriów zaburzenia hazardowego DSM-5 [10]. Uwzględniliśmy również najnowsze skale problematycznego użycia ChatGPT [11] oraz zależności od konwersacyjnej AI [12].

Sześć wymiarów

Każdy wymiar mapuje się na jeden lub więcej mechanizmów z badań nad uzależnieniami, które mogą mieć paralele we wzorcach korzystania z narzędzi AI. Razem tworzą wielowymiarowy profil, a nie pojedynczy wynik.

Wymiar 1

Utrata kontroli

Mierzy: Rozbieżność między intencją zaprzestania a faktycznym zachowaniem. „Planowałem skończyć o 18:00 — jest 22:30.”

Mechanizm: Wzmocnienie o zmiennym stosunku + nagroda przerywana. AI dostarcza dobre outputy w nieprzewidywalnych momentach, tworząc ten sam wzorzec wzmocnienia co automaty do gier.

Dlaczego to ważne: Upośledzona kontrola wolicjonalna to centralne kryterium uzależnienia behawioralnego w ramach DSM-5 i ICD-11. Trzy pytania celują w ten wymiar ze względu na jego wagę diagnostyczną.

Wymiar 2

Eskalacja sesji

Mierzy: Tendencję do wydłużania sesji, szczególnie gdy wyniki „prawie działają.” „Prawie przechodzi — jeszcze jedna próba” powtórzone piętnaście razy.

Mechanizm: Efekt near-miss + koszty utopione. Kod z 1–2 niezdanymi testami wygląda jak „prawie wygrana”, nie porażka. Już zainwestowany czas sprawia, że przerwanie wydaje się marnotrawstwem.

Dlaczego to ważne: Near-miss jest jednym z najsilniejszych driverów kontynuacji zachowań hazardowych. W kodowaniu z AI stan „prawie działa” to norma, nie wyjątek.

Wymiar 3

Dark flow / Immersja

Mierzy: Utratę kontaktu z fizyczną rzeczywistością podczas sesji AI — zniekształcenie poczucia czasu, zaniedbywanie jedzenia, picia i odpoczynku. „Nie jadłem 6 godzin i tego nie zauważyłem.”

Mechanizm: Wzorzec przypominający to, co badacze hazardu nazywają „dark flow.” Kodowanie z AI tworzy idealną pętlę — prompt, natychmiastowy output, kolejny prompt — z dramatycznie szybszym feedbackiem niż tradycyjne programowanie. Stawiamy hipotezę, że ta szybka pętla może tworzyć niezamierzoną immersję, w której tempo narzędzia prowadzi sesję, a nie intencja użytkownika.

Dlaczego to ważne: Flow sam w sobie jest pozytywny. Ale niezamierzona, przedłużona immersja, która przesłania sygnały ciała, wchodzi w strefę dysregulacji. Odróżniamy produktywny flow od „dark flow” — absorpcji bez świadomej intencji.

Wymiar 4

Zależność operacyjna

Mierzy: Reakcję na niedostępność narzędzia AI — lęk, irytację, niezdolność do pracy — oraz to, czy zacząłeś polegać na nim w zadaniach, które kiedyś realizowałeś samodzielnie.

Mechanizm: Awersja do straty + nagroda przerywana. Brak AI odczuwany jest jako strata, nie powrót do wcześniejszej normy. Nieprzewidywalna dostępność (rate limits, awarie) może paradoksalnie wzmacniać zachowania sprawdzające.

Dlaczego to ważne: Objawy odstawienne to kluczowy komponent uzależnienia behawioralnego. Jeśli przez lata kodowałeś bez AI, a teraz nie jesteś w stanie ruszyć bez niego — ta zmiana jest warta zbadania.

Wymiar 5

Negatywne konsekwencje

Mierzy: Obserwowalne skutki dalszego planu — zaburzony sen, komentarze rodziny lub współpracowników, kontynuowanie mimo świadomości szkód.

Mechanizm: Wszystkie sześć mechanizmów tu się zbiegają. Ten wymiar rejestruje ich skumulowane efekty, a nie pojedynczy czynnik napędzający.

Dlaczego to ważne: „Kontynuowanie mimo negatywnych konsekwencji” to kluczowe kryterium diagnostyczne w ramach uzależnień behawioralnych. Trzy pytania celują w ten wymiar, a jedno (kontynuowanie mimo świadomości szkód) pełni rolę red flag niezależnie od sumy punktów.

Wymiar 6

Przesunięcie na antycypację

Mierzy: Czy źródło satysfakcji przesunęło się z wyniku na proces — streaming outputu bardziej ekscytuje niż to, czy kod działa; odpalanie promptów bez jasnego celu.

Mechanizm: Wzmocnienie o zmiennym stosunku + nagroda przerywana. Wzorzec behawioralny sugeruje, że nagroda może pojawiać się w nieprzewidywalnych momentach procesu, więc sam proces staje się wzmacniający. Streaming outputu może wzmacniać antycypację i częste sprawdzanie postępów, analogicznie do pull-to-refresh w mediach społecznościowych.

Dlaczego to ważne: To najsubtelniejszy wymiar i najtrudniejszy do samodzielnego wykrycia. Gdy sam akt generowania ma większe znaczenie niż output, nagroda przesunęła się z wyniku na antycypację — cecha charakterystyczna zachowań kompulsywnych.

Konstrukcja quizu

Pytania	14 scoringowanych + 4 kontekstowe (niescoringowane)
Skala	5-stopniowa Likerta (0–4): Nigdy / Rzadko / Czasami / Często / Zawsze
Kotwica czasowa	„W ciągu ostatnich 30 dni”
Zakres punktowy	0–56 (procent mapowany na cztery poziomy)
Czas wypełniania	~3 minuty
Zbieranie danych	Anonimowe

Zasady projektowe

Autorefleksja, nie diagnoza. Quiz jest narzędziem przesiewowym. Nie diagnozuje żadnego zaburzenia. W DSM-5 ani ICD-11 nie istnieje uznana kategoria kliniczna „uzależnienia od narzędzi AI.”
Kotwiczenie behawioralne. Każdy item opisuje konkretne, obserwowalne zachowanie (nie emocję czy cechę), z wbudowanym markerem dysregulacji, np. „mimo planu zaprzestania” czy „mimo świadomości szkód.”
Okno 30 dni. Odpowiedzi są zakotwiczone w ostatnich 30 dniach, aby zmniejszyć bias pamięciowy i uchwycić aktualne wzorce.
System red flag. Dwa itemy — kontynuowanie mimo świadomości szkód (csq-3) i powtarzające się niepowodzenie w dotrzymywaniu własnych limitów (ctrl-3) — wyzwalają specjalny komunikat niezależnie od sumy punktów. Odpowiadają kluczowym kryteriom uzależnienia w ICD-11 i DSM-5.

Rozkład pytań

Utrata kontroli i Negatywne konsekwencje mają po 3 pytania (21,4% wagi każdy). Pozostałe cztery wymiary mają po 2 pytania (14,3%). To celowe: upośledzona kontrola jest centralnym konstruktem uzależnienia behawioralnego, a konsekwencje dostarczają najtwardszych dowodów (obserwowalnych, zewnętrznych).

Status walidacji

Wierzymy w transparentność co do tego, na jakim etapie znajduje się nasz instrument.

Obecnie: v2 (research preview)

Sformułowania itemów oparte na recenzowanych instrumentach (Problematic ChatGPT Use Scale, skale zależności od CAI) i ramach klinicznych (ICD-11, DSM-5)
Ulepszone właściwości psychometryczne względem v1: czystsza separacja itemów, kotwiczenie behawioralne, rozróżnienie flow vs. dysregulacja
Wstępne progi scoringowe (25/50/75%) — to racjonalne cut-offy, nie normy empiryczne

Planowana ścieżka walidacji

Wywiady kognitywne (5–10 uczestników) — czy respondenci interpretują itemy zgodnie z zamierzeniem?
Eksploracyjna i konfirmacyjna analiza czynnikowa (EFA/CFA) — czy struktura 6 czynników utrzymuje się empirycznie?
Kalibracja IRT (Item Response Theory / GRM) — które itemy najlepiej różnicują w kontinuum nasilenia?
Niezmienniczość pomiarowa — czy instrument działa równoważnie w wersji PL/EN i różnych trybach użycia (IDE copilot vs. chat vs. agent)?
Normy empiryczne — zastąpienie arbitralnych progów procentowych cut-offami opartymi na percentylach z rzeczywistych danych kohortowych

Znane ograniczenia

Bias samooceny — respondenci najbardziej dotknięci mogą minimalizować swoje odpowiedzi
Brak walidacji klinicznej — test-retest reliability, construct validity i analiza czynnikowa są w toku
Wrażliwość kontekstowa — wyniki mogą się wahać w zależności od deadline'ów, dostępności narzędzia i nastroju
Zaangażowanie vs. dysregulacja — niektóre rejestrowane zachowania (długie sesje skupienia) mogą być zdrowe w odpowiednim kontekście
Specyficzność populacji — quiz celuje w power userów AI (programistów, 10+ godzin/tydzień). Casual users lub osoby niekodujące mogą uznać itemy za mało trafne

Nasz framing: higiena, nie abstynencja

OnTilt nie jest projektem anty-AI. Sami intensywnie korzystamy z narzędzi AI. Framing jest celowy:

Higiena, nie abstynencja. Jak higiena snu czy higiena jamy ustnej — chodzi o zrównoważone praktyki, nie zakazy.
Świadomość, nie patologizowanie. Celowo unikamy etykietowania intensywnego użycia jako „uzależnienia.” Wynikiem jest profil behawioralny i red flagi, nigdy etykieta kliniczna [14].
Uznana dualność. Narzędzia AI do kodowania są naprawdę potężne. Te same mechanizmy, które czynią je angażującymi, sprawiają, że warto je badać. Obie rzeczy są prawdą.
Oparcie na danych. Zbieramy anonimowe dane badawcze, by docelowo zastąpić intuicję dowodami.

Wybrana bibliografia

[3] Lindström et al. (2021). A computational reward learning account of social media engagement. PMC7910435
[4] Clark et al. (2009). Gambling near-misses enhance motivation to gamble and recruit win-related brain circuitry. PMC2658737
[5] Arkes & Blumer (1985). The psychology of sunk cost. Organizational Behavior and Human Decision Processes
[6] Abuhamdeh (2020). Investigating the "flow" experience: Key conceptual and operational issues. PMC7033418
[7] Oulasvirta et al. (2012). Habits make smartphone use more pervasive. Personal and Ubiquitous Computing
[8] Griffiths, M.D. (2005). A 'components' model of addiction within a biopsychosocial framework. Journal of Substance Use, 10(4), 191-197
[9] WHO. Gaming Disorder FAQ. WHO
[10] APA. What Is Gambling Disorder? (patient-facing resource). APA. For research, see: DSM-5-TR (2022).
[11] Zhao, Y. et al. (2024). Development and validation of the Problematic ChatGPT Use Scale. Current Psychology. Turkish CFA/IRT validation: IJMHA 2025
[12] CAI dependence scale — uncontrollability, withdrawal, mood modification, negative impacts. Frontiers in Psychology
[13] Compulsive ChatGPT use and associations with anxiety, burnout, and sleep. Acta Psychologica
[14] "People are not becoming 'AIholic'" (2025). Caution against premature "addiction" labels for AI use. Addictive Behaviors

Pełna bibliografia (32 źródła) jest dostępna na stronie Badania.

Chcesz sprawdzić swoje wzorce?

3 minuty. 14 pytań. Anonimowo. Oparte na badaniach.

Rozpocznij autorefleksję →