Metodologia badawcza

Quiz autorefleksji OnTilt jest zbudowany na recenzowanych badaniach z dziedzin uzależnień behawioralnych, warunkowania sprawczego, wzorców projektowych HCI oraz dobrostanu w pracy. Ta strona wyjaśnia, jak zaprojektowaliśmy narzędzie, co mierzy i na jakim etapie walidacji się znajdujemy.

Podstawy badawcze

Nasza wyjściowa obserwacja: pętla interakcji z agentycznymi narzędziami do kodowania (Claude Code, Cursor, Copilot) może wykazywać strukturalne podobieństwa do automatów do gier — niski koszt próby, nieprzewidywalna jakość wyniku, natychmiastowa możliwość powtórzenia i efekt „prawie udało się”, który napędza kontynuację. Nazywamy to „hipotezą automatu do gier.”

To nie jest metafora wyjęta z powietrza. Opiera się na bazie 32 recenzowanych źródeł z badań nad hazardem, uzależnieniem od mediów społecznościowych, projektowaniem produktów cyfrowych i psychologii klinicznej. To jest hipoteza badawcza, nie ustalony fakt kliniczny. Mechanizmy zaczerpnięto z recenzowanych badań nad uzależnieniami w innych domenach (hazard, media społecznościowe) i zastosowano przez analogię do narzędzi AI do kodowania. Bezpośrednia walidacja empiryczna dla tej populacji jest w toku. Na ich podstawie zaproponowaliśmy sześć mechanizmów jako ramę interpretacyjną wzorców podczas intensywnej pracy programistów z narzędziami AI:

  1. Wzmocnienie o zmiennym stosunku — AI dostarcza wartościowe outputy w nieprzewidywalnych odstępach, ten sam schemat, który sprawia, że automaty do gier są angażujące [3]
  2. Efekt near-miss — kod, który „prawie działa”, silniej napędza kontynuację niż całkowite niepowodzenie [4]
  3. Eskalacja kosztów utopionych — zainwestowany czas i uwaga utrudniają wycofanie się [5]
  4. Niezamierzona immersja („dark flow”) — kodowanie z AI tworzy szybką pętlę wyzwanie-feedback, która może tworzyć wzorzec przypominający to, co badacze hazardu nazywają „dark flow” [6]
  5. Nawyk sprawdzania / nagroda przerywana — krótkie, powtarzalne interakcje wzmacniane szybkim „informacyjnym rewardem” [7]
  6. Awersja do straty — brak dostępu do narzędzia odczuwany jest jako strata, nie powrót do normy [5]

Nasza struktura wymiarowa czerpie z modelu komponentowego uzależnień behawioralnych Griffithsa [8], kryteriów zaburzenia grania ICD-11 [9] i kryteriów zaburzenia hazardowego DSM-5 [10]. Uwzględniliśmy również najnowsze skale problematycznego użycia ChatGPT [11] oraz zależności od konwersacyjnej AI [12].

Sześć wymiarów

Każdy wymiar mapuje się na jeden lub więcej mechanizmów z badań nad uzależnieniami, które mogą mieć paralele we wzorcach korzystania z narzędzi AI. Razem tworzą wielowymiarowy profil, a nie pojedynczy wynik.

Wymiar 1

Utrata kontroli

Mierzy: Rozbieżność między intencją zaprzestania a faktycznym zachowaniem. „Planowałem skończyć o 18:00 — jest 22:30.”

Mechanizm: Wzmocnienie o zmiennym stosunku + nagroda przerywana. AI dostarcza dobre outputy w nieprzewidywalnych momentach, tworząc ten sam wzorzec wzmocnienia co automaty do gier.

Dlaczego to ważne: Upośledzona kontrola wolicjonalna to centralne kryterium uzależnienia behawioralnego w ramach DSM-5 i ICD-11. Trzy pytania celują w ten wymiar ze względu na jego wagę diagnostyczną.

Wymiar 2

Eskalacja sesji

Mierzy: Tendencję do wydłużania sesji, szczególnie gdy wyniki „prawie działają.” „Prawie przechodzi — jeszcze jedna próba” powtórzone piętnaście razy.

Mechanizm: Efekt near-miss + koszty utopione. Kod z 1–2 niezdanymi testami wygląda jak „prawie wygrana”, nie porażka. Już zainwestowany czas sprawia, że przerwanie wydaje się marnotrawstwem.

Dlaczego to ważne: Near-miss jest jednym z najsilniejszych driverów kontynuacji zachowań hazardowych. W kodowaniu z AI stan „prawie działa” to norma, nie wyjątek.

Wymiar 3

Dark flow / Immersja

Mierzy: Utratę kontaktu z fizyczną rzeczywistością podczas sesji AI — zniekształcenie poczucia czasu, zaniedbywanie jedzenia, picia i odpoczynku. „Nie jadłem 6 godzin i tego nie zauważyłem.”

Mechanizm: Wzorzec przypominający to, co badacze hazardu nazywają „dark flow.” Kodowanie z AI tworzy idealną pętlę — prompt, natychmiastowy output, kolejny prompt — z dramatycznie szybszym feedbackiem niż tradycyjne programowanie. Stawiamy hipotezę, że ta szybka pętla może tworzyć niezamierzoną immersję, w której tempo narzędzia prowadzi sesję, a nie intencja użytkownika.

Dlaczego to ważne: Flow sam w sobie jest pozytywny. Ale niezamierzona, przedłużona immersja, która przesłania sygnały ciała, wchodzi w strefę dysregulacji. Odróżniamy produktywny flow od „dark flow” — absorpcji bez świadomej intencji.

Wymiar 4

Zależność operacyjna

Mierzy: Reakcję na niedostępność narzędzia AI — lęk, irytację, niezdolność do pracy — oraz to, czy zacząłeś polegać na nim w zadaniach, które kiedyś realizowałeś samodzielnie.

Mechanizm: Awersja do straty + nagroda przerywana. Brak AI odczuwany jest jako strata, nie powrót do wcześniejszej normy. Nieprzewidywalna dostępność (rate limits, awarie) może paradoksalnie wzmacniać zachowania sprawdzające.

Dlaczego to ważne: Objawy odstawienne to kluczowy komponent uzależnienia behawioralnego. Jeśli przez lata kodowałeś bez AI, a teraz nie jesteś w stanie ruszyć bez niego — ta zmiana jest warta zbadania.

Wymiar 5

Negatywne konsekwencje

Mierzy: Obserwowalne skutki dalszego planu — zaburzony sen, komentarze rodziny lub współpracowników, kontynuowanie mimo świadomości szkód.

Mechanizm: Wszystkie sześć mechanizmów tu się zbiegają. Ten wymiar rejestruje ich skumulowane efekty, a nie pojedynczy czynnik napędzający.

Dlaczego to ważne: „Kontynuowanie mimo negatywnych konsekwencji” to kluczowe kryterium diagnostyczne w ramach uzależnień behawioralnych. Trzy pytania celują w ten wymiar, a jedno (kontynuowanie mimo świadomości szkód) pełni rolę red flag niezależnie od sumy punktów.

Wymiar 6

Przesunięcie na antycypację

Mierzy: Czy źródło satysfakcji przesunęło się z wyniku na proces — streaming outputu bardziej ekscytuje niż to, czy kod działa; odpalanie promptów bez jasnego celu.

Mechanizm: Wzmocnienie o zmiennym stosunku + nagroda przerywana. Wzorzec behawioralny sugeruje, że nagroda może pojawiać się w nieprzewidywalnych momentach procesu, więc sam proces staje się wzmacniający. Streaming outputu może wzmacniać antycypację i częste sprawdzanie postępów, analogicznie do pull-to-refresh w mediach społecznościowych.

Dlaczego to ważne: To najsubtelniejszy wymiar i najtrudniejszy do samodzielnego wykrycia. Gdy sam akt generowania ma większe znaczenie niż output, nagroda przesunęła się z wyniku na antycypację — cecha charakterystyczna zachowań kompulsywnych.

Konstrukcja quizu

Pytania 14 scoringowanych + 4 kontekstowe (niescoringowane)
Skala 5-stopniowa Likerta (0–4): Nigdy / Rzadko / Czasami / Często / Zawsze
Kotwica czasowa „W ciągu ostatnich 30 dni”
Zakres punktowy 0–56 (procent mapowany na cztery poziomy)
Czas wypełniania ~3 minuty
Zbieranie danych Anonimowe

Zasady projektowe

  • Autorefleksja, nie diagnoza. Quiz jest narzędziem przesiewowym. Nie diagnozuje żadnego zaburzenia. W DSM-5 ani ICD-11 nie istnieje uznana kategoria kliniczna „uzależnienia od narzędzi AI.”
  • Kotwiczenie behawioralne. Każdy item opisuje konkretne, obserwowalne zachowanie (nie emocję czy cechę), z wbudowanym markerem dysregulacji, np. „mimo planu zaprzestania” czy „mimo świadomości szkód.”
  • Okno 30 dni. Odpowiedzi są zakotwiczone w ostatnich 30 dniach, aby zmniejszyć bias pamięciowy i uchwycić aktualne wzorce.
  • System red flag. Dwa itemy — kontynuowanie mimo świadomości szkód (csq-3) i powtarzające się niepowodzenie w dotrzymywaniu własnych limitów (ctrl-3) — wyzwalają specjalny komunikat niezależnie od sumy punktów. Odpowiadają kluczowym kryteriom uzależnienia w ICD-11 i DSM-5.

Rozkład pytań

Utrata kontroli i Negatywne konsekwencje mają po 3 pytania (21,4% wagi każdy). Pozostałe cztery wymiary mają po 2 pytania (14,3%). To celowe: upośledzona kontrola jest centralnym konstruktem uzależnienia behawioralnego, a konsekwencje dostarczają najtwardszych dowodów (obserwowalnych, zewnętrznych).

Status walidacji

Wierzymy w transparentność co do tego, na jakim etapie znajduje się nasz instrument.

Obecnie: v2 (research preview)

  • Sformułowania itemów oparte na recenzowanych instrumentach (Problematic ChatGPT Use Scale, skale zależności od CAI) i ramach klinicznych (ICD-11, DSM-5)
  • Ulepszone właściwości psychometryczne względem v1: czystsza separacja itemów, kotwiczenie behawioralne, rozróżnienie flow vs. dysregulacja
  • Wstępne progi scoringowe (25/50/75%) — to racjonalne cut-offy, nie normy empiryczne

Planowana ścieżka walidacji

  1. Wywiady kognitywne (5–10 uczestników) — czy respondenci interpretują itemy zgodnie z zamierzeniem?
  2. Eksploracyjna i konfirmacyjna analiza czynnikowa (EFA/CFA) — czy struktura 6 czynników utrzymuje się empirycznie?
  3. Kalibracja IRT (Item Response Theory / GRM) — które itemy najlepiej różnicują w kontinuum nasilenia?
  4. Niezmienniczość pomiarowa — czy instrument działa równoważnie w wersji PL/EN i różnych trybach użycia (IDE copilot vs. chat vs. agent)?
  5. Normy empiryczne — zastąpienie arbitralnych progów procentowych cut-offami opartymi na percentylach z rzeczywistych danych kohortowych

Znane ograniczenia

  • Bias samooceny — respondenci najbardziej dotknięci mogą minimalizować swoje odpowiedzi
  • Brak walidacji klinicznej — test-retest reliability, construct validity i analiza czynnikowa są w toku
  • Wrażliwość kontekstowa — wyniki mogą się wahać w zależności od deadline'ów, dostępności narzędzia i nastroju
  • Zaangażowanie vs. dysregulacja — niektóre rejestrowane zachowania (długie sesje skupienia) mogą być zdrowe w odpowiednim kontekście
  • Specyficzność populacji — quiz celuje w power userów AI (programistów, 10+ godzin/tydzień). Casual users lub osoby niekodujące mogą uznać itemy za mało trafne

Nasz framing: higiena, nie abstynencja

OnTilt nie jest projektem anty-AI. Sami intensywnie korzystamy z narzędzi AI. Framing jest celowy:

  • Higiena, nie abstynencja. Jak higiena snu czy higiena jamy ustnej — chodzi o zrównoważone praktyki, nie zakazy.
  • Świadomość, nie patologizowanie. Celowo unikamy etykietowania intensywnego użycia jako „uzależnienia.” Wynikiem jest profil behawioralny i red flagi, nigdy etykieta kliniczna [14].
  • Uznana dualność. Narzędzia AI do kodowania są naprawdę potężne. Te same mechanizmy, które czynią je angażującymi, sprawiają, że warto je badać. Obie rzeczy są prawdą.
  • Oparcie na danych. Zbieramy anonimowe dane badawcze, by docelowo zastąpić intuicję dowodami.

Wybrana bibliografia

  1. [3] Lindström et al. (2021). A computational reward learning account of social media engagement. PMC7910435
  2. [4] Clark et al. (2009). Gambling near-misses enhance motivation to gamble and recruit win-related brain circuitry. PMC2658737
  3. [5] Arkes & Blumer (1985). The psychology of sunk cost. Organizational Behavior and Human Decision Processes
  4. [6] Abuhamdeh (2020). Investigating the "flow" experience: Key conceptual and operational issues. PMC7033418
  5. [7] Oulasvirta et al. (2012). Habits make smartphone use more pervasive. Personal and Ubiquitous Computing
  6. [8] Griffiths, M.D. (2005). A 'components' model of addiction within a biopsychosocial framework. Journal of Substance Use, 10(4), 191-197
  7. [9] WHO. Gaming Disorder FAQ. WHO
  8. [10] APA. What Is Gambling Disorder? (patient-facing resource). APA. For research, see: DSM-5-TR (2022).
  9. [11] Zhao, Y. et al. (2024). Development and validation of the Problematic ChatGPT Use Scale. Current Psychology. Turkish CFA/IRT validation: IJMHA 2025
  10. [12] CAI dependence scale — uncontrollability, withdrawal, mood modification, negative impacts. Frontiers in Psychology
  11. [13] Compulsive ChatGPT use and associations with anxiety, burnout, and sleep. Acta Psychologica
  12. [14] "People are not becoming 'AIholic'" (2025). Caution against premature "addiction" labels for AI use. Addictive Behaviors

Pełna bibliografia (32 źródła) jest dostępna na stronie Badania.

Chcesz sprawdzić swoje wzorce?

3 minuty. 14 pytań. Anonimowo. Oparte na badaniach.

Rozpocznij autorefleksję →