National Science Centre SONATA BIS Research Project (2013-2017)

"Neural correlates of temperament dimensions in error monitoring and learning under reward and punishment conditions - dEEG and fMRI studies"

National Science Centre, grant no. 2012/05/E/HS6/03553

Coordinator: Justyna Mojsa-Kaja

Outcomes

(polish description below)

The process of error monitoring enables adjusting to changing environmental demands and learning more adaptive behaviors.

Existing research suggests that error monitoring system is sensitive to both individual and situational factors. The aim of the presented study was to verify, with the use of EEG and fMRI, whether temperamental traits, based on psychobiological model of personality proposed by Robert Cloninger, influence error monitoring and learning processes under the conditions of reward and punishment.

Based on the EEG data, our research showed that neuronal activity associated with error monitoring were modulated in the reward condition by temperamental trait - Novelty Seeking. This result suggests that whenever there is a possibility of earning a reward, participants scoring high on Novelty Seeking are likely to be highly motivated and strongly engaged in the task. This relationship between individual differences and motivation conditions may be applied in designing environment for optimal cognitive performance. [see publication]

The external feedback received after correct or incorrect response might be provided in either certain (deterministic) or uncertain (probabilistic) manner. In our research, the response to stimulus was associated with always valid feedback, and therefore our experimental task operated in the frame of deterministic learning paradigm. The project enabled to test the newly designed Paired Associate Deterministic Learning task (PADL) which proved to be a useful tool for analyzing the dynamics of learning process in a deterministic environment and therefore expanded the research methodology in the area of describing the mechanism of learning. [see publication]

The behavioral results proved that learning process in a deterministic environment is influenced by both the type of feedback information (positive or negative) and the motivational significance associated with the expected monetary reward. When participants were presented with the possibility of losing or gaining money, they learnt significantly quicker than in condition where they were presented only with the cognitive feedback (good or bad), without monetary incentive.
Additionally, in case of no monetary incentive, people learnt faster when they were presented with feedback after incorrect responses than in case of feedback about correct responses.

Moreover, the analysis of EEG data, based on event-related potentials such as error-related negativity (ERN) and feedback-related negativity (FN) enabled the description of dynamics of these potentials in the context of deterministic learning paradigm, as compared with commonly used in other research probabilistic learning paradigms. In presented study, the amplitudes of the ERN and FN increased over the course of learning. Additionally, our results showed the modulating effects of type of presented feedback on the ERN and FN amplitudes.
Congruency of EEG and fMRI results strongly supports the evidence of modulating effect of type of provided feedback on the dynamics of error-related activity in deterministic learning and to our knowledge we are the first to demonstrate such results.

Presented results allow describing the functioning of human brain in a situation of receiving either negative or positive deterministic feedback. Additionally, introducing monetary incentives proved to play an important role for learning brain, showing that people were learning faster if presented with the possibility of losing monetary reward, as compared to the chance of receiving it.

Describing neuronal mechanism of learning process and its sensitivity to motivational conditions expands the existing knowledge in the area of dynamics of deterministic learning and may find practical implications, for example in designing educational programs or in behavioral psychotherapy.

Rezultaty projektu

Proces monitorowania błędnych reakcji jest mechanizmem umożliwiającym przystosowanie do zmieniających się warunków środowiska i tym samym uczenie się bardziej adaptacyjnych w danym kontekście zachowań. Dotychczasowe badania sugerują, iż proces monitorowania błędów wykazuje wrażliwość zarówno na zmienne indywidualne, jak i sytuacyjne. Celem opisywanego projektu było zweryfikowanie czy i w jakim stopniu cechy temperamentu, bazujące na psychobiologicznej koncepcji osobowości autorstwa Cloningera, wpływają na system monitorowania błędów oraz dynamikę uczenia się podczas wykonywania zadania w warunkach nagradzania dobrych i karania błędnych odpowiedzi. Parafrazując, celem stało się określenie czy cechy naszego temperamentu, w zderzeniu z warunkami motywacyjnymi- nagrodą lub karą- wpływają na wskaźniki neuronalne procesu monitorowania błędów i uczenia się, analizowane z zastosowaniem techniki elektroencefalografii (EEG) oraz funkcjonalnego rezonansu magnetycznego (fMRI).

Zrealizowany projekt potwierdził interakcyjny wpływ czynnika temperamentalnego (poszukiwania nowości) i rodzaju motywacyjnej sytuacji eksperymentalnej (warunek nagrody) na neuronalną aktywność towarzysząca procesowi monitorowania błędów, z zastosowaniem metody EEG. W praktyce, oznacza to, iż osoby poszukujące nowości są bardziej zmotywowane i zaangażowane w wykonywanie zadania, w warunkach, w których są nagradzane za odpowiedzi prawidłowe. Tego rodzaju zależność, może znaleźć praktyczne zastosowanie w projektowaniu optymalnych warunków funkcjonowania poznawczego u osób o określonych cechach temperamentalnych. [zobacz publikację]

Informacja zwrotna, jaką otrzymujemy w odpowiedzi na nasze prawidłowe lub nieprawidłowe reakcje może być dostarczana w sposób mniej lub bardziej dla nas przewidywalny. Jeśli dostarczana informacja zwrotna jest zawsze adekwatna do udzielonej odpowiedzi, mamy do czynienia z deterministycznym paradygmatem uczenia się, który stał się przedmiotem analizy opisywanych badań. Zrealizowany projekt umożliwił opracowanie i zweryfikowanie nowej procedury eksperymentalnej (ang. Paired Associate Deterministic Learning task - PADL) pozwalającej na analizę dynamiki procesu uczenia się w warunkach deterministycznej informacji zwrotnej, przyczyniając się do rozwoju metodologii badań z zakresu opisania mechanizmów procesów poznawczych (uczenia się). [zobacz publikację]

Otrzymane wyniki behawioralne dowiodły, iż proces uczenia się, w warunkach deterministycznych jest zależny zarówno od rodzaju informacji zwrotnej (pozytywna vs negatywna), jak tego czy udzielane odpowiedzi są nagradzane lub karane finansowo. Kiedy pojawia się zagrożenie utraty pieniędzy za niepoprawne odpowiedzi, lub gdy możemy otrzymać nagrodę finansową za odpowiedzi prawidłowe, uczymy się istotnie szybciej niż w sytuacji gdy z zewnątrz otrzymujemy informację tylko o poprawności lub niepoprawności reakcji. W sytuacji braku czynnika finansowego, uczymy się szybciej gdy z zewnątrz otrzymujemy informację tylko o naszych błędach, niż wtedy gdy jesteśmy informowani o poprawnych reakcjach.

Nadto analiza neuronalnych wskaźników dynamiki uczenia w zapisie EEG, bazując na potencjałach wywołanych error-related negativity (ERN) i feedback-related negativity (FN) pozwoliła opisać odmienność dynamiki zmiany amplitudy tychże potencjałów w porównaniu z dominującymi w nauce paradygmatami eksperymentalnymi, wprowadzającymi probabilistyczną (niepewną) informację zwrotną. Wzrostowi amplitudy ERN towarzyszy wzrost amplitudy FN. Co więcej, uzyskane wyniki wskazują również na modulujący wpływ typu prezentowanej informacji zwrotnej na amplitudę ERN i FN. Spójność uzyskanych wyników EEG z danymi fMRI jednoznacznie dowodzi modulującego wpływu rodzaju informacji zwrotnej na system monitorowania błędów w procesie uczenia się i jest jednym z pierwszych badań w tym zakresie.

Prezentowane wyniki pozwoliły opisać funkcjonowanie mózgu w sytuacji, w której ucząc się dostajemy adekwatną, pozytywną lub negatywną informację zwrotną. Ponadto, czynnik finansowy ma znaczenie dla uczącego się mózgu, przy czym znacznie "dynamiczniej" uczymy się wówczas, gdy istnieje ryzyko utraty potencjalnej nagrody, niż w sytuacji gdy możemy ją otrzymać. Opisanie neuronalnych mechanizmów uczenia się i ich zależności od motywacyjnych czynników sytuacyjnych przyczyniło się do poszerzenia wiedzy na temat dynamiki uczenia się i może stanowić punkt odniesienia do aplikacji uzyskanych wyników w obszarze np. projektowania programów edukacyjnych, czy też oddziaływań terapeutycznych osadzonych w nurcie behawioralnym.