Dissertation
Tierärztliche Hochschule Hannover / Bibliothek – School of Veterinary Medicine Hannover / Library

 

Milan Arsic

 

Electrophysiology of Emotional Prosody Production and Perception

 

NBN-Prüfziffer

urn:nbn:de:gbv:95-96278

title (ger.)

Elektrophysiologie der Verarbeitung und Produktion emotionaler Prosodie

publication

Hannover, Tierärztliche Hochschule, Dissertation, 2008

text

http://elib.tiho-hannover.de/dissertations/arsicm_ws08.pdf

abstract (deutsch)

Die Verarbeitung emotionaler Prosodie der Sprache ermöglicht uns, Rückschlüsse über den emotionalen Zustand des Sprechers zu ziehen. So kann ein und dasselbe Wort eine grundlegend unterschiedliche Bedeutung bekommen, je nach dem ob es fröhlich oder traurig intoniert wird. Obwohl somit der emotionalen Prosodie eine grosse Bedeutung bei der zwischenmenschlichen Kommunikation zukommt, sind die hierfür verantwortlichen neuronalen Strukturen noch nicht ausreichend belegt. Die vorliegende Arbeit umfasst zwei Untersuchungen, die zum Ziel haben sowohl die Produktion als auch die Verarbeitung emotionaler Prosodie zu beleuchten. Hierbei wurden zwei verschiedene neurophysiologische Methoden verwand, zum einen die repetitive transkranielle Magnetstimulation (rTMS) sowie die der Ableitung ereigniskorrelierter Hirnpotentiale (ERPs). rTMS ist eine schmerzfreie, nicht invasive Untersuchungsmethode, mit der eine vorübergehende Veränderung der Hirnfunktion erreicht werden kann. Abhängig von den Stimulationsparametern führt sie zu einer Inhibition oder Aktivierung neuronaler Aktivität des Kortex. Hingegen ermöglicht die Ableitung von ERPs die Abbildung der Hirnaktivität mit einer hohen zeitlichen Auflösung (im Bereich von Millisekunden) und die Differenzierung pre-attentiver sowie attentiver kognitiver Prozesse. Im ersten Experiment wurde rTMS zur Untersuchung der Produktion emotionaler Prosodie angewandt. Es wurde in separaten Sitzungen über dem linken bzw. rechten dorsolateralen präfrontalen Kortex (DLPFC) mit einer Frequenz von 10 Hz in einer Stärke von 100 % der motorischen Ruheschwelle stimuliert. Zusätzlich wurde eine so genanntesham"-Stimulation durchgeführt, um einen Placeboeffekt auszuschließen. Nach der Magnetstimulation sollten die 16 gesunden Teilnehmer (8 weiblich) das semantisch neutrale Wort „ANNA“ fröhlich, neutral und traurig aussprechen. Zudem wurde ein Fragebogen zur Erfassung der Stimmung ausgefüllt. Ziel war es zu untersuchen, ob sich mittels Stimulation des linken oder rechten DLPFC eine Veränderung der Produktion emotionaler Prosodie bzw. eine Stimmungsveränderung auslösen lassen. Dafür wurden neben dem Fragebogen, die Sprachproben mit Erfassung der Grundfrequenz F0 (Mittelwert und Standardabweichung des Mittelwerts) ausgewertet. Die Analyse der Sprachproben zeigte für den Mittelwert von Fo keine Veränderungen, hingegen unterschied sich die Standardabweichung des Fo Mittelwerts mit einem signifikanten Anstieg nach Stimulation über dem rechten DLPFC und nach der „sham"-Stimulation. Entsprechend zeigte sich bei Auswertung des Fragebogens eine signifikant gehobene Stimmung nach rechter Stimulation und eine gedämpfte Stimmung nach Stimulation links. Insgesamt sprechen die Ergebnisse dieser Untersuchung dafür, dass sich zwar durch rTMS über dem rechten DLPFC eine Veränderung der Sprachparameter erzielen lässt, dies aber nicht als emotionsspezifisch angesehen werden kann da die Veränderungen auch die neutrale Prosodie umfassen Hingegen bestätigt sich, dass es nach rTMS über dem DLPFC zu Veränderungen der Stimmung kommen kann. Dieses Ergebnis korreliert mit denen anderer Studien und bestätigt, dass dem DLPFC eine wichtige Rolle in der Regulation von Emotionen zukommt. Im zweiten Experiment der vorliegenden Arbeit wurde die Methode der Ableitung von ERPs genutzt, mit dem Ziel herauszuarbeiten inwiefern die Verarbeitung emotionale Prosodie von den Dimensionen Valenz und Arousal abhängt. Nach Russell (1980) ist jede Emotion in einem zweidimensionalen Raum über die Eigenschaften Valenz (positiv vs. negativ) und Arousal (hoch vs. niedrig) definiert. 20 gesunde Probanden (10 Frauen) nahmen an diesem Experiment teil. In einem so genannten „oddball“ Paradigma wurden zweisilbige deutsche Substantive von neutralem Inhalt über Kopfhörer präsentiert. Die Stimuli unterschieden sich in ihrer emotionalen Prosodie (fröhlich, erleichtert, ärgerlich, traurig).In einer passiven Aufgabe wurden die Worte präsentiert während der Proband etwas las, während in der aktiven Aufgabe zwei Bedingungen unterschieden wurden: die Valenz- und die Arousal- Aufgabe. Bei ersterer wurde ein häufiger Standardreiz (bspw. mit negativer Valenz: traurig) unterbrochen von einem seltenen in seiner Valenz abweichenden Reiz (bspw.: erleichtert). Bei letzter unterschied sich der Grad der Erregtheit zwischen Standard und dem so genannten Deviant (bspw.: Standard: traurig; Deviant: ärgerlich). Dieselben Worte wurden ebenfalls in umgekehrter Häufigkeitsverteilung präsentiert (so dass ein und derselbe Stimulus mal als Standard und mal als Deviant verwendet wurde). Aufgabe der Probanden war es, bei der Valenz- Aufgabe abweichende Wort nach dessen Valenz als positive oder negativ zu beurteilen, bei der Arousal- Aufgabe entsprechend nach dem Grad der Erregung (niedrig, hoch). Die Ergebnisse zeigen für die passive Aufgabe keine Unterschiede im Verlauf der ERPs. Hingegen findet sich ein signifikanter Unterschied in der Valenz-Aufgabe mit einer höheren mittleren Amplitude der P3b Komponente für diejenigen abweichenden Reize oder Deviants die sich durch ein hohes Arousal auszeichneten (fröhlich und ärgerlich). Entsprechend findet sich bei den Verhaltensdaten eine höhere Trefferquote für die Stimuli mit hohem Arousal. Interessanterweise zeigt sich dieser Effekt in der Valenz- Aufgabe, wo also abweichende Wort nach seiner Valenz als positiv oder negativ eingeschätzt werden sollte. Die Ergebnisse korrelieren mit vorangehenden Studien und zeigen, dass der Arousal- Grad eines Stimulus sehr wohl einen Einfluss auf die Verarbeitung emotionaler Prosodie nimmt, wahrscheinlich indem die Aufmerksamkeit insbesondere auf einen erregt klingenden Stimulus gelenkt wird und somit eine möglichst effiziente Verarbeitung gewährleistet ist..

abstract (englisch)

Processing emotional prosody of a speech stream enables us to recognize the emotional state of the speaker. For instance, the same word can have a completely different meaning depending on whether it is intonated in a happy or angry tone of voice. Although emotional prosody processing fulfills such an important role in human social interactions, its underlying neural correlates are still not fully understood. This thesis describes two experiments performed in order to investigate emotional prosody production and perception using two different approaches. Two different techniques offering the possibility to investigate emotional speech in real-time based on objective measures were used, the repetitive Transcranial Magnetic Stimulation (rTMS) and the Event-Related Brain Potentials (ERPs). The rTMS is a non-invasive, painless method that enables temporary modulation of brain functions. Depending on the stimulation parameters, rTMS can activate or inhibit neuronal activity of the cortex. ERPs provide continuous acquisition and online measurements of electrical brain activity with a high time resolution in the range of milliseconds. Additionally, ERPs are considered as reliable tools for studying pre-attentional and attentional cognitive processes as well. In the first experiment, rTMS was used to examine emotional prosody production. The rTMS was applied over the left and right dorsolateral prefrontal cortex (DLPFC) during two separate sessions using a 10 Hz frequency at 100% of the resting motor threshold. Three series of stimulation were delivered with 10 minutes long breaks between the first and the second series. Additionally, sham stimulation was performed by positioning a figure-eight-shaped coil at the angle of 45º to the skull. After rTMS, 16 healthy subjects (8 female) pronounced a semantically neutral word “ANNA” in happy, neutral or sad emotional intonation, and answered a mood questionnaire. The goal was to test if stimulation over the left and right DLPFC can provoke transient mood changes, and further on, to determine their correlation with emotional speech. Fundamental frequency F0 (its mean and standard deviation) was analyzed and compared between different stimulation conditions to test for the influence of rTMS on emotional speech production. Analysis of speech showed a statistically significant increase of the standard deviation of fundamental frequency after the right, but also after sham stimulation. When the mean fundamental frequency was used as a speech parameter, there were no significant differences observed after any type of stimulation and any of three intonations. A transient mood decrease occurred after the left stimulation and increased after the right one. The result of this experiment could not show that the rTMS delivered at these parameters was able to modulate emotional prosody production. However, rTMS was capable to transiently influence the mood of healthy subjects in a lateralized manner. This finding is similar to the effect observed in the previous studies done with healthy people and confirms the involvement of the DLPFC in the regulation of affect. In the second experiment done in this dissertation, ERPs were used as a tool to explore how emotional prosody perception depends upon differences in valence and arousal. According to Russell (1980), each emotion can be described in a two-dimensional space defined in terms of valence (positive vs. negative) and arousal (low vs. high). Twenty healthy subjects (10 women) participated in the experiment. The dataset comprised different semantically neutral words spoken by two professional native speakers. Pronounced words differed with respect to emotional intonation (happy, relaxed, angry, and sad). The stimuli were presented in an oddball paradigm. In the passive condition, stimuli were delivered via headphones while the subjects were reading, where in the active one two experimental conditions were considered namely, ‘’valence" and ‘’arousal." In the former one, a series of frequent standard words spoken in negative prosody (e.g., sad) was violated by infrequent deviants of positive prosodic words (e.g., relaxed). In the latter one, arousal was different for standards and deviants (e.g., standard: sad; deviant: angry). The same prosodic combinations were also presented in the opposite manner, such that standard stimuli were used as deviant ones. The task was to evaluate deviant tone according to either its valence (positive, negative) or arousal (calm, aroused) by pressing one of the available keyboard buttons. Results showed no significant differences for the passive condition. For the active condition, statistically significant difference was observed in the valence task and active condition. Thus, the mean amplitude of the P3b component elicited by deviant stimuli was higher for high arousal stimuli happy and angry when compared to low arousal deviants relaxed and sad. Likewise, behavioral data showed that high arousal stimuli were rated more accurately. Most interestingly, this phenomenon occurred in the task where subjects had to focus on the valence of the target stimuli. These results conform to previous studies and show once again that the level of arousal of a stimulus has a high impact on emotional prosody processing, probably by allocating attentional resources so that it is processed as precisely as possible.

keywords

emotionaler Prosodie, repetitive transkranielle Magnetstimulation (rTMS), ereignis korrelierter Hirnpotentiale (ERPs); emotional prosody, repetitive Transcranial Magnetic Stimulation (rTMS), Event-Related Brain Potentials (ERPs)

kb

4.138