Dissertation

Tierärztliche Hochschule Hannover / Bibliothek – School of Veterinary Medicine Hannover / Library

Silvia Unglaube

Erstellung und Evaluierung eines Verhaltenstests zur Erkennung von Futteraggression gegenüber Menschen durch Hunde in einem Tierheim

NBN-Prüfziffer

urn:nbn:de:gbv:95-107724

title (engl.)

Development and evaluation of a behavior test for food related aggression against humans by shelter dogs

publication

Hannover, Tierärztliche Hochschule, Dissertation, 2015

text

http://elib.tiho-hannover.de/dissertations/unglaubes_ws15.pdf

abstract (deutsch)

Im Rahmen dieser Studie sollte ein Verhaltenstest entwickelt und evaluiert werden, welcher es ermöglicht, agonistisches Verhalten von Hunden gegenüber sich annähernden Personen während der Futteraufnahme praxisnah zu messen. Hierfür wurden 17 Hunde aus dem Tierheim "Bullterrier in Not e.V." ausgewählt und ihr Verhalten während der Futteraufnahme gegenüber einer sich annähernden Testperson sowie der Berührung der Hunde und des Futters mit einer künstlichen Hand mittels einer Videokamera aufgezeichnet. Anschließend wurde das gezeigte Verhalten mit zwei unterschiedlichen Bewertungssystemen bewertet und diese wurden auf Reliabilität und Validität hin evaluiert.

Durch einen Prätest wurden Furcht und Aggressivität der Hunde gegenüber der Testperson und den Testbedingungen, inklusive der verwendeten künstlichen Hand, ausgeschlossen. Des Weiteren wurde in diesem Prätest überprüft, ob die Hunde in der Lage waren, die verwendete künstliche Hand von der echten Hand der Testperson zu unterscheiden. Die Ergebnisse lassen den Schluss zu, dass einige der Hunde in der Lage waren, die künstliche Hand von der Echten zu unterscheiden. So wurde gegenüber der künstlichen Hand signifikant häufiger (p=0,0413) soziopositives Verhalten (Erkundungs- und Spielverhalten) gezeigt. Da jedoch keine signifikanten Unterschiede bei den agonistischen Verhaltensweisen (p=0,1183) und den Stresssignalen (p=0,5691) ermittelt werden konnten, war eine Beeinflussung der Testergebnisse auf Futteraggression, wo agonistisches Verhalten und Stresssignale gemessen wurden, durch die künstliche Hand ausgeschlossen.

Bei der Durchführung des entwickelten Tests auf Futteraggression wurde den Hunden unterschiedliches Futter in drei Subtests (Subtest 1: leere Futterschüssel, Subtest 2: normales Futter, Subtest 3: Rinderpansen) gereicht, während sich die Testperson an die Hunde annähert und die Hunde und das Futter mit der künstlichen Hand berührt. Das Verhalten der Hunde wurde mit einer Videokamera aufgezeichnet und von drei Personen (Testperson und zwei weitere Gutachter) mit Hilfe eines Ethogramms auf Stresssignale und agonistisches Verhalten hin untersucht. Anschließend wurde das beobachtete Verhalten der Hunde mittels zweier Bewertungssysteme bewertet. Zum einen wurde eine Punktevergabe verwendet, bei welcher die Punktwerte mit steigendem Eskalationsniveau des aggressiven Verhaltens zunahmen. Zum anderen wurde das Verhalten in fünf Kategorien eingeteilt. Mit diesen zwei Bewertungssystemen wurde der Test anschließend auf Reliabilität (Inter-rater-Reliabilität, Intra-rater-Reliabilität, Test-Retest-Reliabilität) und Validität (Inhalts- und Kriteriumsvalidität) evaluiert.

Die Inter-rater-Reliabilität des entwickelten Tests wurde anhand der Auswertungen der drei Gutachter mittels des Permutationstests für gepaarte Beobachtungen bestimmt. Hier zeigte sich mit einer Ausnahme (Subtest 2, Gutachter 1-3:
κ= -0,1355; Gutachter 2-3: κ=0,0204) eine gute Übereinstimmung der Gutachter bei der Verwendung der kategorialen Auswertung des Verhaltens (p>0,05) und ebenso mit einer Ausnahme (Subtest 3, Gutachter 1-3: p=0,004; Gutachter 2-3: p=0,000) bei der Verwendung der Auswertung mit Punkten (p>0,05).  

Mit den Daten einer wiederholten Auswertung derselben Videos konnte mittels des Wilcoxon-signed-rank-Tests die Intra-rater-Reliabilität für die Auswertung mit Punkten ermittelt werden. Für die Auswertung mithilfe der Kategorien wurde zusätzlich der Cohens-Kappa-Koeffizient berechnet. Hier zeigte sich eine gute Übereinstimmung bei den Gutachtern 1 und 2 sowohl bei der Punkte- als auch bei der Kategorienauswertung (Gutachter 1 Punkte gesamt: p=0,4766; Kategorien gesamt: p=1,0000, κ=0,8917; Gutachter 2 Punkte gesamt: p=0,5806; Kategorien gesamt: p=1,0000, κ=0,8851). Die Auswertungen des dritten Gutachters wiesen bei der Verwendung der Punkte zum Teil signifikante Unterschiede (Subtest 1, p=0,0313) auf, während die Auswertungen unter Verwendung der Kategorien nicht signifikant voneinander abwichen (p>0,05).

Der entwickelte Futteraggressionstest wurde nach acht Wochen mit derselben Hundepopulation erneut durchgeführt (Retest). Die Test-Retest-Reliabilität wurde erneut mithilfe des Wilcoxons-signed-rank-Tests für beide Methoden, und für die Kategorienauswertung zusätzlich mit dem Cohens-Kappa-Koeffizienten, durchgeführt. Hier zeigten sich keine signifikanten Unterschiede in den Subtests 1 und 3 (p>0,05), wobei die Auswertung mithilfe der Kategorien bessere Übereinstimmungen aufwies als die Auswertung mithilfe der Punkte. Auch die Gesamtergebnisse der Hunde wiesen keine signifikanten Unterschiede auf (p>0,05). Lediglich in Subtest 2 waren signifikante Unterschiede (Punkte und Kategorien, jeweils p=0,0313) bei beiden Auswertungsmethoden festzustellen.

Die Inhaltvalidität wurde gewährleistet, indem eine Allgemeinuntersuchung durchgeführt wurde und eine Vorauswahl der Hunde bezüglich Furcht und Aggressivität gegenüber der Testperson mithilfe eines Datenerhebungsbogens getroffen wurde.

Um die Kriteriumsvalidität zu bestimmen, wurde das Verhalten der Hunde im durchgeführten Test mit den Angaben des Tierheims über das erwartete Verhalten mittels des Wilcoxons-signed-rank-Tests (bei der Kategorieneinteilung zusätzlich mit dem Cohens-Kappa-Koeffizienten) verglichen. Hierbei zeigten sich signifikante Abweichungen bei den Subtests 1 (p=0,0002, κ=0,0000) und 2 (p=0,0430, κ=0,0588)  und eine gute Übereinstimmung (p=1,0000, κ=0,3014) mit dem Subtest 3.

Sieben Wochen nach dem Retest wurde ein Referenztest, welcher weniger standardisiert war und unter alltäglicheren Bedingungen in den Zwingern der Hunde stattfand, durch die Tierheimleitung durchgeführt. Auch bei diesem Vergleich wurden die Berechnungen mithilfe des Wilcoxons-signed-rank-Tests bzw. Cohens-Kappa-Koeffizienten durchgeführt. Dabei zeigten sich Übereinstimmungen bei der Auswertung mithilfe der Kategorien (p>0,05), wogegen bei der Auswertung mithilfe der Punkte zum Teil signifikante Unterschiede zu ermitteln waren (Vergleich Teil 1 mit Subtest 1: p=0,0313; Vergleich Gesamtergebnisse: p=0,0020). Insgesamt zeigte sich, dass die Bewertungsmethode mit Punkten sehr sensibel auf Abweichungen im Verhalten reagiert, da sie im Gegensatz zu den Kategorien abhängig ist von den Häufigkeiten der gezeigten Verhaltensweisen.

Bei dem Versuch einer Korrelation der Ergebnisse mit dem bereits evaluierten Fragebogen C-BARQ von HSU und SERPELL (2003) mithilfe von Spearmans Korrelationskoeffizienten ergaben sich keine nachweisbaren Zusammenhänge zwischen den Angaben des Tierheims und den ermittelten Testergebnissen (r<0,353, p>0,05).

Bei jedem Testdurchgang wurde die Art und Anzahl von Stresssignalen der Hunde aufgezeichnet und ebenfalls mit dem Spearmans-Korrelationskoeffizienten in Korrelation mit den vorherigen Testergebnissen gesetzt. Hierbei fiel auf, dass mit steigender Anzahl an Stresssignalen nur das Testergebnis der Hunde in Subtest 3 bei den Kategorien (r=0,510, p=0,0434) und im Gesamtergebnis beider Auswertungsmethoden (Punkte: r=0,538, p=0,0259, Kategorien: r=0,547, p=0,0232) stieg und damit positiv korrelierte.

 

Die Ergebnisse der Studie lassen den Schluss zu, dass der entwickelte Test geeignet ist, um Futteraggression von Hunden gegenüber Menschen zu erkennen. Er hat sich bei der Evaluierung, trotz weniger Ausnahmen, als reliabel und valide erwiesen und erfüllt damit zum großen Teil die Ansprüche für die Qualität eines Verhaltenstests. Außerdem hat sich der entwickelte Test in der Durchführung als praktikabel sowie als tierschutzkonform erwiesen. Die Testauswertung mit Punkten erscheint besser geeignet für einen Einsatz im Diagnose- und Therapiebereich, wo einzelne Hunde getestet und im Zuge der Therapie mit sich selbst verglichen werden. Dagegen scheint die Auswertung mit fünf Kategorien besser geeignet zu sein für den Einsatz in einem Tierheim, wo viele Hunde getestet werden und unterschiedliche Gutachter das Verhalten schnell bewerten und interpretieren müssen.

abstract (englisch)

In the context of this study a behavior test should be developed and evaluated, which enables the practice measuring of agonistic behavior of dogs against approaching humans while feeding.

For this 17 Bullterrier from the shelter “Bullterrier in Not e.V.” were selected and their behavior against the approaching testing person and the touching of the dogs and their food with an artificial hand while feeding was recorded with a camera. The shown behavior was rated with two rating systems, which were evaluated by reliability and validity.

Fear and aggressiveness due to the test conditions inclusive the used artificial hand were excluded by the pretest. Further with this pretest was investigated, if the tested dogs were able to distinguish the used artificial hand from the real hand of the testing person. The results prove the ability of some dogs to distinguish the artificial hand from the real one. So they showed significantly more (p=0.0414) socio-positive behavior (behavior of exploration and play) against the artificial hand. However, since there wasn’t a significant difference in the agonistic behavior (0=0.1183) and the signs of stress (p=0.5691), an influence on the results of the test for food aggression, which measures agonistic behavior and stress, could be excluded. 

In carrying out of the developed test there were handed out different food to the dogs in three subtests (subtest 1: empty food bowl, subtest 2: normal food, subtest 3: beef rumen), while the testing person approached to the dogs and touched them and the food. The behavior of the dogs was recorded by a video camera and examined by three persons (the testing person and two further observers) for agonistic behavior and signs of stress with the help of an ethogramm. Then the observed behavior of the dogs was rated with two rating systems. On one hand there was used a scoring system, thus the scores raised with increasing escalation level of aggressive behavior. On the other hand the behavior was split up in a five category system. With the help of these rating systems the test for food aggression was evaluated concerning reliability (inter-rater reliability, intra-rater reliability, test-retest reliability) and validity (content validity and criterion validity).

The inter-rater reliability of the test was determined by analysis of three observers with the help of the permutation test for paired observations. It shows, except from one calculation (subtest 2, observer 1-3: κ= -0.1355; observer 2-3: κ=0.0204), a good congruence of the observers under usage of the categorial analysis (p>0,05) and also with one exception (subtest 3, observer 1-3: p=0.004; observer 2-3: p=0.000) under usage of the scores (p>0.05).

With the data of a repeated analysis of the same videos the intra-rater reliability was calculated. For the calculation of the scores the Wilcoxon signed rank test was used. For the categories the same test, in addition to the Cohen’s kappa coefficient, was calculated. It showed a good agreement of observer 1 and 2, as well in the categories as in the scores (observer 1 total scores: p=0.4766; total categories: p=1.0000, κ=0.8917; observer 2 total scores: p=0.5806; total categories: p=1.0000, κ=0.8851). The analysis of the third observer showed partly significant differences under usage of the scores (subtest 1, p=0.0313), while the analysis under usage of the categories did not differ significantly (p>0.05).

The developed test for food related aggression was repeated after eight weeks with the same population of dogs (retest). The test-retest reliability was calculated again with the usage of the Wilcoxon signed rank test for both rating systems, and for the categories in addition of Cohen’s kappa coefficient. It showed no significant differences in subtest 1 and 3 (p>0.05), in which the categorical analysis showed better congruence than the analysis with the scores. Also the total results showed no significant differences (p>0.05). Only subtest 2 showed significant differences in both rating systems (scores and categories, respectively p=0.0313).

The content validity was guaranteed by a general examination and a preselection of the dogs with a questionnaire concerning fear and aggressiveness against the testing person.

To determine the criterion validity, the behavior of the dogs in the used test was compared with the data of the expected behavior, recorded by the shelter management, with the Wilcoxon signed rank test (by the rating with categories in addition of Cohen’s kappa coefficient). This comparison showed significant differences in subtest 1 (p=0.0002, κ=0.0000) and 2 (p=0.0430, κ=0.0588) and a good agreement in subtest 3 (p=1.0000, κ=0.3014).

Seven weeks after the retest a reference test was accomplished by the shelter management, which was less standardized and conducted under daily conditions in the kennels of the dogs. For this comparison the calculations were made with the Wilcoxon signed rank test and respectively Cohen’s kappa coefficient. It showed an agreement in the analysis with the category system (p>0.05), but the analysis with the score system determined partly significant differences (part 1-subtest 1: p=0.0313; total score: p=0.0020). Overall it showed that the rating systems with scores reacted very sensitive to deviations in the behavior, because in comparison to the categories it depends on the frequency of the showed behavior.

The attempt to correlate the results with the evaluated questionnaire C-BARQ of HSU and SERPELL (2003) with Spearman’s correlation coefficient showed no detectable correlations between the data of the shelter and the determined results of the test (r<0.353, p>0.05).

With each test run the quantity and the kind of stress signs of the dogs was recorded and correlated with the previous results of the test, as well as with Spearman’s correlation coefficient. It was shown, that only the results of the dogs in subtest 3 with categorical rating (r=0.510, p=0.0434) and the total results of both ratings are rising with the increased number of signs of stress and therefore were positively correlated with each other. 

 

The results of the study implies that the developed test is suitable to discover food related aggression of dogs against humans. It has proven reliable and valid despite of few exceptions and thereby it fulfills a great part of the claims of quality of a behavior test. Also the test has proven that it is practicable in his implementation and compliant with animal welfare. The scoring seems to be more suitable for usage in areas of diagnostic and therapy, where single dogs were tested and in context of a therapy compared to themselves. In contrast to that, the analysis with the categories seems to be more suitable for a usage in a shelter, where many dogs has to be tested and different observers have to assess and interpret the behavior quickly.

keywords

Verhaltenstest, Futteraggression, Tierheimhunde, behavior test, food related aggression, shelter dogs

kb

1.905