AbstractsPsychology

Frequency, chunks and hesitations : a usage-based analysis of chunking in English

by Ulrike Schneider




Institution: Universität Freiburg
Department: Philologische Fakultät
Degree: PhD
Year: 2014
Record ID: 1099211
Full text PDF: http://www.freidok.uni-freiburg.de/volltexte/2014/9793/


Abstract

This book addresses the questions in how far the frequency with which speakers use sequences of words influences how their minds store and process these strings and how such effects can best be modelled. The studies compiled in the book start out from the usage-based tenet that language use shapes its mental representation. They focus on various types of multi-word strings, such as 'I don’t know' or 'a lot of', and investigate how their mental representation changes depending on how frequently they are used. Two detailed sets of analyses test whether the more often sequences are used, the more unit-like or ‘chunked’ they become and furthermore address a number of theoretical and technical questions which mainly arise from details of Bybee’s (2010) model of the mind and her understanding of chunking. The author is the first to present a large-scale corpus analysis which utilises the placement of hesitations in spoken American English – as represented by the Switchboard NXT corpus – together with the innovative statistical procedures of Classification and Regression Trees and random forests. These tools are also used to test whether usage frequency is better modelled as absolute co-occurrence frequency or by means of one (or several) of the many probabilistic measures currently applied in the field (e.g. transitional probabilities, lexical gravity G). Results not only offer insights about the interrelation between frequency of use, constituent structure and mental storage, but also about the placement of hesitations as well as about strategies for modelling linguistic effects. Dieses Buch widmet sich den Fragen in wie fern die Häufigkeit mit der Sprecher Abfolgen von Wörtern verwenden die mentale Speicherung und Verarbeitung dieser Sequenzen beeinflusst und wie solche Effekte am besten modelliert werden können. Die im Buch zusammengestellten Studien basieren alle auf der Grundannahme Anwendungs-basierter Ansätze, dass der Sprachgebrauch die mentale Repräsentation von Sprache beeinflusst. Sie betrachten verschiedene Arten von Mehrwortsequenzen, wie zum Beispiel 'I don’t know' oder 'a lot of', und untersuchen, wie sich deren mentale Repräsentation in Abhängigkeit von ihrer Gebrauchshäufigkeit verändert. In zwei detaillierten Analysen wird überprüft, ob Sequenzen durch häufigere Verwendung zu stärkeren mentalen Einheiten zusammenwachsen – dass heißt stärker ‘gechunkt’ werden. Des Weiteren wird eine Reihe theoretischer und technischer Fragen angesprochen, die sich hauptsächlich aus dem hier angewandten Chunking-Modell von Bybee (2010) und den darin enthaltenen Annahmen über Chunks ergeben. Die Autorin ist die Erste, die eine groß-angelegte Korpusstudie zum Thema Chunking vorlegt, die die Platzierung von Zögerungssignalen im Amerikanischen Englisch – hier repräsentiert durch das Switchboard NXT Korpus – mit den innovativen statistischen Methoden der Klassifikations- und Regressionsbäume und Random Forests zusammenbringt. Diese Instrumente werden auch dazu herangezogen zu testen, wie der Einfluss der Verwendungshäufigkeit…