Das "Bamberg Survey of Lexical Variation and Change" Projekt (DFG finanziert)
Der Bamberg Survey of Lexical Variation and Change (BSLVC) ist eine Datenbank zu lexikalischen und grammatischen Pr?ferenzen von Sprecherinnen und Sprechern verschiedener Variet?ten des Englischen und erforscht so Sprachvariation und m?gliche Sprachwandel. Das aktuelle Projekt ist eine interdisziplin?re Zusammenarbeit zwischen Sprachwissenschaftlern (Lehrstuhl f¨¹r Englische Sprachwissenschaft einschl. Sprachgeschichte, Universit?t Bamberg) und Statistikern (Professur f¨¹r Mathematik in den Wirtschaftswissenschaften und Lehrstuhl f¨¹r Statistik und ?konometrie, Universit?t Bamberg) und wird derzeit von der Deutschen Forschungsgemeinschaft (DFG) f¨¹r den Zeitraum vom 1. Oktober 2024 bis zum 30. September 2027 gef?rdert.
Mit diesem Projekt verfolgen wir die Erstellung einer digitalen Datenbank f¨¹r vergleichende Studien zu lexikalischen und grammatischen Pr?ferenzen in verschiedenen englischen Variet?ten. Das BSLVC-Projekt wurde im Jahr 2008 initiiert, zun?chst mit einem Fokus auf Sprachkontakt zwischen dem Englischen und romanischen Sprachen. Inzwischen hat sich der Fokus erweitert und umfasst nun auch Regionen, in denen Englisch als Erstsprache gesprochen wird (English as a Native Language, ENL), darunter England, Wales, Schottland, Australien, Puerto Rico und die USA, sowie Regionen, in denen Englisch als Zweitsprache (English as a Second Language, ESL, z.?B. Malta, Gibraltar, Puerto Rico) oder als Fremdsprache (English as a Foreign Language, EFL, z.?B. Deutschland, Slowenien und Schweden) verwendet wird.
Bis heute (Stand: Januar 2025) haben wir rund 400.000 lexikalische und 250.000 grammatische Datenpunkte aus ¨¹ber 6.000 Frageb?gen gesammelt.
Mit der Ver?ffentlichung wird das BSLVC-Projekt in eine Crowdsourcing-Phase ¨¹bergehen. Externe Wissenschaftler, die sich mit bestimmten englischen Variet?ten besch?ftigen, haben dann die M?glichkeit, durch lokale Datenerhebungen und Feldforschung zur Datenbank beizutragen. Zudem hat der Ethikrat der Universit?t Bamberg dem BSLVC-Projekt eine ethische Unbedenklichkeit bescheinigt.
Frageb?gen als Datenquelle
Frageb?gen weisen h?ufig einen engen linguistischen Fokus auf, was dazu beitr?gt, dass es kaum vielseitige Erhebungsdatenbanken gibt. Drei bemerkenswerte Ausnahmen, der World Atlas of Language Structures Online (WALS; Dryer & Haspelmath 2022), The Atlas of Pidgin and Creole Language Structures (APiCS; Michaelis et al. 2022) sowie der electronic World Atlas of Varieties of English (eWAVE; Kortmann et al. 2020) wurden in der linguistischen Fachwelt positiv aufgenommen. Allerdings spiegeln sie Expertenurteile ¨¹ber den globalen Status von Merkmalen in einer Variet?t wider (z.?B. nicht vorhanden, selten, weit verbreitet). Solche Daten haben zweifellos enzyklop?dischen Wert, sind jedoch als Prim?rquelle f¨¹r quantitative Untersuchungen zu Variationsmustern innerhalb einer Variet?t, insbesondere im Hinblick auf soziale und stilistische Dimensionen, ungeeignet.
Hier setzt der Bamberg Survey of Lexical Variation and Change (BSLVC) an, der sich zu einer gro? angelegten, empirisch fundierten Fragebogendatenbank entwickelt. Diese stellt eine sinnvolle Erg?nzung dar zu (i) den in eWAVE dokumentierten Expertenurteilen (die bislang keine EFL-Variet?ten und nur wenige der im Projekt behandelten Variet?ten umfassen) sowie (ii) dem g?ngigen korpusbasierten Ansatz in der Untersuchung englischer Variet?ten. In Bezug auf den empirischen Umfang adressiert der BSLVC explizit einige der Schw?chen korpusbasierter Ans?tze und kann wichtige Beitr?ge zur ¨¹bergeordneten Diskussion ¨¹ber die Modellierung des Englischen weltweit leisten (vgl. Deshors 2018; Hundt 2021; Buschfeld & Kautzsch 2022). Mixed-Methods-Designs und speziell entwickelte Instrumente wie Frageb?gen (vgl. Dollinger 2015), wie sie im BSLVC zum Einsatz kommen, bieten folgende Vorteile f¨¹r die Untersuchung von Sprachvariation und -wandel:
i) Sie liefern vergleichbare Daten f¨¹r verschiedene Variet?ten des Englischen und erm?glichen somit robustere variet?ten¨¹bergreifende Analysen.
ii) Die Erhebung umfassender soziodemografischer Angaben erlaubt es Sprachwissenschaftlern, die soziale Dimension von Sprachvariation zu beleuchten.
iii) Durch ein geeignetes Erhebungsdesign und die Formulierung von Items k?nnen Ausk¨¹nfte zu nahezu jedem sprachlichen Merkmal erhoben werden.
Fragebogendaten bringen jedoch auch eigene Herausforderungen mit sich. Ihre komplexe Struktur und abgestuften Antwortformate erfordern spezifische Analyseans?tze und benutzerfreundliche Tools zur Verarbeitung sind derzeit noch rar. In diesem Zusammenhang k?nnen vielseitige Umfragedatenbanken wie das BSLVC-Projekt einen wichtigen Beitrag leisten. Obwohl noch nicht ver?ffentlicht, zeichnet sich der BSLVC bereits durch eine starke empirische Basis und eine gro?e Bandbreite aus und bietet wertvolles Potenzial f¨¹r Forschende, die ¨¹ber traditionelle Datenquellen hinausgehen m?chten.
Finanzierung
Das BSLVC Projekt wird derzeit von der Deutschen Forschungsgemeinschaft (DFG) vom 1. Oktober 2024 bis zum 30. September 2027 gef?rdert (Zuschuss ID: 548274092). Zuvor wurde es vom Bayerischen Staatsministerium f¨¹r Wissenschaft und Kunst von 2008 bis 2014 sowie vom spanischen Ministerium f¨¹r Bildung und Wissenschaft mit Mitteln des Europ?ischen Fonds f¨¹r regionale Entwicklung (EFRE) gef?rdert (Zuschuss ID: HUM2007 -60706/FILO).
Datenerhebung
Der Fragebogen besteht aus drei Teilen:
Im ersten Teil werden soziodemografische Daten der Teilnehmer erhoben (u. a. Alter, Geschlecht, Bildungs- und Berufshintergrund).
Im zweiten Teil werden die lexikalischen Pr?ferenzen f¨¹r britisch-amerikanische (Beinahe-)Synonyme (z. B. pavement-sidewalk, diapers-nappies) untersucht.
Der dritte Teil erhebt die Verwendungsraten f¨¹r 345 S?tze (138 gesprochene und 207 geschriebene S?tze). Im gesprochenen Teil h?ren die Teilnehmer aufgezeichnete S?tze, die von einem Muttersprachler der Zielvariet?t vorgelesen werden. Sowohl die gesprochenen als auch die schriftlichen Stimuli werden in zwei unterschiedlichen Kontexten pr?sentiert, die verschiedene Stufen der Formalit?t widerspiegeln:
(i) ein informelles Gespr?ch unter Freunden
(ii) eine formelle E-Mail an einen ehemaligen Lehrer
Die S?tze enthalten ein breites Spektrum an grammatikalischen Merkmalen, wie z. B. doppelte Komparative, Nullmarkierung der dritten Person Singular und but am Satzende, wodurch sichergestellt wird, dass die Datenbank ein breites Spektrum an linguistischen Forschungsfragen abdecken kann. Die BSLVC-Datenbank kann dann quantitative Informationen ¨¹ber die Verteilung eines Merkmals liefern und soziale (z. B. Alter, Geschlecht) sowie stilistische Aspekte aufzeigen. Die im Fragebogen verwendete Form der Bewertungsaufgabe liefert Daten auf einer ordinalen Likert-Skala.
Da die Variet?ten, die im Mittelpunkt des BSLVC stehen, bisher kaum erforscht sind, ist die Datenerhebung vor Ort ein wesentlicher Bestandteil des Projekts. Die Daten werden haupts?chlich durch pers?nliche Befragungen w?hrend Exkursionen, die vom Lehrstuhl f¨¹r Englische Sprachwissenschaft durchgef¨¹hrt werden, erhoben. W?hrend der Gro?teil der Datenerhebung bisher mit einem standardisierten Papierfragebogen stattfand, wurde mittlerweile auch eine digitale Version entwickelt. Die Frageb?gen bestehen aus mehreren Abschnitten, die unabh?ngig voneinander verwendet werden k?nnen.
Die Teilnahme am Fragebogen ist freiwillig und anonym. Die Teilnehmenden werden dar¨¹ber informiert, dass sie das Ausf¨¹llen des Fragebogens jederzeit beenden k?nnen. Studierende, die den Fragebogen (Lexikon und Grammatik) vollst?ndig ausf¨¹llen, erhalten in der Regel 10 € (oder einen entsprechenden Betrag). Die Mitglieder des BSLVC-Teams haben stets eine ethische Genehmigung f¨¹r die Erhebung des Fragebogens an den Universit?ten eingeholt, an denen diese ben?tigt wurde (z. B. Malta, Edinburgh). Die erhobenen soziodemografischen Informationen enthalten keine pers?nlichen Daten, die eine Identifizierung von Einzelpersonen erm?glichen.
Digitalisierung
Die ausgef¨¹llten Frageb?gen werden eingescannt, mit einer Optical Mark Recognition (OMR)-Software digitalisiert und von studentischen Hilfskr?ften des Lehrstuhls f¨¹r Englische Sprachwissenschaft manuell ¨¹berpr¨¹ft. Daneben kommt eine digitale Version des Fragebogens auf Basis von Limesurvey zum Einsatz. Im letzten Schritt werden die Daten normalisiert und in einer Datenbank zusammengef¨¹hrt. Die Datenanalyse und -visualisierung erfolgt haupts?chlich in R und Python.
Literaturverzeichnis
Buschfeld, Sarah & Alexander Kautzsch. 2022. Modelling World Englishes: A joint approach to Postcolonial and non-postcolonial varieties. In Modelling World Englishes. Edinburgh University Press. https://doi.org/10.1515/9781474445887
Deshors, Sandra C. (Hrsg.). 2018. Modeling World Englishes: Assessing the interplay of emancipation and globalization of ESL varieties (Varieties of English Around the World G61). Amsterdam: John Benjamins. https://doi.org/10.1075/veaw.g61
Dollinger, Stefan. 2015. The written questionnaire in social dialectology: history, theory, practice (IMPACT volume 40). Amsterdam, Philadelphia: John Benjamins. https://doi.org/10.1075/impact.40
Dryer, Matthew & Martin Haspelmath. 2022. The World Atlas of Language Structures Online. Zenodo. https://doi.org/10.5281/ZENODO.7385533
Hundt, Marianne. 2021. On models and modelling. World Englishes 40(3). 298¨C317. https://doi.org/10.1111/weng.12467
Kortmann, Bernd, Kerstin Lunkenheimer & Katharina Ehret (Hrsg.). 2020. The Electronic World Atlas of Varieties of English. Zenodo. https://zenodo.org/record/3712132
Kortmann, Bernd and Schneider, Edgar (Hrsg.) with Burridge, Kate, Mesthrie, Rajend and Upton, Clive. 2004. A handbook of varieties of English. Vol. 1: Phonology; Vol. 2: Morphology and syntax. Berlin and New York: Mouton de Gruyter. https://doi.org/10.1515/9783110197181
Michaelis, Susanne Maria, Philippe Maurer, Martin Haspelmath, Magnus Huber & Robert Forkel (Hrsg.). 2022. Atlas of Pidgin and Creole Language Structures Online. Oxford: Oxford University Press. http://apics-online.info
Diese Literaturangaben beziehen sich auf alle Seiten, die sich mit dem BSLVC befassen.