Welcome to the Erlangen Student Corpus Collection (ESCC)
Every semester, numerous students compile corpora for their coursework papers and BA/MA theses using the linguistic and methodological skills acquired at our university. Once the research is completed, these corpora fall into oblivion in spite of the time, effort and expertise invested by the compilers. We feel that the publication of such student-compiled corpora is a good way of showing our recognition for these early-stage researchers’ projects, and that the awareness of contributing means for future linguistic research raises our students’ motivation.
Participation in the corpus collection is voluntary and subject to copyright restrictions.
Even though the corpora in our collection are relatively small by comparison to those compiled by large research institutions, they are valuable because each corpus opens up new opportunities to find out more about the types of text it contains and about language in general. Some of our corpora might be among the first publicly available ones for a specific communicative situation (such as live video game commentary), but even those that are not contribute yet another tiny piece to the mosaic of linguistic resources for empirical research. Please note that the opinions expressed in the corpus texts are not necessarily those of the corpus compilers, and that the communicative situations included in the corpora are documented for purely linguistic purposes.
The corpora
Each corpus consists of a text file with the contents and a pdf file with information on the compiler, the coding conventions etc.
- Blood Bowl Stream Commentary Corpus (BBSCC): Info – Corpus
- Football Commentary Corpus (FCC): Info – Corpus
- Late-night Show Corpus (LnSC): Info – Corpus
- Tabloid Talk Show Interruption Corpus (InterTab): Info – Corpus
Further information
For any general questions and comments regarding the Erlangen Student Corpus Collection, please contact Christina Sanchez-Stockhammer (christina.sanchez@lmu.de). If you would like to contribute a corpus to the Erlangen Student Corpus Collection, please use the blank form for the corpus documentation that can be found here.
For enquiries regarding a specific corpus, or to inform us about research you have been using it for, please contact the person indicated in the respective corpus information sheet.
Willkommen zur studentischen Korpussammlung der FAU (ESCC)
Jedes Semester erstellen viele Studierende unserer Universität im Rahmen ihrer Hausarbeiten oder Abschlussarbeiten Korpora und wenden dabei die linguistischen und methodischen Kenntnisse an, die sie hier erworben haben. Sobald die Untersuchungen abgeschlossen sind, geraten diese Korpora jedoch trotz des Aufwands und der Expertise, die ihre studentischen Verfasser in ihre Erstellung investiert haben, in Vergessenheit. Wir sind der Meinung, dass die Veröffentlichung solcher studentischen Korpora eine gute Möglichkeit ist, Anerkennung für die Projekte des frühen wissenschaftlichen Nachwuchses zu zeigen, und dass das Bewusstsein, eine allgemein zugängliche linguistische Ressource zu schaffen, die Motivation der studentischen ForscherInnen erhöht.
Die Teilnahme an der Korpussammlung ist freiwillig und eingeschränkt durch Copyrightbestimmungen.
Wenngleich die Korpora in unserer Sammlung im Vergleich zu denjenigen großer Forschungseinrichtungen eher klein sind, schmälert das nicht ihren Wert, denn jedes Korpus eröffnet neue Möglichkeiten, die Textarten, die es enthält und die Sprache als Ganzes besser zu erforschen. Manche unserer Korpora gehören zu den ersten öffentlich zugänglichen für eine bestimmte kommunikative Situation (z.B. Let’s Plays), und diese wie auch alle anderen Korpora leisten ihren Beitrag zum Mosaik der Ressourcen für die empirische Erforschung von Sprache. Bitte beachten Sie, dass die in den Korpustexten ausgedrückten Meinungen nicht notwendigerweise denen der KorpuserstellerInnen entsprechen, und dass die Dokumentation der in den Korpora enthaltenen Kommunikationssituationen rein sprachwissenschaftlichen Zwecken dient.
Die Korpora
Jedes Korpus besteht aus einer Textdatei mit den Korpusinhalten und einer pdf-Datei mit Informationen über die AutorInnen, die bei der Korpuserstellung befolgten Konventionen usw.
- Blood Bowl Stream Commentary Corpus (BBSCC): Info – Corpus
- Football Commentary Corpus (FCC): Info – Corpus
- Late-night Show Corpus (LnSC): Info – Corpus
- Tabloid Talk Show Interruption Corpus (InterTab): Info – Corpus
Weitere Informationen
Bei allgemeinen Fragen oder Vorschlägen zur studentischen Korpussammlung wenden Sie sich bitte an Christina Sanchez-Stockhammer (christina.sanchez@lmu.de). Wenn Sie ein Korpus zur Erlangen Student Corpus Collection beisteuern möchten, verwenden Sie bitte das Formular hier.
Bitte wenden Sie sich an die im Informationsblatt angegebene Kontaktperson bei Fragen zu einzelnen Korpora oder wenn Sie uns über Forschungsprojekte informieren möchten, für die Sie das jeweilige Korpus verwendet haben.