A Gateway to Studying HEL: Links



コーパス (Corpora)

 コーパスを利用した英語史研究は近年非常に盛んになっています。有益な概説書に齊藤俊雄・中村純作・赤野一郎(編) 『英語コーパス言語学 ―基礎と実践― 改訂新版』(研究社 2005)があります。英語史と特に関わるのは、第8 章「コーパスに基づく英語史研究」です。コーパス言語学全般については、英語コーパス学会のホームページのリンク集「コーパス研究に有用なWeb サイト一覧」が有益です。また、特に入門者には、家入葉子先生のホームページ中の「コーパス言語学関係」が参考になります。谷明信先生の「コーパス関係の情報」、塚本聡先生の「英語史研究者のためのコンコーダンス作成講習会」資料もご覧ください。


* ICAME (International Computer Archive of Modern and Medieval English)
英語コーパスの収集・配布を行う国際機関です。
* The Oxford Text Archive
あらゆる言語のコーパスを開発・収集・配布しています。
* Corpus Resource Database (CoRD)
通時・共時英語コーパスの情報サイトです。

* 通史 (General) *

* Helsinki Corpus of English Texts (Diachronic Part)
古英語から近代英語までをカバーした、世界最初の英語史コーパスです。ICAME か OTA から入手できます。
* Corpus of Early English Medical Writing (CEEM)
1375 年から1800 年までの医学文献の通時的コーパスです。Middle English Medical Texts (MEMT) Early Modern English Medical Texts (EMEMT) はCD-ROM で入手可能、Late Modern English Medical Texts (LMEMT) は現在編纂中です。
* Corpus of English Religious Prose (COERP)
1150 年から18 世紀末までの宗教散文の通時的コーパスです(現在編纂中)。
* Corpus of Early English Recipes (CoER)
スペインのUniversity of Las Palmas de Gran Canaria で現在編纂中のコーパスです。2010 年にオンラインで公開が予定されています。
* Seville Corpus of Northern English (SCONE)
スペインのUniversity of Seville で現在編纂中のコーパスです。600 年から1500 年までの北部英語を対象としています。
* Corpus of Narrative Etymologies (CoNE)
University of Edinburgh で編纂されたコーパスです。
* LEON-corpus (Leuven English Old to New)
Peter Petré (University of Leuven) が編纂した、OE, ME のコーパスです(250 万語)。一般公開はされていません。

* 古英語 (Old English, OE) *

* Dictionary of Old English Web Corpus
DOE 編纂のための古英語の文献のコーパスです。登録をすれば無料で検索できます(※制限つき)。
* York-Helsinki Parsed Corpus of Old English Poetry
Helsinki Corpus の古英語の韻文作品を構文解析したコーパスです。 OTA から入手できます。
* York-Toronto-Helsinki Parsed Corpus of Old English Prose (YCOE)
古英語の散文作品を構文解析したコーパスです。 OTA から入手できます。

* 中英語 (Middle English, ME) *

* Corpus of Middle English Prose and Verse
中英語の韻文・散文作品の本文検索や電子テキストの閲覧ができます。
* Corpus of MED quotations
Peter Petré (University of Leuven) が編纂した、MED の全引用文のテキストファイルです(一部重複を除く)。リンク先から圧縮版をダウンロードできます。
* Penn-Helsinki Parsed Corpus of Middle English, Second edition (PPCME2)
Helsinki Corpus 収録の中英語散文作品を構文解析したコーパスです。
* The Parsed Corpus of Middle English Poetry (PCMEP)
中英語の韻文作品の構文解析コーパスです。
* ICAMET (Innsbruck Computer Archive of Machine-Readable English Texts)
中英語の散文作品と1386 年から1688 年までの書簡のコーパスです。
* MEG-C (The Middle English Grammar Corpus)
University of Stavanger で現在編纂中のコーパスです。
* Corpus of Early English Correspondence (CEEC)
1410 年から1681 年までの書簡のコーパスです。1998 年に完成しています。
* Corpus of Early English Correspondence Sampler (CEECS)
1418 年から1680 年までの書簡のコーパスです。ICAME か OTA から入手できます。
* Corpus of Early English Correspondence Supplement (CEECSU)
CEEC の社会・地域的なギャップを埋める目的で、現在編纂中のコーパスです。
* The Parsed Corpus of Early English Correspondence (PCEEC)
1410 年から1681 年までの書簡のコーパスです。ICAME か OTA から入手できます。
* The Parliament Rolls of Medieval England
1272 年から1509 年までの英国議会の議事録のコーパスです。
* The Málaga Corpus of Late Middle English Scientific Prose
Hunterian Glasgow University Library 所蔵の中英語の写本の解析コーパスです。

* 近代英語 (Modern English, ModE) *

* Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME)
Helsinki Corpus の初期近代英語の部分を拡張・構文解析したコーパスです。なお、同じ構文解析コーパスのシリーズで、Parsed Corpus of Early Modern English Correspondence (PCEMEC) が現在編纂中です。
* The Penn-York Computer-annotated Corpus of a Large Amount of English (PYCCLE)
Early English Books Online (EEBO) と Eighteenth Century Collections Online (ECCO) の解析コーパスです。
* The Salamanca Corpus: Digital Archive of English Dialect Texts
1500 年から1950 年までの通時方言コーパスです(現在編纂中)。
* Corpus of Historical English Law Reports (CHELAR)
1535 年から1999 年までの法律文書のコーパスです。
* Michigan Early Modern English Materials
同名の文献(Richard W. Bailey et al. (eds.), UMI, 1975)の電子版です。
* Shakespeare Corpus
Shakespeare の劇37 作と劇中の登場人物の台詞のコーパスです。
* A Corpus of English Dialogues, 1560-1760 (CED)
初期近代英語期の対話資料のコーパスです。ICAME から入手できます。
* The Lampeter Corpus of Early Modern English Tracts
1640 年から1710 年の間に出版された文献のコーパスです。ICAME か OTA から入手できます。
* ARCHER (A Representative Corpus of Historical English Registers)
1650 年から1990 年までのイギリス・アメリカ英語のコーパスです。最新版(ARCHER 3.2)はオンラインで検索できます(※要登録)。
* Zurich English Newspaper Corpus (ZEN)
1661 年から1791 年までの英語の新聞記事コーパスです。CD-ROMを入手できます。
* Newdigate Newsletters
1674 年から1715 年まで。
* The Old Bailey Corpus
ロンドンの中央刑事裁判所Old Bailey での議事録(1674〜1913)のコーパスです。Old Bailey Online もご覧下さい。
* Penn Parsed Corpus of Modern British English (PPCMBE)
2010 年1 月に完成した、1700 年から1914 年までの100 万語イギリス英語コーパスです。
* A Corpus of Late Modern British and American English Prose (COLMOBAENG)
University of Santiago de Compostela のProf. Teresa Fanego が編纂したコーパス(1700〜1879)です。
* The English language of the north-west in the late Modern English period: A Corpus of late 18c Prose
1761 年から1790 年までの北西部の英語の書簡のコーパスです。OTA から入手できます。
* Corpus of Early English Correspondence Extension (CEECE)
CEEC の18 世紀の部分を拡張する目的で、現在編纂中のコーパスです。
* Corpus of Late Modern English Texts, version 3.0 (CLMETEV3.0)
1710年から1920年までの、イギリス英語の母語話者による作品に基づいた、約3400 万語のコーパスです。
* Coruña Corpus of English Scientific Writing
Research Group for Multidimensional Corpus-based Studies in English (MuStE) で現在編纂中のコーパスです。
* Hansard Corpus
1803 年から2005 年までのイギリス議会における演説のコーパスです。
* Corpus of English Novels (CEN)
1881 年から1922 年までのイギリス・アメリカ英語の小説のコーパスです。
* A Corpus of late Modern English Prose
1861 年から1919 年までの書簡のコーパスです。 OTA から入手できます。
* Corpus of Nineteenth-Century Newspaper English (CNNE)
19 世紀の英語のコーパスです(現在編纂中)。
* The Diachronic Corpus of Present-Day Spoken English (DCPSE)
ICE-GB (International Corpus of English, British component)London-Lund Corpus に基づいて開発された、口語英語の構文解析通時コーパスです。CD-ROM で入手できます。

* 地域変種 (Regional English) *

* Helsinki Corpus of Older Scots
Middle Scots (1450-1700) のコーパスです。ICAMEOTA から入手できます。
* Corpus of Scottish Correspondence (CSC)
1500〜1715 年のスコットランド英語で書かれた書簡のコーパスです。
* Corpus of Modern Scottish Writing (CMSW)
1700〜1945 年のスコットランド英語のコーパスです(現在編纂中)。
* Scottish Corpus of Texts & Speech (SCOTS)
1945〜2007 年のスコットランド英語のコーパスです(400 万語)。
* A Corpus of Irish English
14 世紀初頭から現代までのアイルランド英語のコーパスです。Raymond Hickey, Corpus Presenter (John Benjamins, 2003) に付属されています。
* The Parsed Old and Middle Irish Corpus (POMIC)
同じくアイルランド英語の解析コーパスです。
* Corpus of Early Ontario English (CONTE)
Stefan Dollinger (University of British Columbia) 編纂のカナダ英語の通時的コーパス(約22 万5000 語)で、1776 年から1850 年までのpre-Confederation section (CONTE-pC) が入手可能です。
* Corpus of Oz Early English (COOEE)
1788 年から1900 年までのオーストラリア英語の通時的コーパス(約200 万語)です。
* The Diachronic Electronic Corpus of Tyneside English (DECTE)
Newcastle University で現在編纂中のコーパスです。
* Corpus of Historical American English (COHA)
1810 年から2009 年までのアメリカ英語の通時的コーパス(約4 億語)です。

Valid HTML 4.01 Transitional Valid CSS!