文部科学省科学研究費補助金
報告書
種別:基盤研究(C)(2)
課題番号:13610608
課題:ロンサールの語彙構造
はじめに
本報告書は第1部,第2部および添付CDに分かれている。第1部は研究成果の一部として発表された論文「ロンサールにおけるカロンとパルカ
---- m'envoie(m'envoyez) en la barque de ... ----」(岡山大学ヨーロッパ言語文化研究,第21号,2002年3月)に収録したものである。第2部は科研費を使用した本研究の研究過程で作成されたデータベースについて記述している。
本報告書末尾に添付されたCDはデータベース本体を収録している。データベースはインターネット上で公開されており,以下のアドレス
http://www.okayama-u.ac.jp/user/rons-ard/index.htm
よりアクセス可能である。
第1部
「ロンサールにおけるカロンとパルカ ---- m'envoie(m'envoyez) en la barque de ... ----」
第2部
恋愛詩集およびオード五部集データベースについて
恋愛詩集およびオード五部集データベースについて[1]
延味 能都
0. はじめに
平成13年度より文部科学省科学研究費の補助をうけ,ロンサールの語彙に関する研究を進めてきた。研究の成果は第1部に掲載したように,論文として発表した。これに加え,一方では,研究の過程でロンサールの作品のデータベースが構築されており,収録語数は約10万件に上っている。しかし,このデータベースに関してはこれまでの研究でも,間接的には言及したことはあったが,そのデータベース自体を解説したことは無かった。本稿ではデータベースの作成の経過,特徴,留意点,使用法などを述べる予定である。
1. フランス文学データベース
1986年からフランスでは巨大なフランス語文献データベースであるFrantextがオンラインでの稼働を開始した。Stellaと名付けられたソフトウェアで利用することができたが,当初はいくつかの場所からのアクセスに限られていた。しかも利用者からの要求は専門の職員の手で一つ一つStellaの理解できる形式に直す必要があった[2]。
このデータベースの基礎となったのは19世紀および20世紀を対象とした辞書Trésor de la langue Française(T.L.F.)の編纂のために構築されたデータベースである。最初の電子化は1966年ころから始まっている[3]。テキストの電子化が開始された当時はBull Gamma 60というコンピューターが使用されていたが,当時の技術的な制約は大きく,文献(文学以外の分野の文献も入力されていた)の本文や書誌情報の入力は,穿孔機で穴をあけたパンチカードで入力が行われていたようである。
一方,このT.L.F.と平行する形でInventaire général de la langue française(I.G.L.F.)でも同様な作業が進められていた。二つの異なる組織がテキストデータの電子化という同じ作業を平行して進めていたことになるわけだが,T.L.F.の辞書の完成の見込みがたった時点でINaLF(Institut National de la Langue Française)が組織され,T.L.F.とI.G.L.F.はINaLFのもとに統合されることになる。辞書のために集められた膨大な資料をより効率よく広く利用するためである。その後は,現在に至るまで,蓄積されたデータはINaLFの管轄下に置かれている。この巨大なデータベースがインターネットの普及を背景にネットへ対応し,インターネットを経由し,しかも以前より格段に扱いやすい形で研究機関,研究機関所属の研究者の利用にともされるようになったのは1996年のことである。このデータベースの一部,文学作品に関するものはCD化されて入手できるようになっている。また,Frantextへの作品の入力は現在でも継続されており,このデータベースはフランス語関係のデータベースとしては世界最大といえるものとなっている。
しかし,書物,特に文学作品を電子化して機械可読な状態にし,コンピューターによる処理を加えて利便性を高め,コンピューターの専門家でなくとも使用可能な状態にして一般に提供する,という考えが広く普及し,テキストの提供が実際に行われるようになったのはFrantextの例にも見られるように,それほど古いことではない。使用するコンピューターの性能や通信環境に大きく依存していたためである。個々の利用者が個人的にコンピューターを所有し,それらのコンピューターの性能が向上し,通信環境が飛躍的に改善されるのを待たなければならなかった。特に,文学作品をコンピューターで扱うというという点で利用者側の意識が変わり,電子化された作品のデータが広く使用され始めたのは,実際には,20世紀末から始まるここ10年程度のことにすぎない。
したがって,西暦2002年の現段階では,あらゆる文学作品がコンピューターに入力されているわけではない。中世の作品は表記上の問題などもあるため,現代の作品に比較すればまだそれほど多くはないようである。作者や作品によっても入力の進展状況は大きなばらつきがある。そして不幸にも我々が扱っているロンサールP. de Ronsard のテキストは遅々として電子化が進まない部分に属している。
もちろんロンサールのテキストが全く電子化されていないわけではない。先に述べたFrantexteにはロンサールの電子化されたテキストが存在している。収録された作品を調べてみると以下の作品が収録されていることが判る[4]。
Le Premier livre des Odes,Texte établi, présenté et annoté par Paul Laumonier, Les Belles
Lettres, 2001.
Second livre des Odes,Texte établi, présenté et annoté par Paul
Laumonier, Les Belles Lettres, 2001.
Troisiesme livre des Odes,Texte établi, présenté et annoté par Paul
Laumonier, Les Belles Lettres, 2001.
Quatriesme livre des Odes,Texte établi, présenté et annoté par Paul
Laumonier, Les Belles Lettres, 2001.
Les Quatre premiers livres des Odes (1550) : au lecteur ; avertissement
au lecteur,Texte établi, présenté et annoté par Paul Laumonier, Les Belles
Lettres, 2001.
Le Cinquiesme livre des Odes, Texte établi, présenté et annoté par Paul
Laumonier, Les Belles Lettres, 2001.
Sonnets pour Hélène, éd. J. Lavaud, Paris : Droz, 1947.
Le Second livre des amours, éd. A. Mmicha, Genève : Droz, 1951.
上記のリストでは,オード集に関しては,我々も利用したLaumonier版が入力されている。しかし,他の作品はLaumonier版によるものではない。Drozの版も十分に信頼でき,権威のあるものであるが,やはりLaumonier 版には及ばない。ロンサールの作品についてはLaumonier版が原典依拠版としてその地位を確立しているためである。したがって,利用価値のあるデータとしてはLaumonier版を利用したオード集のみだということになる。一方,Laumonier版はインデックス部分も含んで20巻に及ぶものである。Frantexteに入力されたロンサールのテキストの分量は, Frantexteのデータベースの巨大さと比較しても,この詩人の全作品の規模と比較しても,ごく微量というしかない。世界最大のフランス文学作品のデータベースであっても,現在入力されているロンサールの作品はこの程度でしかない。
フランスでこうしたデータベースが構築されている一方で,1972年にはアメリカにおいてロンサールのワードインデックス[5] がA.E. Creoreによって作成されている。このインデックスはコンピューターを使用した作業の結果であることを明記しており,ロンサールの作品に対して大規模にコンピューターが使用された最も早い例と位置づけることができる。しかしながらインデックスが作成された時点での研究水準を反映しているのも確かで,突発的に発生している異常データの混入,一部データの欠落等がある。最大の難点は,その後このような研究用参考書籍で採用されるKWIC(Key Word In the Center)方式のコンコルダンスとはなっていないことである。データは数字の羅列となっており,利便性という点では非常に使いにくいものとなっている。ロンサールの作品は一度は何らかの形で電子化されてはいるわけだが,作業のために入力されたデータそれ自体はインターネットなどで一般の使用に提供されるには至らなかった。
さらに,La société Bibliopolis [6] ではClassiques Garnier に収められていた全作品を電子化し,一般の利用に提供している。この電子化テキストはBibliothèque
National de la France でもGallica Classiqueとして提供おり[7],利用が可能である。だが,そのなかでロンサールは僅かに以下の2作品集が収められているにすぎない。
Les amours, éd. Classiques Garnier, par Henri Weber et Catherine Weber .
Poésies choisies, éd. Classiques Garnier , mise à jour par Françoise.
まず,Poésies choisies に関しては,アンソロジーであるというその形態からしてすでに網羅的な語彙研究には不向きである。Les amours はロンサールが発表した作品の中でいわゆる恋愛詩集に分類されているものを網羅的に集めており,この点では十分な情報量がある。だが,このLes amours で使用されたのは初版を底本としているため,ロンサールの残した初版以降の校正,つまりヴァリアントに関する情報が少ない。
他にはジュネーブ大学のサーバーに置かれたフランス語テキストデータベース Athena がある[8]。このAthenaはかなり古いものから新しいものまで著名なテキストの多くを網羅しており,ロンサールに関しては
が収録されていることになっているのだが,実際には上記で述べたGallica Classiqueへのリンクとなっている。
また,ABU (l'Association des Bibliophiles Universels) でも一般向けのテキストデータベースの提供を行っている[9]。ここには他にはない興味深いテキストもあるものの,残念ながら2002年12月現在ではロンサールのテキストの提供は無い。
2002年現在ではインターネットで検索を行うことによってロンサールの詩編を入力して公開している多くのサイトを見つけることが出来る。この点に関してはここ10年で大きく変化した。しかし,ほとんどは特定の有名な詩編のみを数編収録しただけの 「趣味・紹介」の域を出ないものであり,研究用としては実用にはならないものである。さらに,書店などによって作成された大規模なデータはまだ入手可能な段階ではなく,さらには入手可能な状態になったとしても,版権などの問題からデータを自由に加工・使用することは一般に困難である。
したがって,ロンサールの語彙研究を,データーベースを使用しながら行おうとすれば,データーは研究者が自分自身で入力を行わなければならない。ロンサールに関しては,状況はフランスで最初のテキストの電子化が行われ始めた1966年頃とほとんど変わっていないということである。
我々は1990年に「『恋愛詩集(1552)』の語彙頻度表」,を発表して以来[10],一貫してデータ化されたロンサールのテキストを扱う研究を行ってきた。一方では細々とではあるが,ロンサールのテキストを電子化する作業を続けてきた。2001年(平成13年度)に文部科学省の科学研究費の交付をうけることにより,それまで蓄積してきたデータが一定の水準に達したと判断するに至った。
上に述べたように,現在,ロンサールの電子化されたテキストを自由に独自のやり方で利用しようとすれば,テキストの電子化そのものから始めなければならないという状況は何ら変わっていない。このように,ロンサールに関してはテキストデータベースの存在・提供そのものが少ないという状況を考慮すれば,本データベースはインターネット上で公開されるべきであった。Frantexte等の巨大でデータ処理の専門家によるメンテナンスが行われるロンサールのデータベースが構築された場合には,それらを利用することに何ら抵抗はないが,不幸にも現段階ではまだ十分なデータベースが存在していない。現時点では恋愛詩集などを収録した本データベースの方がFrantexteよりも大きい。本データベースを公開することを考えた一つの理由である。
2. 恋愛詩集およびオード五部集データベースについて
2-1. 収録データ
本報告と共に提出されるデータベースは以下の電子化されたテキストを含んでいる。底本としたのはいずれもOevres Complètes de P. de Ronsard, éd.Laumonier, S.T.F.M., Livrairie NIZET, 1937-1990 である。
Titres |
Édition |
Les Amours (1552) |
éd. Laumonier, t.4. |
Continuation des Amours (1555)(70 sonnets) |
éd. Laumonier, t.7. |
Nouvelle Continuation des Amours (1556) |
éd. Laumonier, t.7. |
Sonnets pour Hélène Ier livre (1578) |
éd. Laumonier, t.17. |
Sonnets pour Hélène 2e livre (1578) |
éd. Laumonier, t.17. |
Pièces ajoutées en 1560 a la section des Amours |
éd. Laumonier, t.10. |
Ier livre des Odes (1550) |
éd. Laumonier, t.1. |
2e livre des Odes (1550) |
éd. Laumonier, t.1. |
3e livre des Odes (1550) |
éd. Laumonier, t.2. |
4e livre des Odes (1550) |
éd. Laumonier, t.2. |
5e livre des Odes (1552) |
éd. Laumonier, t.3. |
2-2. データの作成
基本データはロンサールの作品本文(テキスト)である。テキストはLaumonier版よりスキャナーで読みとりを行い,OCRソフトを使用して電子化されている。OCR解析の読みとり精度は近年大きく上昇したが,エラーフリーの状態にはまだ達していない。したがって,解析後は読みとりエラーの修正を行う必要がある。
現代フランス語の場合,フランス語用スペルチェッカーを入手し,そのスペルチェッカーで読みとりエラーを修正するのが通常の作業であろうが,16世紀フランス語ではスペルチェッカーが使用できない。16世紀フランス語には現代フランス語と異なる綴りが多く,作家や作品の発表年代によっても異綴が存在している。一般にワードプロセッサー等に付属あるいは市販されているスペルチェッカーは16世紀の異綴りに対応していないため使用できない。このため,読みとりエラーの修正は手作業で行わざるを得なかった。この修正作業は基本的にはLaumonier版のテキストとつきあわせる形で行われている。しかし,一方では,データーベースの規模が次第に大きくなるにつれて,データベース自体をスペルチェッカーの代わりに使用することが出来るようになった。現在では手作業による修正前に自作のデータベースを利用したスペルチェックを行う作業を組み入れ,二段階で修正を行っている。
作品は「詩」という形式上,各詩句の頭に参照情報(ヘッダー)を付加し,機種・アプリケーション依存性の高い欧文特殊文字(アクセント記号付文字)を別のアスキー文字の組み合わせに置き換えた状態で保存し,これを一時データとしている。
たとえば,1578年に出版されたSonnets pour Hélène Ier livre. の一部を例に取れば,Laumonier版での収録形態は以下のようになっている。
Quand à longs traits je boy l'amoureuse estincelle
Qui sort de tes beaux yeux, les miens sont esblouys:
D'esprit ny de raison, troublé, je ne jouys,
Et comme yvre d'amour, tout le corps me chancelle.
しかしこれでは参照情報がないためにどこからこの詩句を持ってきたかが特定できない。これを解決するために次のように参照情報を付加する。
SPH1-0015-78-P195-S002-V0001:Quand à longs traits je boy l'amoureuse estincelle
SPH1-0016-78-P195-S002-V0002:Qui sort de tes beaux yeux, les miens sont esblouys:
SPH1-0017-78-P195-S002-V0003:D'esprit ny de raison, troublé, je ne jouys,
SPH1-0018-78-P195-S002-V0004:Et comme yvre d'amour, tout le corps me chancelle.
次に機種依存性の高いアクセント記号付き文字をアスキー文字の組み合わせに置き換える(下線部)。
SPH1-0015-78-P195-S002-V0001:Quand #a longs traits je boy l'amoureuse estincelle
SPH1-0016-78-P195-S002-V0002:Qui sort de tes beaux yeux, les miens sont esblouys:
SPH1-0017-78-P195-S002-V0003:D'esprit ny de raison, troubl%e, je ne jouys,
SPH1-0018-78-P195-S002-V0004:Et comme yvre d'amour, tout le corps me chancelle.
こうして作成された一次データは機種依存することなくデータの移行等を行うことが出来る。ただ,その反面,使用する環境に合わせて再度アスキー文字の組み合わせから欧文特殊文字へと再変換する必要が生じることは覚悟しなければならない。
欧文特殊文字の変換は以下の要領で行われている。
Accents |
Lettres accentuées |
Lettres accentuées converties |
accent aigue |
é |
%e |
accent grave |
à, è, ù |
#a, #e, #u |
accent circonflexe |
â, ê, î, ô, û |
|a, |e, |i, |o ,|u |
tréma |
ä, ë, ï, ö, ü |
\a, \e, \i, \o, \u |
cédille |
ç |
^c |
フランス語のデータをインターネットで公開する場合に最初に突き当たるのが文字表示の不具合の問題である。フランス語のアクセント記号付文字はJISやSHIFT-JISなどのコード体系ではいわゆる「文字化け」をおこすため,正常に表示されない。この問題はJISコードやSHIFT-JISコードのベースとなっているアスキーコードの段階で,フランス語のアクセント付き文字のコードが日本語の漢字コードの一部と重複していることから生じる問題であり,コード体系を変えないかぎり解決は困難である。しかし一方ではロンサールのデータベースということもあり,欧米のコンピューターでも基本的に動作するようにしたいという考え,本データベースではアクセント記号付き文字に関してはHTML用のcode記述を採用している。したがってインターネットブラウザを使用することにより文字化け無しに閲覧可能である[11]。
2-3. 検索エンジンと記述言語
現在インターネットで公開されている各種のデータベースは,データベースと名が付けば,規模の大小,商用・私用,有料・無料にかかわらず何らかの検索システムを使用している。検索システムを備えることがデータの集合がデータベースになる基本的要件だからである。大規模,商用,有料のデータベースに関してはシステムの開発・メンテナンス等は専門家によって行われるものだが,我々のような比較的小規模なデータベースを運用しようとする者が直面する問題とは別に考えなければならない。小規模なデータベースでは一般にデータベースの作成者自身が検索用のプログラムを書き,メンテナンスも行っている場合が多い。本データベースの公開に際しては検索プログラムを作成することから始める必要があった。
インターネット上でアクセスされるデータベースで検索を可能にする方法は複数存在する。一つは市販のネット対応ソフトを使用することであり,2番目はPerl, C,
Java といった何らかのプログラム言語を用いて検索プログラムを書くことである。しかし,大学のサーバーは学内の一般ユーザーに対しては,セキュリティーの確保という観点からこうしたプログラムを動かすことを制限している。従って,大学のサーバーで検索を可能にするには上記以外の方法を考えざるを得ない。我々は別の3番目の方法を採用せざるを得なかった。Java-Scriptによってデータベースとその検索表示システムを構築することである。この方法は利点と同時に欠点も含んでいる。
Java-Scriptで記述することの最大の利点は,インターネットブラウザをインストールしているほぼ全てのコンピューターにはJava-Scriptのインタープリターとしての実行機能が備わっているということである。
ただし欠点も同じほどに大きい。Java-Scriptで検索可能なデータベースを構築しようとすれば,スクリプトが記述されたファイルにデータ自体を内在させなければならない。その結果,記述されたファイルは規模が大きくなってしまう。本データベースを例に取れば一つのファイルの大きさは約1.3Mバイトとなっている。また,スクリプトの実行速度はPerl, C, Javaといったプログラミング言語で記述された,いわゆる本格的プログラムと比較して非常に遅い。このようなデータベースの形態は,コンピューターに負担をかけるため,検索・表示などが完全に利用者のコンピューターの能力に依存する形になる。その結果,本データベースは十分な空きメモリーとCPUの動作速度が500Mz以上無いと実用的な速度で検索・表示を行うことは困難である。
このことは一度に検索するデータベースの規模をあまり大きくは出来ないことを示しており,結果的に本データベースは二つに分割されている。一つは『恋愛詩集』1552年版,『続恋愛詩集』1555年版,『新続恋愛詩集』1556年版,『エレーヌへのソネ第一の書』1578年版,『エレーヌへのソネ第二の書』1578年版,および1560年に恋愛詩集の分類へ新たに付け加えられた詩編を収録している。一つは『オード集第一の書』から『オード集第五の書』までの5作品である。二つの各データベースは約50000語から成っている。二つのデータベースを統合して10万語規模の単一のデータベースとすることは今回は以上に述べた理由により断念した。
ただ,Java-Scriptの利用にも利点がある。Java-ScriptはHTMLファイルの表示の際に,閲覧者のコンピューターの内部に全て読み込まれるため,一度読み込んでしまえば検索の度にサーバーへアクセスする必要が無くなることである。別の言い方をすれば,一度読み込んだファイルを適切な形式で閲覧者のハードディスク等に記録・保存すれば,それ以降はオフラインでの使用が可能になる。
本データベースの欠点と利点は以上だが,将来の展望としては検索プログラムを完全にCGI化し,ネット検索に完全に対応した形式のプログラムを書く考えがある。
また,汎用性を高めるために,アクセント記号付き文字を別の記号で置き換えるなどの操作を行ってアスキーテキストファイルの形で一次ファイルを作成した。最後にデータベースソフトに読み込ませ,語彙情報を入力することによってデータベースは作成されている。
2-4.
辞書
分類に関しては二つの辞書を参照している。
Grand Larousse De la Langue Française, Larousse, 1971-1978.
Dictionnaire de la Langue Française du XVIe siècle, E.Huguet,
を使用した。Huguetは現在では無くなっている語,現代フランス語に存在している語でも16世紀と現在とでは著しく意味や用法の異なる語を記載している。したがって,語彙の分類等に関しては最初にLarousseを参照し,Larousseに語が無い場合にHuguetを参照した。Huguetにも記載がない語に関しては分類Vを与えている。また,著しく用法が現代と異なり,Larousseにその用法や意味の記載が無く,Huguetに記載がある場合にはHuguetを採用した。したがって,同じ語が2度採用されている場合がある。
2-5.分類コード
分類コードは基本的にはNancy IIに置かれたCNRSの研究単位であるURFA, l'Unité de
Recherche sur le Français Ancienで示された分類に従っている。詳細は
La lemmatisation assistée par ordinateur de textes de moyen français,
vol.1., méthode générale, S.Monsonégo, J.Graff, ODerniame, M.Hénin,
U.R.F.A.-U.R.L 10 -I.Na.Lf., Université de Nancy II, 1989.
「P. de Ronsard の3恋愛詩集の語彙概観」,延味能都,岡山大学独仏文学研究,第15号,1996.
を参照されたい。以下に本データベースで使用したコード一覧をあげておく。
AF |
Substantif féminin. |
AFB |
Substantif féminin employé comme adjectif. |
AFE |
Substantif féminin employé comme pronom. |
AFJ |
Substantif féminin employé comme adverbe. |
AFK |
Substantif féminin employé comme nom propre. |
AFT |
Substantif féminin employé comme allégorie. |
AM |
Substantif masculin. |
AMB |
Substantif masculin employé comme adjectif. |
AME |
Substantif masculin employé comme pronom. |
AMF |
Substantif masculin employé comme forme verbale. |
AMJ |
Substantif masculin employé comme adverbe. |
AMK |
Substantif masculin employé comme nom propre. |
AX |
Substantif de genre hésitant. |
AXB |
Substantif de genre hésitant employé comme adjectif. |
BF |
Adjectif féminin. |
BFA |
Adjectif féminin employé comme substantif. |
BFJ |
Adjectif féminin employé comme adverbe ou élément de locution adverbiale. |
BFT |
Adjectif féminin employé dans une expression allégorique. |
BM |
Adjectif masculin. |
BMA |
Adjectif masculin employé comme substantif. |
BMH |
Adjectif masculin employé comme préposition ou élément de locution prépositive. |
BMI |
Adjectif masculin employé comme élément de locution conjonctive. |
BMJ |
Adjectif masculin employé comme adverbe ou élément de locution adverbiale. |
BK |
adj. dérivé du nom propre et qui ne se trouve pas dans Larousse |
BX |
Adjectif de genre commun (adj. en -e ou épicène ) qualifiant un subst. de genre hésitant. |
C |
Cardinal. |
CMA |
Cardinal employé comme substantif. |
DF |
Déterminant féminin. |
DM |
Déterminant masculin. |
DX |
Déterminant masculin ou féminin. |
E |
Pronom. |
EMA |
Pronom employé comme substantif. |
FA |
Verbe à l'infinitif. |
FAA |
Verbe à l'infinitif employé comme substantif. |
FB |
Verbe au participe présent. |
FBA |
Verbe au participe présent employé comme substantif. |
FBB |
Verbe au participe présent employé comme adjectif. |
FBH |
Verbe au participe présent employé comme préposition. |
FBI |
Verbe au participe présent employé comme élément de locution conjonctive. |
FBJ |
Verbe au participe présent employé comme adverbe. |
FC1 |
Verbe à l'indicatif parfait, 1e personne. |
FC2 |
Verbe à l'indicatif parfait, 2e personne. |
FC3 |
Verbe à l'indicatif parfait, 3e personne. |
FC4 |
Verbe à l'indicatif parfait, 4e personne. |
FC5 |
Verbe à l'indicatif parfait, 5e personne. |
FC6 |
Verbe à l'indicatif parfait, 6e personne. |
FD1 |
Verbe à l'indicatif présent 1e personne. |
FD2 |
Verbe à l'indicatif présent 2e personne. |
FD3 |
Verbe à l'indicatif présent 3e personne. |
FD4 |
Verbe à l'indicatif présent 4e personne. |
FD5 |
Verbe à l'indicatif présent 5e personne. |
FD6 |
Verbe à l'indicatif présent 6e personne. |
FE1 |
Verbe au subjonctif présent 1e personne. |
FE2 |
Verbe au subjonctif présent 2e personne. |
FE3 |
Verbe au subjonctif présent 3e personne. |
FE4 |
Verbe au subjonctif présent 4e personne. |
FE5 |
Verbe au subjonctif présent 5e personne. |
FE6 |
Verbe au subjonctif présent 6e personne. |
FF2 |
Verbe à l'impératif présent 2e personne. |
FF4 |
Verbe à l'impératif présent 4e personne. |
FF5 |
Verbe à l'impératif présent 5e personne. |
FG1 |
Verbe à l'indicatif imparfait 1e personne. |
FG2 |
Verbe à l'indicatif imparfait 2e personne. |
FG3 |
Verbe à l'indicatif imparfait 3e personne. |
FG4 |
Verbe à l'indicatif imparfait 4e personne. |
FG5 |
Verbe à l'indicatif imparfait 5e personne. |
FG6 |
Verbe à l'indicatif imparfait 6e personne. |
FH1 |
Verbe à l'indicatif futur 1e personne. |
FH2 |
Verbe à l'indicatif futur 2e personne. |
FH3 |
Verbe à l'indicatif futur 3e personne. |
FH4 |
Verbe à l'indicatif futur 4e personne. |
FH5 |
Verbe à l'indicatif futur 5e personne. |
FH6 |
Verbe à l'indicatif futur 6e personne. |
FI1 |
Verbe au conditionnel présent 1e personne. |
FI2 |
Verbe au conditionnel présent 2e personne. |
FI3 |
Verbe au conditionnel présent 3e personne. |
FI4 |
Verbe au conditionnel présent 4e personne. |
FI5 |
Verbe au conditionnel présent 5e personne. |
FI6 |
Verbe au conditionnel présent 6e personne. |
FK1 |
Verbe au subjonctif imparfait 1e personne. |
FK2 |
Verbe au subjonctif imparfait 2e personne. |
FK3 |
Verbe au subjonctif imparfait 3e personne. |
FK4 |
Verbe au subjonctif imparfait 4e personne. |
FK5 |
Verbe au subjonctif imparfait 5e personne. |
FK6 |
Verbe au subjonctif imparfait 6e personne. |
FQ |
Verbe au participe passé. utilisé comme un attribut, être+pp.=toujours FQ |
FQA |
Verbe au participe passé employé comme substantif. |
FQB |
Verbe au participe passé employé comme adjectif. utilisé comme une épithète et l'adj. n'existe pas. quand l'adj. existe, ce sera classé comme BF,BM, ou BX |
FQH |
Verbe au participe passé employé comme préposition. |
FQI |
Verbe au participe passé employé comme élément de locution conjonctive. |
FQJ |
Verbe au participe passé employé comme adverbe. |
GM |
Article contracté masculin. |
GX |
Article contracté masculin ou féminin. |
H |
Préposition. |
I |
Conjonction. |
J |
Adverbe. |
JMA |
Adverbe employé comme substantif. |
JMB |
Adverbe employé comme adjectif. |
JME |
Adverbe employé comme pronom. |
K |
Nom propre. cf. BK |
L |
Interjection. |
LMA |
Interjection employé comme substantif. |
M |
Mot contracté autre qu'article contracté. |
NMA |
Adjectif / déterminant employé comme substantif masculin. |
NX |
Adjectif / déterminant masculin ou féminin. |
PF |
Adjectif / pronom féminin. |
PFJ |
Adjectif / pronom féminin employé comme adverbe. |
PM |
Adjectif / pronom masculin. |
PMA |
Adjectif / pronom masculin employé comme substantif. |
PMH |
Adjectif / pronom masculin employé comme élément de locution prépositive. |
PMJ |
Adjectif / pronom masculin employé comme adverbe. |
PX |
Adjectif / pronom masculin ou féminin. |
QF |
Déterminant / pronom féminin. |
QM |
Déterminant / pronom masculin. |
QX |
Déterminant / pronom masculin ou féminin. |
R |
Adverbe / préposition. |
RFA |
Adverbe / préposition employé comme substantif féminin. |
RMA |
Adverbe / préposition employé comme substantif masculin. |
S |
Adverbe / conjonction. |
SMA |
Adverbe / conjonction comme substantif. |
V |
Mot non identifiable ou aberrant dans le contexte. |
W |
Contraction non grammaticalisée. |
Y |
Mot en langue étrangère. |
Z |
Mot grammatical très fréquent et porteur d'ambiguïtés multiples(classes et lemmes). |
2-6. 過去分詞と形容詞
過去分詞から生まれた形容詞が存在しているため,形容詞と過去分詞の区別が困難な場合が少なからず存在する。一般に複合時制で過去分詞が現れた場合,その動詞が他動詞であり,直接目的格補語をとっている場合にはこれは動詞の過去分詞として差し支えないだろう。しかし,同じ複合時制の場合でも助動詞としてêtreをとる自動詞の場合などは過去分詞とするべきか否か判然としない場合がある。さらには目的語が前に出ていなくとも過去分詞が目的語に一致している場合など,現代ほど文法規則の厳密な運用が行われていない16世紀の文章では多くの問題が生じる。我々はごく機械的な方式を採用している。したがって,過去分詞,過去分詞から生じた形容詞に関しては曖昧が部分が残っており,検索時には留意する必要がある。
・助動詞がavoirである |
変化無し(男性単数) |
→ |
→ |
FQ |
|
男性単数以外の形だが先行詞(直接目的格補語)に一致 |
→ |
→ |
FQ |
・助動詞が être である |
代名動詞である |
→ |
→ |
FQ |
|
補語を取っている |
→ |
→ |
FQ |
|
補語を取っていない |
adj.としての記載が辞書にある |
→ |
BM, BF |
|
|
adj.としての記載も辞書に無いか著しく意味が異なる |
男性単数 |
FQ |
|
|
|
男性単数以外 |
FQB |
・動詞が無い(=épithète) |
adj.としての記載が辞書にある |
→ |
→ |
BM, BF |
|
adj.としての記載が辞書に無いか著しく意味が異なる |
→ |
男性単数 |
FQ |
|
|
|
男性単数以外 |
FQB |
注:Larousseでは、形容詞は一般に後ろに前置詞を伴って補語を取らない形を載せている。ただし例外はある(mêléなど)。
2-7. 現在分詞と形容詞
形容詞と現在分詞の区別についても過去分詞の場合と同様に区別が困難な場合が少なからず存在する。本データベースでは機械的に以下のように区分している。現在分詞の関わる検索に関しては留意されたい。
・直接目的語または間接目的語をとっている |
性数変化していない |
FB |
|
性数変化している |
FB |
・目的語をとっていない(自動詞の現在分詞) |
形容詞としての記載が辞書に無い |
FB |
|
形容詞としての記載が辞書にある |
BM,BF |
・形容詞とすると意味が通じない |
|
FB |
2-8. 固有名詞と形容詞
固有名詞および固有名詞と関連した形容詞に関しては特に辞書を定めていない。Larousseでは一般に固有名詞や固有名詞に関連する形容詞に関してはごく一般的なものは採用されているが,ロンサールの作品中に現れる固有名詞やその形容詞の多くに関しては記載がない。固有名詞とその形容詞の記載されているHachette
の Petit Robert 2 などではかなりを見いだすことができるが,全てが記載されているわけではない。特に16世紀と現代で地名などの呼称とその形容詞が異なっている場合,現在では当時の地名が消滅している場合,同じ場所を示すにもかかわらず16世紀には別の呼び方をしていた場合など,現代の辞書を参照して一つに定めることができない場合がある。また,異なる綴りとなっているものも多い。現段階では統一できるものは一つにまとめているが,あえてそのまま残してあるものもあるので検索に際しては留意されたい。
3.検索・表示スクリプト解説
3-1. スクリプト1:テキストの表示
収録した恋愛5詩集およびオード集のテキストを表示する。
テキストは表形式で表示され,この状態で検索を行うことも可能である。データへのen-tête, いわゆるheader情報の付加はデータベースにとって重要な意味を持つ。しかし一方ではデータ量を増やしてしまうため,本データベースでは参照情報として最小限の情報におさえた。しかしそれでも参照情報からはLaumonier版での掲載場所を特定できるようになっている。表示されたテキストには行単位で参照情報が付加されており,収録されている詩集とLaumonier版での収録ページ数が判るようになっている。
詩集名は略号で記載されている。略号に対応する作品名は以下のとおりである。
Am-52:Les Amours (1552)
Cn-55:70 sonnets de la
Continuation des Amours (1555)
Nc-56:Nouvelle
Continuation des Amours (1556)
H1-78:Sonnets pour Hélène
Ier livre (1578)
H2-78:Sonnets pour Hélène
2e livre (1578)
AM60-60:Pièces ajoutées en
1560 a la section des Amours
Liv1-50:Ier livre des Odes
(1550)
Liv2-50:2e livre des Odes (1550)
Liv3-50:3e livre des Odes (1550)
Liv4-50:4e livre des Odes (1550)
Liv5-52:5e livre des Odes (1552)
3-2. スクリプト2:語彙検索
検索画面は,検索する語を選択する検索窓と対象詩集を選択するボタン群から成る。検索語選択窓から一語を選択すると選択された語が,クリックボタン右側のテキストエリアに挿入される。クリックボタンを押すことにより,スクリプトは選択された語の検索を開始する。
スクリプトは検索結果として,結果ウィンドウを表示し,コンコルダンス,選択された語と共出現する語のリストの2つを与える。コンコルダンスは前後の詩句を含むKWIC(Key Word In the Center)形式で与えられ,キーとなる検索語は赤色で表示される。共出現語はコンコルダンスの下に,右に共出現回数を伴った形で表示される。
結果ウィンドウにはさらに選択窓が出,そこでは共出現する語を今度は複数個(最大11語まで)選んで,出現状態をグラフィック表示で確認することができる。
選択窓内に現れる語は最初に検索を行った語の共出現語である。左に表示されている番号はその語の共出現回数を表している。最初の検索語と同じ回数の共出現回数を持つ語は,最初の検索語が出現すれば必ず出現することを意味することになる。
複数の語を選択する場合には2つのやり方がある。連続して表示されている語をひとまとまりで選択する場合にはShiftキーを押下しながらマウスでクリックすることによって連続したブロックが選択される。もう一つの場合は一つの語を選択した後,いくつかの語を挟んで別の一つの語のみを選択する場合である。この場合にはCtrlキーを押下しながらマウスクリックによる選択操作を行う。選択された語は選択窓の下の選択語エリア内に,検索用の形に変換され,記号によって連結された形で現れる。通常はこのエリア内の検索用コードを編集する必要はない。
グラフィック表示は出現場所のレフェランスを付けるか否かを選択できる。さらに下にある対象詩集の選択を行い,レフェランスボタンをクリックすることによって,グラフィック表示の作業を開始する。レフェランスを付けない場合の方が1画面での表示数が多いが,一般的にはレフェランスを付した方を利用するよう推奨する。表示に要する時間はほぼ同じである。
グラフィック表示は以下のように現れる。ここの例では4語を選んでおり,それぞれに別の色が割り振られる。レフェランス付きの表示の場合には左に参照情報が表示され,その右に実際の詩句に存在する語と対応した四角形がグレーで表示される。対象とした語が現れた場合には,最初に割り振られたものと同じ色の四角形で表示され,大きな範囲での感覚的な把握ができるようになっている。
3-3. スクリプト3:分類検索
上述した分類表にしたがって,分類項目で検索を行うスクリプトである。
複数選択を行うことができる。たとえば直説法現在の1人称から3人称複数までの合計6人称を選べば,それぞれの人称に異なる色が振られ,各項目の出現状況がグラフィック表示される。直説法現在と直説法現在1人称といった重なる分類項目を選択した場合にはリストで後になっている方が有効となるので注意が必要である。
複合時制に関しては助動詞avoir, être の時制と過去分詞を組み合わせることにより検索が可能である。たとえば複合過去の場合には,直説法現在形と過去分詞を組み合わせて指定することにより検索が可能になる。
3-4. スクリプト4:語彙分布
語彙分布のグラフィック表示のみに特化したスクリプトである。複数語彙選択が可能である。スクリプト1ではコンコルダンスの表示と共出現語の表示を行うことが主眼であり,必ずしもグラフィック表現を行う必要はない。いわば選択オプションであったわけだが,逆に言えば,コンコルダンスと共出現語の操作を行わないとグラフィック表現を表示させることが出来ない。スクリプト4はスクリプト1で後方に回っていたグラフィック表示を前面に出したものである。
語の選択は複数が可能である。連続したブロックを選択する場合にはShiftキーを押下しながらマウスクリックして選択を行う。とびとびで複数の語を選択する場合にはCtrlキーを押下しながらマウスクリックで選択を行う。選択された語は右の細長い表示エリアに検索用のコードに変換されて表示される。後は対象とする詩集をボタンによって選び,レフェランス無しのグラフィック表示かレフェランス付グラフィック表示かをクリックすれば作業に入る。どちらも必要とする時間は変わらないので,通常はレフェランス付きグラフィック表示を選択するよう推奨する。
2003年2月
[1] 本稿は平成13年度文部省科学研究費,基盤研究(C)(2) ,課題番号:13610608,課題:ロンサールの語彙構造として助成を受けた研究成果の一部である。
[3] http://www.loria.fr/projets/Silfide/informations/Docs/Rapport-98/HTML/rapport-98TDM.html . Trésor de la langue Française, t.1, XLIX. 「フランス語の語彙研究データベース」,大橋保夫。
[4] Frantexteは有料のデータベースであり,登録を行わない限りデータベース本体を利用することは出来ない。ただし,データベースにどのようなテキストが収録されてるかは登録前に調べることができる。http://atilf.inalf.fr/Dendien/scripts/generic/showps.exe?p=main.txt;host=interface_nvlb.txt
[5] A word-index to the petic works of Ronsard, LEEDS, W.S. Maney and son LTD, 1972.
[6] http://www.bibliopolis.fr/html/html_portail/home.htm
[7] http://gallica.bnf.fr/Classique/
[10]岡山大学文学部紀要,第14号,p.57-93.
[11] 現在ではWindows 上で作動するInternet Explorer 6.0以降のみに対応している。複数のシステムで試してみたところ,マッキントッシュではどのブラウザを使用しても不具合が出ることが多いことが判っている。