<http://www.chass.utoronto.ca/~cpercy/courses/6362-lee.htm>
・prescriptive には、that は限定用法のみ、which は非限定用法のみ。
・現在の日常の用法では、カンマやポーズがあれば非限定、prescriptive の傾向も残る
(3) I want her to give me back the book that I loaned her a year ago.
(4) Kumar will never return his gold medal, which he believes he won fairly.
「知ってる?」
に対するもっとも適切な応答が
「知ってる」
もしくは
「知らない」
という非対称なペアであること、あるいはもっと端的には、
「知っていない」という表現がほとんど非文法的であることが近年問題になっているわけですが、
簡単に内省による分析をしてみると、
・「知る」は情報の摂取が起こるという”変化”に対応している
・「知っている」は情報を持っているという”変化した結果状態”に対応している
・「知らない」は情報を持っていないという”変化しなかった状態”に対応している
・「知っていない」は???
ということが起きているようです。
似たような、しかしもっと普通の規則に従う動詞である「消える」の場合は次のようになります。
・「消える」は”変化”に対応している
・「消えている」は”変化した結果状態”に対応している
・「消えない」は”変化が起きない(変化前状態が繰り返される)”に対応している
・「消えていない」は”変化しなかった結果状態”に対応している
すでに観察されている通り、「ない」の有無での対称性が崩れているという問題と同時に、
・「知る」に関して”変化が起きない”を端的に表す形式がない
(それを表すには、ふつう、「知ることがない」等の形式を用いる)
という問題(?)が起きていることが分かります。
以上のような、「知る」に関する例外性を説明する説として、
大きくわけて2通りの説が提案されています。
0. 単なる不規則変化
英語等の屈折語になじみのある人の多くは、このように解釈するようです。
つまり、「知っている」の否定は(なぜか|歴史的混乱があって)「知らない」になり、
これはたまたま「知る」の否定と同じ形をしている、というような解釈です。
しかし、動詞の活用に関して規則性が崩れる、という現象は、
日本語のような膠着語ではかなり受け入れがたく、またこの現象以外にないのではないかと思います。
ですので、ここではこの解釈は不可能、としておきます。
1. 「知る」という単語(に対応する事象)の内在的性質に起因する
1.1. 「知っている?」と聞かれた時点で知るから
http://cellistmiya.typepad.jp/blog/2006/07/__3533.html
「xxを知っている?」と質問された人は、質問されたという事実により、そのことに関する知識を得てしまった、ということになる。そのため、常識を持った大人であれば、質問を受けた途端、そのことについて「知っていない」とはパラドクスになり、そうは言えなくなってしまうのではないか。
「(もしいま訊かれなかったら)知らない(でいただろう)」という感じの解釈。
「(私の声が)聞こえてるー?」「聞こえてない」
という対話に対して「いや聞こえてるんじゃん」というツッコミができることと、
似たような状況が起こっているという解釈です。
1.2. 変化が常に完全な形で起こるから
「消えていない」に類する変化動詞のテイル化形式の意味の構造を内省によって分析してみると、
「(何かが)消えそうな事象が起きたが、それは成し遂げられなかった。そして今に至る」
というようなシナリオが典型的だと思われますが、「知っていない」の場合は、
「(私が)(何かを)知りそうな事象が起きたが、それは成し遂げられなかった。そして今に至る」
のなかでの、”知りそうな”という部分があり得ないように思われます。
なぜかというと、”(私が)知りそうな”という中途半端な状態は存在しにくいからです。
(通常、”知りそうな”状態になった時点で”知った”ことになる)
これが”私が”でなく”彼が”の場合は、(知るという事象を客観視できるので)
「知っていない」の許容度がかなりあがると思うのですがどうでしょうか?
知覚に関する変化+状態動詞である、
「見える」「聞こえる」等も似たような意味の構造を持っていると思われます。
「見えてる?」「見えない」
「聞こえてる?」「聞こえない」
ただし、「見える」「聞こえる」は変化と状態の双方に用いることができる(上記からテイルを除去してもあまり意味が変わらない)ので、完全に同種とはいえません。
2. 「知る」という単語に関して起こった歴史的変化に起因する
まともな資料分析はしてないですが、
身の程を知る
親の心子知らず
などのように、そもそも「知る」が(「いる」のような)状態動詞であるように見える文例があり、
しかも古い感じです。
(Wed Dec 12 03:17:53 2007) 追記:「知らず」は現代語と共通の用法のようにも思えるので不適当でした。
そこで、
・「知る」は過去状態を示す(こともできる?)動詞だったが、いまは変化動詞。ただし一部に状態動詞の用法が残っている
という仮説を立てることができます。
現代でも
「知ってる?」「(俺が)知るかよ!」
「知ってる?」「(俺が)知るわけない」
という文においては、
「知る」の部分の意味に状態が含まれていると思われます。
いっぽう
「消えてる?」「消えるかよ」
では「消える」の部分は変化を示しています。
(この対比はあまり合意がとれないかもしれません……)
<http://en.wiktionary.org/wiki/Category:Russian_language>
語学(と研究?)用に、発音記号付きの、機械可読の、
オープンな、ロシア語(さらに、できれば多言語)の電子辞書リソースを探していたのですが、
思いがけず Wiktionary が使えそうなレベルに達していることを知った。
全体をダウンロードすることも可能
Database dump
エントリ数が数千を超える言語がけっこうあり、
語学目的ならあればそれなりに使える。
IPAなどの統一された発音記号が付くことになっているのがいい。
表音文字であっても(英語のように)発音が不規則になる言語も多いので、
発音記号があるとないとでは、初学者にとって大きく違う。
ウェブ上の辞書では、意外に発音記号がついていないことが多い。
一方紙の辞書は発音・語釈ともに充実しているけれど、機械可読ではない。
オフラインの電子辞書は、(原理的には)機械可読で内容も充実していてよいのだけれど、
ライセンスが……とか、暗号化が……とかで気軽には使えない。
ただし、Wiktionary は量、質ともにまだまだで、
一番多い英語で説明されたエントリの数(要するに X言語→英語辞書のエントリ数)が30万を越えたところだし、IPA表記が欠けていたり、日本語のように発音が規則的な固有発音記号があればそれを使っていたりする。
あるいは「可みたい」と「噛みたい」
この種類の対立は、トピックモデルで解消すべきことのような気がする。
この種の同音異義表現は、仮名漢字変換において盲点になっているのでは、と思った。
人間にとって同音異義語であることが意識されやすい同音異義語の多くは、品詞が一致している。
たとえば「気候」と「機構」。
仮名漢字変換は、品詞連接頻度を有力な手がかりとする場合が多いので、
品詞が一致する同音異義語を間違えやすい。
たとえば「ここのきこうはよくない」を正しく変換することができない。
それは人間でも同じで、単独の文ではどちらか分からない。
人間の場合は、前の文(発話)を参照することで、だいたい解決できているのだと思う。
そこで本当は仮名漢字変換でもトピックモデルが必要なのだと思うけれど、
実はそうとも限らない。
品詞が一致しているので、間違う箇所が狭く限定されていて、
間違いをあとから訂正するのが簡単だから。
どれが好まれる文字列かを、学習させるのも簡単。
間違う箇所が狭いからユーザが気づきにくいともいえるけど。
品詞が一致しない同音異義語は、まさに品詞連接頻度で解決できる。
「うみたがらない」を「海他画羅内」にしないということ。
未知語が絡むときくらいしか間違えないと思う。
間違える場合は、単語のレベルを越えて間違うので、ユーザは気づきやすい。
でも直すのに手間がかかる。
表題の同音異義語は、品詞が一致しない方に含まれるわけだけれども、
品詞が一致する方にかなり近いと思う。
これ全体が「用言」のような大雑把な品詞に分類されていて、
だからユーザは気づきにくい。
けれど単語レベルではないので、直すのに手間がかかる。
今回のリニューアルで初心者ユーザーを一気に虜みたい考えだ。
http://www.itmedia.co.jp/news/articles/0608/09/news083.html
<http://nlp.iit.tsukuba.ac.jp/must/>
Matsuyoshi-Utsuro-Satoh-TsuchiyaでMUST
複合辞の表層表現のリストと、
その正例・負例へのポインタ(毎日新聞記事)リストとして提供されている。
<subentry id="A01-1000" name="といって[といって],と言って[といって]" freq="2828" total="28
60">
<example id="A01-1000-001" source="MNP-950101008-17" target="28-32" label="C"/>
<example id="A01-1000-002" source="MNP-950108168-36" target="34-38" label="C"/>
<example id="A01-1000-003" source="MNP-950116142-11" target="50-54" label="C"/>
<example id="A01-1000-004" source="MNP-950125251-25" target="32-36" label="C"/>
<example id="A01-1000-005" source="MNP-950201313-2" target="33-37" label="C"/>
<example id="A01-1000-006" source="MNP-950209310-3" target="2-6" label="B" note="と いっ ていい(B30-2000)"/>
...
<http://www.aozora.gr.jp/cards/000061/files/377_2754.html>
イ(甲)、イ(乙)の原典。
むかしの日本語には母音が七つあったという話。
Like Flickr, but without the photos.
ソーシャル辞書というか、単語リストの collabolative filteringというか。
好きな単語を投稿していき、コメントを付けていく。
(Thu May 3 17:32:43 2007)
http://labs.cybozu.co.jp/blog/akky/archives/2006/12/wordie.html
タグ「だけ」でコミュニティを作ったり、他人とつながったりできるサービス、ということらしい
腑に落ちた。
wordie はタグだけあってコンテントがないという、
革新的すぎるソーシャルタギング。
画像やウェブページのソーシャルタギングからwordieにリンクすると、
wordieはタグとタグの関係を定義するオントロジーみたいなものとして機能する。
コンパクトな日本語文法の本。
学校文法から現在の文法研究に何歩か踏み出したところ
というはしがきの言葉のとおり、学校文法が扱わない細かい現象をそれなりに網羅している。
文例も豊富。
参考文献へのポインタがもう少し細かく用意されているとありがたい。
「ている」の特徴は、未完了と完了の両方の解釈があるという点。
つまり、
未完了で進行中(「いま終わっているところなので、少し待ってください」、のように)と、
完了していて結果を述べている(「そのときにはもう終わっているから、大丈夫だ」のように)。
それぞれの解釈の選ばれやすさは、動詞や文脈によって変わる。
<http://www.toyama-cmt.ac.jp/~kanagawa/language/communicate.html>
もっと良く話すための方法を多角的に論じている。
三森ゆりかの言語技術をベースにした、応用編という感じ。
読んだけど後で読む。
ああ、意味が分からないですね。
流し読みしたけど、もう一回読んでちゃんと理解したいということ。
<http://www.gutenberg.org/catalog/world/search>
Project Gutenberg が全文検索可能になっていた件について
たとえば Chrismas carol のあのことばも一発で
いつからあった?
全部落とす方法
<http://www.behindthename.com/links.php>
「人名の語源」資料サイトの集積
<http://www.geocities.jp/niwasaburoo/>
日本語教育のための現代日本語の文法
統語論的な日本語文法からすると、
意味論が混ざりすぎているけれど、
いつ意味的情報が必要になるがよく分かる。
<http://www.formatdata.com/recipeml/examples.html>
自然言語のレシピにアノテーションするアプローチ。
<recipeml version="0.5">
<recipe>
<head>
<title>The Needless-Markman Hoax Chocolate-Chip Cookie</title>
</head>
<ingredients>
<ing>
<amt><qty>2</qty><unit>cups</unit></amt>
<item>butter</item>
</ing>
<ing>
<amt><qty>4</qty><unit>cups</unit></amt>
<item>flour</item>
</ing>
</ingredients>
<directions>
<step>Measure oatmeal and blend in a blender to a fine
powder</step>
<step>Cream the butter and both sugars</step>
<step>Add eggs and vanilla; mix together with
flour, oatmeal, salt, baking powder, and soda</step>
<step>Add chocolate chips, Hershey Bar and nuts</step>
<step>Roll into balls and place two inches apart
on a cookie sheet</step>
<step>Bake for 10 minutes at 375 degrees</step>
</directions>
</recipe>
</recipeml>
directions の意味表現を記述するとかいう話が出たり。
The International Corpus of English Homepage 無料 メールを送ってパスワードをもらう
UCL/CECL Centre for English Corpus Linguistics ICLE Corpus 学習者コーパス プロジェクトへの協力が必要
Learner Corpus Data 自由に使えるけど、量が少ない
<http://www.linguistics.ucla.edu/faciliti/research/skim_diss.pdf>