■お知らせ■
個人的なお知らせ
黒田は2010年度後期以降の再就職先を探しています (公募やら推薦やらで幾つかの職場に応募しましたが,ダメでした).研究ができる環境であれば,私は,北は北海道から南は沖縄まで全国のどこにでも行きます.私が役に立てそうな仕事がありましたら,声をかけて下さい (私は独身なので,自分の都合で移動できます).

FOCAL関係のお知らせ

はじめに

私は 言語のフレーム指向概念分析 Frame-Oriented Concept Analysis of Language (FOCAL) という枠組みに基づく研究グループ FOCAL Research Group (FRG) を取りまとめています.FRG の研究成果は 学会報告その他 をご覧ください.(注意: FRG は現在,情報通信研究機構 (NICT) とは直接の関係はありません.FRG の構成員はボランティア参加です.従って,お給料は,当然出ていません).NICT の意味役割タグつきコーパスの開発と FOCAL の活動は基本的に独立しています.意味役割タグつきコーパスの開発はお金がないとできませんが,その基礎を提供する FOCAL の基本方針は Open Development です.
肝心なのは次の点です:
    FOCAL研究グループは共同研究者 (言語学者,心理学者,認知科学者,工学者,etc.) を随時募集しています
理由は簡単です: 慢性的に研究員が不足しているんですね(笑)次から次へとオモシロイ研究課題が出てくるのはいいのですが,構成員はこの仕事で給料をもらっているわけではないし,なにより一日は24時間しかありません.というわけで,幾つかの興味深い研究テーマ(「襲う」の対訳部分に現われる英語表現の分析など)が手つかずのまま放置されているばかりでなく,それが増えてゆく一方なのです.もったいない.研究自体は楽しくていいのですけれど,実際のところ,体が幾つあっても足りません.
確かに,研究資金は大切です.それがなかったら,ある程度の規模の研究はできないことが多いです.ですが,資金に先立つのは人材です.お金だけあったって,それを有効に使える研究者が揃っていなかったら,単なるお金の無駄遣いです.お金を「捕って」から人材を集めるなんて,本末転倒,愚の骨頂です(日本の研究は,なぜか,そういうのが多いですけど).
FOCAL 研究グループに参加するための,特別な資格は必要ありませんし,作業上の義務,拘束は何もありません.特別な技能も必要とはされないでしょう(原則として言語データの分析,心理データの解析,プログラミングなどのうち,いちばん得意な分野をお願いすることになります).具体的な解析方法は,主要なメンバーが指導します.気楽に考えて下さい.
ただ,二つだけ参加条件があります: 第一は FOCAL 宣言,並びに FOCAL/PDS 入門: フレーム指向概念分析/並列分散意味論の具体的な紹介 にある趣旨や手法を理解し,それに賛同してくださっていること.第二にやる気があること,です.研究内容はオモシロイのですが,それだけでなく,実際のところ,それなりに大変です.興味本位で構わないのですが,根気のない方には向いていません(手抜きの仕事をなさる方は,研究の質を維持するために,重要な仕事はお任せできません).この点を理解して頂き,なおかつ興味のある方は,私まで連絡を下さい.
なお,念のために断っておきますが,FRG の活動は(少なくとも今のところ)ボランティア活動です.給料は出ません.この点に関しては誤解なきよう,お願いします.将来的には情報通信研究所から資金が出る可能性もありますが,アテにはしないで下さい.

現状

  • 近況 (2010/07/28)
    私は2010年度も非常勤でNICTに勤務しています.不本意ですが,次の職場が決まらないので,仕方ないです.ただ,家庭の事情で近々退職する予定です.NICTに特に未練はないです.
  • これまでの FOCAL Hiki サイトの分離のお知らせ (09/27/2006):
    この度,内山将夫さん (NICT) のご好意で以前から設置していた FOCAL Hiki サイトを,データの性質から二つに分け,次の二つのサイトを並行して立ち上げる運びになりました:

    1. FOCAL Hiki 1
      日英対訳文対応づけデータ から選んだ文章への MSFA を用いた意味役割タグづけの事例集で,利用のためのアカウントは不用です.

    2. FOCAL Hiki 2
      『京大コーパス』の一部のデータ (三記事文) への MSFA を用いた意味役割タグづけデータ (Round1, Round2, Round3) で,利用のためのアカウントが必要です.お問い合わせは私の方までお願いします.

    二つに分離したのは,扱われているデータの性質が異なるためです.FOCAL Hiki 2の原データは著作権で保護されていますが,FOCAL Hiki 1の原データは著作権フリーです.今後は特に著作権フリーの前者の内容をどんどん充実させて行きたいと考えています. FOCAL Hiki 1で公開されているデータに関して,現状では
    1. 常識の範囲内での,第三者の閲覧,データの利用は自由です.データに著作権がある場合,それは原著者に帰属します.データ加工に著作権は要求しませんが,それに対する credit は要求します.

    配布の形態は (i) Webでの公開と (ii) 直接配布の二種類があります.Web公開に関しては,
    1. サイトの運営に関して,部外者からの提案,あるいは希望も受けつけています.ただ,今のところ管理者の私以外の人物が 新しい分析を投稿,既存の分析を修正することはできません.これは品質管理のための措置です.提案に関しては,誰のものであるかに係わらず,私が見て問題なしと判断すれば,積極的に掲載して行きます.分析は見本を参考にして Excel のシートで行なって,それを送って貰えれば構いません(作成者のIDは希望により公開します)
    2. もちろん,閲覧のみでも積極的に活用して頂けると幸いです.
    3. 新しい分析の要求も受け付けていますが,すぐに対応できるとは限らないので,その点はご了承下さい.

  • 私個人の希望としては,例えば 英辞郎 on the Web みたいな共同開発の共有言語資源になったら,言うことないと思っています.

  • 「意味役割タグつきコーパスの評価版の公開」 (NLP11: A5-3) で予告していた意味役割タグづけ評価版に関するお知らせ:
    自然言語処理学会第11回 (NLP11) で予告した通り,意味役割タグづけ評価版を FOCAL Wiki 2 公開しました.ただ,京大コーパスの文にタグづけを行なっているため,公開すでに京大コーパスを利用している方(すなわち,毎日新聞から記事CD-ROMを購入している方)の場合,意味タグづけ情報をお渡しには特に問題はありませんが,京大コーパスの記事CD-ROMが手元にない場合,タグづけ情報だけを入手しても有益ではありません (CD-ROMを新規購入する場合,単価は10万円です).高々63文のために10万出してCD-ROMの購入をお願いするのは非現実的なので,NICTは63文に限って公開条件を無条件にできるよう,毎日新聞社と交渉しました.その結果,京大コーパスを保有しない方にも無償公開の権利を得ました.以下の条件への同意が公開の条件となります:

    1. 利用にあたって毎日新聞データの購入は前提にはなりませんが,簡単な同意書が必要になります (これは毎日新聞からの希望を受けたものです).利用を希望なさる方は私に連絡を取って下さい.

    2. データの配布と,そのデータを元にしたWeb閲覧を行います.Web閲覧では (i) フレーム関係 (Frame-to-Frame relations) の可視化, (ii) フレーム要素の実現値の参照, (iii) フレームとフレーム要素の一覧などの機能が利用できます.これらの利用にあたりアカウントとパスワードを必要とするセミクローズドの方式を採ります.これは毎日新聞の意向を反映したものであると同時に,サイトの保守を考えての処置です.将来的には Berkeley FrameNet と同様,タグづけの結果ではなく,それから得られたデータベースのみを公開する可能性はあります.

    3. FOCAL Hiki 2のWeb閲覧には利用アカウントが必要です (FOCAL Hiki 1はアカウント不用です).FOCAL Hiki 2のWeb閲覧のためのアカウントの発行は,(i) 利用に際して悪意がなく,(ii) 意味役割タグづけの枠組みの発展に積極的に貢献する意向のある方に対し,優先的に行いたいと思います.別の言い方をすれば,データ自体の公開はオープンですが,データから利用できる情報に,より多く,より簡単にアクセスしたいと希望される方には,より多くの協力への意志が求められます.私たち開発者と利用者の関係が互恵的なものであることを期待しております.この点はご理解下さい.


    UPDATE (08/28/2005): 重要なお知らせ

    お待たせしました.自然言語処理学会11回大会で予告しておきながら,諸々の事情により遅れに遅れておりました意味役割タグづけの評価版の第一次公開を09/01に予定しております.今回の公開は Round3 と呼ぶ,全部で9文からなる記事で,マラドーナの逮捕が話題になっているものです.なお,Round3 が何を意味するコードであるかは,私の論文 [PDF] をお読み下さい.
    今回の解析の対象となった記事の文の数はたったの9個ですが,解析の結果は相当に複雑なものです.特に複雑な文の一つには,何と60個近くのフレームが現われます.これを見て,おそらく相当数の方が「文の意味を表わすのに,こんなに複雑なことが必要なのか??」と驚かれると思いますが,これが意味解釈の実際だと私は思います.特に重要なことは,文の理解内容の記述の複雑さの上限を(近似的に)特定することです.これをしないで解釈の最適性を計算することは不可能です.
    多層意味フレーム分析が本当に解析された文の理解内容を特定するものであることは,いずれ心理実験を通じて示して行きたいと考えています.

    UPDATE 2 (06/16/2005): 公開が予定以上に遅れており,大変に申し訳なく思っています.おかげで最近,非常に胃が痛いです(苦) ただでさえ多血症でストレスは禁物なのに(苦)
    誤解を避けるために (私は言い訳はキライなのですが) 少し弁明します.公開が遅れているのは,技術的な困難が発生しているからではなく,仕事のための時間が (予期しない形で) なくなったためです.事情を説明しますと,私は元指導教官の紹介でこの春から京都の某芸術大学で英語の非常勤をする運びになりました.普通はこれは喜ばしいことなのですが,私に限って言うと,そうでもなかったのです... 現在,一昨年から続けて来た別の大学で担当している週に2コマの非常勤と合わせると,今は週に合計5コマ担当しているわけですが,これが思いの外負担になって,4月以来,自由に研究が進められない状態が続いているのです.まったく不本意ながら...で,ちょっとだけグチを (苦)

    英語の授業とかは,確かに手を抜こうと思えば幾らでもそうできるし,そうすることを勧めてくれる知人もいるのですが,私としてはそんなことはしたくありません.何から何まで教師の都合で決まっている授業は学生の益にならないし,学生の益にならない授業はする価値がありません.私は学生のタメになる授業がしたいので,ちゃんと準備します.ただ,学生が予想より多く,さらに英語の不得意な学生が予想より多い (さらに言うとデキる生徒とデキない生徒が規模の大きなクラスで一緒になっている) と,準備が大変です... 週末は完全にそのための準備に取られてしまいます (もちろん,これは学生が悪いわけではありません.大学のカリキュラムが不備なのです).こういう事情があって思うようにならないで困っているわけですが,今さら泣き言は言いたくないです.私は教えるのが好きだし,私に言わせれば,手抜きの講義は犯罪だからです.これは自分が大学生の頃からの信念ですから,それを曲げることは自分を否定することになります.
    私は英語の講義では,原則,次のようにして講義を進めています: 年度の始めに学生にアンケートを取り,どんな内容の文書を英語で読みたいかを聞きます.その調査結果にあわせて,主にインターネットなどから採集した自然な英語の文章を元に小試験を毎回自作して,それを授業の最後の30分で実施し,それを次回までに採点し,問題ごとの平均得点を出し,次の講義の前半で平均の低いもの重点的に解説するという授業を続けてきました.これは労力がかかって大変な分,学生にとっては満足度の高い授業になっていてるという自信があります.実際,毎回実施している授業内容の評価にある意見・感想欄で学生に授業の内容で感謝されたり,あまり英語に関心がなく,しかも日中はバイトをしていて疲れているため夜の授業では眠ってしまいがちな短大生相手の授業でもほとんどの学生は寝ないという快挙を生み出し,教える方も (完全とは言えませんが) それなりにヤリ甲斐の感じられる形式です.

    まあ,このような予定外の事情に加えて学会の準備,発表も連続的にこなさなければならない状態が続いて来て,時間が取れず,公開が遅れていましたが,06/016/2005の人工知能学会での発表を境に少し時間ができそうなので,この期に一気に仕上げてしまおうと考えています.Round3, Round2, Round1 の順に公開を予定しています (Round[i]が何を意味するかは第11回言語処理学会 (2005) での発表論文の 増補改訂版 をお読み下さい).
    何にせよ,最近は研究するのも好き,論文を書くのも好き,指導するのも好き,講義をするのも好き...だと身がもたないというのを実感しています(苦) 唯一救いなのは,本や論文を読むのは大して好きではない,ということでしょうか?(笑)

    UPDATE (5/15/2005) お待たせ致しました.先日,毎日新聞社より,試験的に意味役割タグづけをした3記事(63文)に限って無償公開してもよいという許可を頂きました.ただし,データの公開にあたっては利用者がNICTとのあいだで同意書を交わすことが条件です.これは毎日新聞側の誰にデータを公開したかを正確に把握したいという意向に答えるためです.ご理解下さい.

  • HOME