[CHISE Project] [京都大学21世紀COE 「東アジア世界の人文情報学研究教育拠点」] [FSIJ]
2003 年に開催された CHISE Symposium 2003, 書体・組版ワークショップ に引続き、CHISE Project および多言語処理に関するイベントを開催します。
また、今回は発表形式のイベントに加え、CodeFest 京都 2005 も併催します。
「CodeFest」とは、普段はインターネット上でのやり取りのみで Face-To-Face では話し合う機会がないあまりないハッカー達が一ヶ所に集い、 自由にコード(ソフトウェアのソースコード)を持ち寄って頭を突き合わせて議論し 開発を進めるイベントです。
今回の CodeFest 京都 2005 は、日本で2番目、関西では初めて開催される CodeFest となります。
CHISE Conference, CodeFest 京都 ともども皆様の御参加をお待ちしてます。
文字列どうしがどの程度異なっているかを数値化する レーベンシュタイン距離(編集距離)を使った比較は、 ワープロなどのスペルチェック機能や、 最近では バイオインフォマティクスにおける 塩基列の比較などに応用されたことで注目されている。 漢字文化圏の古典学においても、 写本間の「距離」を見いだす有効な方法として、 近年、応用研究が進んでいる。 本発表では、Chaon モデルに基づく文字オブジェクトの列どうしの 「距離」 を計算する方法として、 木の編集距離を 文字オブジェクトの比較に応用することを提案する。
KAGE システムは、筆画や部品を組み合わせて 自由に漢字字形をデザインし、 ビットマップ画像データやベクトル画像データに 出力することが可能である。特に KAGE グリフエディタや Fontforge との組み合わせによって、 外字フォントや自作フォントを容易に作成することが可能となった。 発表ではデモンストレーションを交えて現在の KAGE システムの概要を紹介する。
また、従来 KAGE エンジンでは独自に漢字構造データベースを持っていたが、 より多くのデータを収録する CHISE 文字データベースへの統合を予定している。 この試みについての紹介も行う。
インターネット上の情報や、電子メール、 業務文書、文学作品など、 日々蓄積されていく膨大な情報の中から 目的の情報を探し出すために、 全文検索システムは広く用いられている。 全文検索システム Rast では全文検索を行う部分をライブラリとして実装する事で、 アプリケーションに登録や検索、削除などといった操作を アプリケーションから容易に呼び出して使うことができる。 また、Rast の文書登録機能では 文書ファイルからのテキスト抽出機能が実装されており、 多様なファイル形式からの文書登録を行う事ができる。 その他にも Rast では XML-RPC 経由での検索や 検索データベースを複数に分割して対応する 多階層メタ検索機能がある。 Rast のソースパッケージにはこれらの機能の実用例として Web 検索 CGI や検索ベースの電子メールソフトなどが含まれている。 本発表では Rast のライブラリ部分が持つ機能やこれらのソフトウェアの紹介を行う。
下記申込書に記入の上、 chise2005-office@kanji.zinbun.kyoto-u.ac.jp へメールでお送りください。
---------------------------------------------------------------------- CHISE Conference 2005, CodeFest 京都 2005 参加申込書 ;; 参加するものの行だけを残し、参加しないものの行を消してください。 ○ CHISE Conference 2005 ― 10/13 (木) ○ CHISE Conference 2005 ― 10/14 (金) ○ CodeFest 京都 2005 への参加を申込みます。 住所: 御社名: 部署名: 御芳名: 電子メール: 予定しているハック(CodeFest 京都 2005 参加希望の方のみ): ----------------------------------------------------------------------