文字情報サービス環境 CHISE

Main Content

CHISE 漢字構造情報データベース


ISO/IEC 10646-1:2000 の IDS 形式に基づく漢字の構造情報データベースを開発中です。 現在、ISO/IEC 10646-1 の基本統合漢字 (Unicode 例示字形), 統合漢字拡張 A, ISO/IEC-10646-2 の統合漢字拡張 B の約7万字が入力済です。


構造情報データベースのサンプル

IDS-UCS-Basic.txt
CJK Unified Ideographs (U+4E00 〜 U+9FA5) of ISO/IEC 10646-1:2000
IDS-UCS-Ext-A.txt
CJK Unified Ideographs Extension A (U+3400 〜 U+4DB5, U+FA1F and U+FA23) of ISO/IEC 10646-1:2000
IDS-UCS-Compat.txt
CJK Compatibility Ideographs (U+F900 〜 U+FA2D, except U+FA1F and U+FA23) of ISO/IEC 10646-1:2000
IDS-UCS-Ext-B-1.txt
CJK Unified Ideographs Extension B [part 1] (U-00020000 〜 U-00021FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-2.txt
CJK Unified Ideographs Extension B [part 2] (U-00022000 〜 U-00023FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-3.txt
CJK Unified Ideographs Extension B [part 3] (U-00024000 〜 U-00025FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-4.txt
CJK Unified Ideographs Extension B [part 4] (U-00026000 〜 U-00027FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-5.txt
CJK Unified Ideographs Extension B [part 5] (U-00028000 〜 U-00029FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-6.txt
CJK Unified Ideographs Extension B [part 6] (U-0002A000 〜 U-0002A6D6) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-C.txt
CJK Unified Ideographs Extension C (U-0002A700 〜 U-0002B734) of ISO/IEC 10646:2012
IDS-UCS-Ext-D.txt
CJK Unified Ideographs Extension D (U-0002B740 〜 U-0002B81D) of ISO/IEC 10646:2012
IDS-UCS-Compat-Supplement.txt
CJK Compatibility Ideographs Supplement (U-0002F800 〜 U-0002FA1D) of ISO/IEC 10646-2:2001
IDS-JIS-X0208-1990.txt
JIS X 0208:1990
IDS-Daikanwa-01.txt
諸橋 大漢和辞典 第1巻
IDS-Daikanwa-02.txt
諸橋 大漢和辞典 第2巻
IDS-Daikanwa-03.txt
諸橋 大漢和辞典 第3巻
IDS-Daikanwa-04.txt
諸橋 大漢和辞典 第4巻
IDS-Daikanwa-05.txt
諸橋 大漢和辞典 第5巻
IDS-Daikanwa-06.txt
諸橋 大漢和辞典 第6巻
IDS-Daikanwa-07.txt
諸橋 大漢和辞典 第7巻
IDS-Daikanwa-08.txt
諸橋 大漢和辞典 第8巻
IDS-Daikanwa-09.txt
諸橋 大漢和辞典 第9巻
IDS-Daikanwa-10.txt
諸橋 大漢和辞典 第10巻
IDS-Daikanwa-11.txt
諸橋 大漢和辞典 第11巻
IDS-Daikanwa-12.txt
諸橋 大漢和辞典 第12巻
IDS-Daikanwa-dx.txt
諸橋 大漢和辞典 索引(補遺)
IDS-Daikanwa-ho.txt
諸橋 大漢和辞典 補巻
IDS-CBETA.txt
CBETA 外字

入手法

Git による入手

% git clone http://git.chise.org/git/chise/ids.git

WWW access

関連ツール

XEmacs CHISE

XEmacs CHISE を install している場合、上記パッケージを make install すれば、Emacs Lisp で書かれた検索ツールが利用可能です。

なお、Mac OS X(Lion 以降)をお使いの場合、「CHISEとLionと漢文コーパス」 が参考になるかも知れません。また、Snow Leopard の場合、「Mac OS X へのインストール(Finkの場合)」を参考にしてください。

Ruby/CHISE

Ruby/CHISE を用いれば漢字構造情報データベースを Ruby で操作することができます。

WWW


ruimoku rare characters image

東洋学文献類目における用例数の少ない文字リスト

東洋学文献類目のタイトルに出てくる文字の内、用例数の少ないものを集めてみました。

CHISE-wiki 文字検索