CHISE 漢字構造情報データベース
ISO/IEC 10646-1:2000 の IDS 形式に基づく漢字の構造情報データベースを開発中です。 現在、ISO/IEC 10646-1 の基本統合漢字 (Unicode 例示字形), 統合漢字拡張 A, ISO/IEC-10646-2 の統合漢字拡張 B の約7万字が入力済です。
- IDS-UCS-Basic.txt
- CJK Unified Ideographs (U+4E00 〜 U+9FA5) of ISO/IEC 10646-1:2000
- IDS-UCS-Ext-A.txt
- CJK Unified Ideographs Extension A (U+3400 〜 U+4DB5, U+FA1F and U+FA23) of ISO/IEC 10646-1:2000
- IDS-UCS-Compat.txt
- CJK Compatibility Ideographs (U+F900 〜 U+FA2D, except U+FA1F and U+FA23) of ISO/IEC 10646-1:2000
- IDS-UCS-Ext-B-1.txt
- CJK Unified Ideographs Extension B [part 1] (U-00020000 〜 U-00021FFF) of ISO/IEC 10646-2:2001
- IDS-UCS-Ext-B-2.txt
- CJK Unified Ideographs Extension B [part 2] (U-00022000 〜 U-00023FFF) of ISO/IEC 10646-2:2001
- IDS-UCS-Ext-B-3.txt
- CJK Unified Ideographs Extension B [part 3] (U-00024000 〜 U-00025FFF) of ISO/IEC 10646-2:2001
- IDS-UCS-Ext-B-4.txt
- CJK Unified Ideographs Extension B [part 4] (U-00026000 〜 U-00027FFF) of ISO/IEC 10646-2:2001
- IDS-UCS-Ext-B-5.txt
- CJK Unified Ideographs Extension B [part 5] (U-00028000 〜 U-00029FFF) of ISO/IEC 10646-2:2001
- IDS-UCS-Ext-B-6.txt
- CJK Unified Ideographs Extension B [part 6] (U-0002A000 〜 U-0002A6D6) of ISO/IEC 10646-2:2001
- IDS-UCS-Ext-C.txt
- CJK Unified Ideographs Extension C (U-0002A700 〜 U-0002B734) of ISO/IEC 10646:2012
- IDS-UCS-Ext-D.txt
- CJK Unified Ideographs Extension D (U-0002B740 〜 U-0002B81D) of ISO/IEC 10646:2012
- IDS-UCS-Compat-Supplement.txt
- CJK Compatibility Ideographs Supplement (U-0002F800 〜 U-0002FA1D) of ISO/IEC 10646-2:2001
- IDS-JIS-X0208-1990.txt
- JIS X 0208:1990
- IDS-Daikanwa-01.txt
- 諸橋 大漢和辞典 第1巻
- IDS-Daikanwa-02.txt
- 諸橋 大漢和辞典 第2巻
- IDS-Daikanwa-03.txt
- 諸橋 大漢和辞典 第3巻
- IDS-Daikanwa-04.txt
- 諸橋 大漢和辞典 第4巻
- IDS-Daikanwa-05.txt
- 諸橋 大漢和辞典 第5巻
- IDS-Daikanwa-06.txt
- 諸橋 大漢和辞典 第6巻
- IDS-Daikanwa-07.txt
- 諸橋 大漢和辞典 第7巻
- IDS-Daikanwa-08.txt
- 諸橋 大漢和辞典 第8巻
- IDS-Daikanwa-09.txt
- 諸橋 大漢和辞典 第9巻
- IDS-Daikanwa-10.txt
- 諸橋 大漢和辞典 第10巻
- IDS-Daikanwa-11.txt
- 諸橋 大漢和辞典 第11巻
- IDS-Daikanwa-12.txt
- 諸橋 大漢和辞典 第12巻
- IDS-Daikanwa-dx.txt
- 諸橋 大漢和辞典 索引(補遺)
- IDS-Daikanwa-ho.txt
- 諸橋 大漢和辞典 補巻
- IDS-CBETA.txt
- CBETA 外字
入手法
Git による入手
% git clone http://git.chise.org/git/chise/ids.git
WWW access
関連ツール
XEmacs CHISE
XEmacs CHISE を install している場合、上記パッケージを make install すれば、Emacs Lisp で書かれた検索ツールが利用可能です。
なお、Mac OS X(Lion 以降)をお使いの場合、「CHISEとLionと漢文コーパス」 が参考になるかも知れません。また、Snow Leopard の場合、「Mac OS X へのインストール(Finkの場合)」を参考にしてください。
Ruby/CHISE
Ruby/CHISE を用いれば漢字構造情報データベースを Ruby で操作することができます。
WWW
- CHISE-IDS 漢字検索 :指定した部品を持つ漢字を検索(XEmacs CHISE 上で M-x ideographic-structure-search-chars [CR] 部品文字列 [CR] するのと 同等の機能を WWW 上で実現)
- 上地 宏一 ( 漢字フォント自動生成技術フォーラム ) 「漢字分解器」