文字情報サービス環境 CHISE

Main Content

CHISE 漢字構造情報データベース


ISO/IEC 10646 の IDS 形式に基づく漢字の構造情報データベースを開発中です。 現在、ISO/IEC 10646 の基本統合漢字、 統合漢字拡張 A〜I の約10万字が入力済です。

Web-UI: CHISE-IDS 漢字検索


構造情報データベースのサンプル

IDS-UCS-Basic.txt
CJK Unified Ideographs (U+4E00 〜 U+9FA5) of ISO/IEC 10646-1:2000
IDS-UCS-Ext-A.txt
CJK Unified Ideographs Extension A (U+3400 〜 U+4DB5, U+FA1F and U+FA23) of ISO/IEC 10646-1:2000
IDS-UCS-Compat.txt
CJK Compatibility Ideographs (U+F900 〜 U+FA2D, except U+FA1F and U+FA23) of ISO/IEC 10646-1:2000
IDS-UCS-Ext-B-1.txt
CJK Unified Ideographs Extension B [part 1] (U-00020000 〜 U-00021FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-2.txt
CJK Unified Ideographs Extension B [part 2] (U-00022000 〜 U-00023FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-3.txt
CJK Unified Ideographs Extension B [part 3] (U-00024000 〜 U-00025FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-4.txt
CJK Unified Ideographs Extension B [part 4] (U-00026000 〜 U-00027FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-5.txt
CJK Unified Ideographs Extension B [part 5] (U-00028000 〜 U-00029FFF) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-B-6.txt
CJK Unified Ideographs Extension B [part 6] (U-0002A000 〜 U-0002A6D6) of ISO/IEC 10646-2:2001
IDS-UCS-Ext-C.txt
CJK Unified Ideographs Extension C (U-0002A700 〜 U-0002B734) of ISO/IEC 10646:2012
IDS-UCS-Ext-D.txt
CJK Unified Ideographs Extension D (U-0002B740 〜 U-0002B81D) of ISO/IEC 10646:2012
IDS-UCS-Ext-E.txt
CJK Unified Ideographs Extension E (U-0002B820 〜 U-0002CEA1) of ISO/IEC 10646
IDS-UCS-Ext-F.txt
CJK Unified Ideographs Extension F (U-0002CEB0 〜 U-0002EBE0) of ISO/IEC 10646
IDS-UCS-Ext-G.txt
CJK Unified Ideographs Extension G (U-00030000 〜 U-0003134A) of ISO/IEC 10646
IDS-UCS-Ext-H.txt
CJK Unified Ideographs Extension H (U-00031350 〜 U-000323AF) of ISO/IEC 10646
IDS-UCS-Ext-I.txt
CJK Unified Ideographs Extension I (U-0002EBF0 〜 U-0002EE5D) of ISO/IEC 10646
IDS-UCS-Compat-Supplement.txt
CJK Compatibility Ideographs Supplement (U-0002F800 〜 U-0002FA1D) of ISO/IEC 10646-2:2001
IDS-JIS-X0208-1990.txt
JIS X 0208:1990
IDS-Daikanwa-01.txt
諸橋 大漢和辞典 第1巻
IDS-Daikanwa-02.txt
諸橋 大漢和辞典 第2巻
IDS-Daikanwa-03.txt
諸橋 大漢和辞典 第3巻
IDS-Daikanwa-04.txt
諸橋 大漢和辞典 第4巻
IDS-Daikanwa-05.txt
諸橋 大漢和辞典 第5巻
IDS-Daikanwa-06.txt
諸橋 大漢和辞典 第6巻
IDS-Daikanwa-07.txt
諸橋 大漢和辞典 第7巻
IDS-Daikanwa-08.txt
諸橋 大漢和辞典 第8巻
IDS-Daikanwa-09.txt
諸橋 大漢和辞典 第9巻
IDS-Daikanwa-10.txt
諸橋 大漢和辞典 第10巻
IDS-Daikanwa-11.txt
諸橋 大漢和辞典 第11巻
IDS-Daikanwa-12.txt
諸橋 大漢和辞典 第12巻
IDS-Daikanwa-dx.txt
諸橋 大漢和辞典 索引(補遺)
IDS-Daikanwa-ho.txt
諸橋 大漢和辞典 補巻
IDS-CBETA.txt
CBETA 外字

入手法

Git による入手

% git clone https://gitlab.chise.org/CHISE/ids.git

WWW access

関連ツール

CL-CHISE

SBCL 等の Common Lisp 実装で Quicklisp を利用している場合、 (ql:quickload :cl-chise) (chise:setup) で CL-CHISE をインストールすることが可能です。 インストール後は、(ql:quickload :cl-chise)だけで CL-CHISE を実行することが可能です。なお、動作には Valkey(もしくは Redis)サーバーが必要です。 https://gitlab.chise.org/CHISE/cl-chise にサンプルコードがありますのでご参照ください。

XEmacs CHISE

XEmacs CHISE を install している場合、上記パッケージを make install すれば、Emacs Lisp で書かれた検索ツールが利用可能です。

Ruby/CHISE

Ruby/CHISE を用いれば漢字構造情報データベースを Ruby で操作することができます。

WWW


ruimoku rare characters image

東洋学文献類目における用例数の少ない文字リスト

東洋学文献類目のタイトルに出てくる文字の内、用例数の少ないものを集めてみました。

CHISE-wiki 文字検索