★ETL7作成経緯
ETL7は、 昭和52年(1977年)に、 平仮名48種の文字について、 OCRユーザ、メーカ、大学、官庁 計175人の方々に記入して頂いたOCRシートを、 電子技術総合研究所において、 TOSBAC-40C観測システムで観測したデータです。
★観測仕様
OCRシート仕様(Large, Small 2種類)
- 手書文字OCR用紙 : A4判, 100kg OCR用紙(特種製紙)
- ドロップアウト・カラー : No.114レディッシュオレンジ 50%スクリーン(大日本印刷)
- 文字枠 : Large 横 6mm、縦 7.2mm / Small 横 5mm、縦 6.0mm
- 文字枠ピッチ : Large 横 8.47mm、縦 11.0mm / Small 横 6.35mm、縦 12.7mm
- 文字枠数 : Large 20 x 20 = 400 / Small 26 x 17 = 442
対象文字 (計 48文字)
- ひらがな : 46
- 濁点、半濁点 : 2
OCRシート収集
- 記入上の制限 : 「手書文字読取用紙記入上のお願い」で指定
- 筆記者数 : 175人
- 全サンプル数 : 16,800 (Large 8,400 / Small 8,400)
観測装置
- 入力装置 : 光導電型撮像管 (VIDICON)
- フィルター : 透過限界波長620nm(JIS B 7113 R-62)
- 標本化間隔 : Large 0.13mm x 0.13mm / Small 0.11mm x 0.11mm
- 濃度レベル : 16 (4bit)
- 標本点数 : 64 x 63 = 4,032 pixels
データベース作成
- 観測場所 : 電子技術総合研究所
- 使用計算機 : TOSBAC-40C(プログラム:)
- 作成年月 : 1977年8月
- 観測期間 : 1977年8月
★ETL7データベース仕様
-
- Image file format / イメージ・ファイル・フォーマット
- フォーマットはETL1と同じです。サンプルコードはETL1を参照してください。
- 各ファイルの内容は英語版を参照してください。
★参考文献
- 森俊二、山本和彦、山田博三、斉藤泰一: “手書教育漢字のデータベースについて”, 「電総研彙報」, Vol.43, Nos.11&12, pp.752–773 (1979-11&12).