(常用)手書ひらがな文字データベースETL7

★ETL7作成経緯

ETL7は、 昭和52年(1977年)に、 平仮名48種の文字について、 OCRユーザ、メーカ、大学、官庁 計175人の方々に記入して頂いたOCRシートを、 電子技術総合研究所において、 TOSBAC-40C観測システムで観測したデータです。

★観測仕様

OCRシート仕様(Large, Small 2種類)

  • 手書文字OCR用紙 : A4判, 100kg OCR用紙(特種製紙)
  • ドロップアウト・カラー : No.114レディッシュオレンジ 50%スクリーン(大日本印刷)
  • 文字枠 : Large 横 6mm、縦 7.2mm / Small 横 5mm、縦 6.0mm
  • 文字枠ピッチ : Large 横 8.47mm、縦 11.0mm / Small 横 6.35mm、縦 12.7mm
  • 文字枠数 : Large 20 x 20 = 400 / Small 26 x 17 = 442

対象文字 (計 48文字)

  • ひらがな : 46
  • 濁点、半濁点 : 2

OCRシート収集

観測装置

  • 入力装置 : 光導電型撮像管 (VIDICON)
  • フィルター : 透過限界波長620nm(JIS B 7113 R-62)
  • 標本化間隔 : Large 0.13mm x 0.13mm / Small 0.11mm x 0.11mm
  • 濃度レベル : 16 (4bit)
  • 標本点数 : 64 x 63 = 4,032 pixels

データベース作成

  • 観測場所 : 電子技術総合研究所
  • 使用計算機 : TOSBAC-40C(プログラム:)
  • 作成年月 : 1977年8月
  • 観測期間 : 1977年8月

★ETL7データベース仕様

★参考文献

  1. 森俊二、山本和彦、山田博三、斉藤泰一: “手書教育漢字のデータベースについて”, 「電総研彙報」, Vol.43, Nos.11&12, pp.752–773 (1979-11&12).