(常用)手書き文字データベースETL3

 


ETL3作成経緯

ETL3は、 電子技術総合研究所と日立製作所との共同で、 昭和49年度(1974年度)に作成したデータベースで、 数字・英字・特殊記号計48種の文字を、 見本文字を示して記入して頂いたものです。 OCRシートは日立製作所にて収集し、 観測は電子技術総合研究所のTOSBAC-3400観測システムを使用しました。

観測仕様

  • OCRシート仕様
    • ETL1と同じ 手書文字読取用紙 : B5判, 90kg OCR用紙(1種)
    • ドロップアウト・カラー:No.26バイオレット 50%スクリーン(大日本印刷)
    • 文字枠:横 5mm、縦 7mm
    • 文字枠ピッチ:横 7.62mm、縦 12.7mm
    • 文字枠数:10 × 12 = 120
  • 対象文字 (計 48文字)
    • アラビア数字:10 (0-9)
    • アルファベット大文字:26 (A-Z)
    • 特殊文字:12 (¥+-*/=()・,_▾)
  • OCRシート収集
    • 収集場所:日立製作所
    • 記入上の制限:
      1. 筆記具は鉛筆(HB)に、訂正は消しゴムで完全に消すことを指定。
      2. 用紙への記入位置と順序は例で示し、書き方規則も添付。
      3. 記入文字に対しては“枠いっぱいにはみ出さず、傾けないでていねいに”と指定。
    • 筆記者数:200人
    • 全サンプル数:9,600
  • 観測装置
    • 入力装置:Flying Spot Scanner (FSS) (飛点走査管 5CNP16) (光電子増倍管 7696)
    •  
    • 標本化間隔:0.133 mm × 0.133 mm
    • スポット径:0.1333 mm
    • 濃度レベル:16 (4 bits)
    • 標本点数:72 × 76 = 5472 pixels
  • データベース作成
    • 観測場所:電子技術総合研究所
    • 使用計算機:TOSBAC-3400/41(プログラム:FSSTOMT)
    • 作成年月:1974年4月
    • 観測期間:1974年4月

ETL3データベース仕様

File format / ファイルのフォーマット
File Formats and Sample Script

参考文献

斉藤泰一、山田博三、森俊二:”手書文字データベースの解析(III)”, 「電総研彙報」, Vol.42, No.5, pp.385–434 (1978-05).