「(常用)手書カタカナ文字データベースETL5」

作成経緯

ETL5は、昭和49年度(1974年度)に、富士通にてOCRシートを収集し、電子技術総合研究所において、 TOSBAC-3400観測システムを使用して作成したデータベースで、片仮名51種を、見本文字を参考に記入して頂いたものです。

観測仕様

  • OCRシート仕様(ETL1と同じOCRシートを使用)
    • 手書文字読取用紙 : B5判, 90kg OCR用紙(1種)
    • ドロップアウト・カラー : No.26バイオレット 50%スクリーン(大日本印刷)
    • 文字枠 : 横 5mm、縦 7mm
    • 文字枠ピッチ : 横 7.62mm、縦 12.7mm
    • 文字枠数 : 10 x 12 = 120
  • 対象文字 (計 51文字)
    • カタカナ : 51(ア-ワヰウヱヲン)
  • OCRシート収集
    • 収集場所:富士通
    • 記入方法:カタカナ文字記入上のお願い
      1. 書式の注意
        1. 鉛筆(HB)を使用し、訂正は消しゴムを使用して完全に消してください。
        2. 記入順序はのように、指定された位置に2度書いて下さい。
        3. 次頁の書き方規則を一通り読んでから書き始めて下さい。
      2. 書き方の注意
        1. ○丸印の部分は特に注意して書いて下さい。
        2. 突き出さないよう、離れないよう書いて下さい。
        3. カギや点は明瞭に書いて下さい。
        4. 枠いっぱいにはみ出さず、傾けないでていねいに書いて下さい。
    • 筆記者数 : 104人
    • 全サンプル数 : 10,608 = (51 × 2 × 104)
  • 観測装置
    • 入力装置 : Flying Spot Scanner (FSS) (飛点走査管 5CNP16) (光電子増倍管 7696)
    • 標本化間隔 : 0.1 mm × 0.1 mm
    • スポット径 : 0.1 mm
    • 濃度レベル : 16 (4bit)
    • 標本点数 : 72 x 76 = 5,472 pixels
  • データベース作成
    • 観測場所 : 電子技術総合研究所
    • 使用計算機 : TOSBAC-3400/41(プログラム:FSSTOMT)
    • 作成年月 : 1975年2月
    • 観測期間 : 1975年2月

ETL5データベース仕様

参考文献

  1. 斉藤泰一、山田博三、森俊二: “手書文字データベースの解析(III)”, 「電総研彙報」, Vol.42, No.5, pp.385–434 (1978-05).