「常用手書き文字データベースETL6」

★ETL6作成経緯

 工業技術院と日本電子工業振興協会の事業として、 昭和49年(1974年)にOCR用手書文字専門委員会が設けられ、 昭和51年(1976年)に片仮名・数字・英字・特殊記号計114種の OCR用手書き文字の文字規格案が作成されました。 ETL6は、この文字規格案を見本文字として、 OCRユーザ、メーカ、研究機関等の 1400人の方々に記入して頂いたOCRシートを、 電子技術総合研究所において、 TOSBAC−40Cの観測システムで観測したデータです。 現在日本工業規格になっている、 JISC6254−1979(片仮名)・JISC6255−1979(数字)などは、 この文字規格案に基づいて作成されたものです。

★観測仕様

    OCRシート仕様
        OCRデータ収集用紙   : A4判, 100kg OCR用紙(特種製紙)
        ドロップアウト・カラー : No.114 レディッシュ・オレンジ 50%スクリーン(大日本印刷)
        文字枠                 : 横 5mm、縦 6mm
        文字枠ピッチ           : 横 6.35mm、縦 12.7mm
        文字枠数               : 26 x 17 = 442

    対象文字 (計 114文字)
        数字     : 10
        英大文字 : 26
        カタカナ : 46
        特殊文字 : 32

    OCRシート収集
        記入上の制限 : 「手書文字読取用紙記入上のお願い」で指定
        筆記者数     : 1,383人
        全サンプル数 : 157,662
        データ収集   : OCR手書文字専門委員会

    観測装置
        入力装置   : 光導電型撮像管 (VIDICON) (東芝カルニコン)
        フィルター : 透過限界波長 620nm (JIS B 7113 R-62)
        標本化間隔 : 約 0.11mm x 約 0.11mm
        濃度レベル : 16 (4bit)
        標本点数   : 64 x 63 = 4,032 pixels

    データベース作成
        観測場所   : 電子技術総合研究所
        使用計算機 : TOSBAC-40C(プログラム : VIDSYS)
        作成年月   : 1976年12月
        観測期間   : 1976年12月〜1977年5月

★ETL6データベース仕様

★参考文献

  1. 斉藤泰一、山田博三、森俊二: "手書文字データベースの解析(III)", 「電総研彙報」, Vol.42, No.5, pp.385--434 (1978-05).