工業技術院と日本電子工業振興協会の事業として、 昭和49年(1974年)にOCR用手書文字専門委員会が設けられ、 昭和51年(1976年)に片仮名・数字・英字・特殊記号計114種の OCR用手書き文字の文字規格案が作成されました。 ETL6は、この文字規格案を見本文字として、 OCRユーザ、メーカ、研究機関等の 1400人の方々に記入して頂いたOCRシートを、 電子技術総合研究所において、 TOSBAC−40Cの観測システムで観測したデータです。 現在日本工業規格になっている、 JISC6254−1979(片仮名)・JISC6255−1979(数字)などは、 この文字規格案に基づいて作成されたものです。
OCRシート仕様
OCRデータ収集用紙 : A4判, 100kg OCR用紙(特種製紙)
ドロップアウト・カラー : No.114 レディッシュ・オレンジ 50%スクリーン(大日本印刷)
文字枠 : 横 5mm、縦 6mm
文字枠ピッチ : 横 6.35mm、縦 12.7mm
文字枠数 : 26 x 17 = 442
対象文字 (計 114文字)
数字 : 10
英大文字 : 26
カタカナ : 46
特殊文字 : 32
OCRシート収集
記入上の制限 : 「手書文字読取用紙記入上のお願い」で指定
筆記者数 : 1,383人
全サンプル数 : 157,662
データ収集 : OCR手書文字専門委員会
観測装置
入力装置 : 光導電型撮像管 (VIDICON) (東芝カルニコン)
フィルター : 透過限界波長 620nm (JIS B 7113 R-62)
標本化間隔 : 約 0.11mm x 約 0.11mm
濃度レベル : 16 (4bit)
標本点数 : 64 x 63 = 4,032 pixels
データベース作成
観測場所 : 電子技術総合研究所
使用計算機 : TOSBAC-40C(プログラム : VIDSYS)
作成年月 : 1976年12月
観測期間 : 1976年12月〜1977年5月