ETL1は、 昭和46年度(1971年度)から始まった 工業技術院大型プロジェクト「パターン情報処理システムの研究開発」 の一環として作成されたもので、 昭和48年度(1973年度)に、 7業種1500人の協力を得て、 英数字、特殊記号および片仮名文字99種の 手書き文字を集めたデータベースです。 このデータは、 数字・英字については見本を示さず、自由に書かれたものです。 OCRシート、観測システムの設計は、 電子技術総合研究所と富士通株式会社との共同で行われ、 電子技術総合研究所図形処理研究室に当時設置されていた コンピュータTOSBAC−3400で観測が行われました。 このデータベースについては、個々の文字を人間が見て評価し、 品質の良さを示す値をID情報の一部として、 観測パターンに付属させて入れてあります。
OCRシート仕様
手書文字読取用紙 : B5判, 90kg OCR用紙(1種)
ドロップアウト・カラー : No.26バイオレット 50%スクリーン(大日本印刷)
文字枠 : 横 5mm、縦 7mm
文字枠ピッチ : 横 7.62mm、縦 12.7mm
文字枠数 : 10 x 12 = 120
対象文字 (計 99文字)
アラビア数字 : 10
アルファベット大文字 : 26
特殊文字 : 12
カタカナ : 51
OCRシート収集
記入上の制限 : 「手書文字読取用紙記入上のお願い」で指定
筆記者数 : 1,445人
全サンプル数 : 141,319
観測装置
入力装置 : Flying Spot Scanner (FSS) (飛点走査管 5CNP16) (光電子増倍管 7696)
標本化間隔 : 0.133mm x 0.133mm
スポット径 : 0.1333mm
濃度レベル : 16 (4bit)
標本点数 : 72 x 76(後に、中心の 64 x 63 へ)
データベース作成
観測場所 : 電子技術総合研究所
使用計算機 : TOSBAC-3400/41(プログラム:FSSTOMT)
作成年月 : 1973年9月
観測期間 : 1973年9月〜12月(〜1月〜3月)