「自由手書き文字データベースＥＴＬ１」

★ＥＴＬ１作成経緯

ＥＴＬ１は、昭和４６年度（１９７１年度）から始まった工業技術院大型プロジェクト「パターン情報処理システムの研究開発」の一環として作成されたもので、昭和４８年度（１９７３年度）に、７業種１５００人の協力を得て、英数字、特殊記号および片仮名文字９９種の手書き文字を集めたデータベースです。このデータは、数字・英字については見本を示さず、自由に書かれたものです。ＯＣＲシート、観測システムの設計は、電子技術総合研究所と富士通株式会社との共同で行われ、電子技術総合研究所図形処理研究室に当時設置されていたコンピュータＴＯＳＢＡＣ－３４００で観測が行われました。このデータベースについては、個々の文字を人間が見て評価し、品質の良さを示す値をＩＤ情報の一部として、観測パターンに付属させて入れてあります。

★観測仕様

    ＯＣＲシート仕様
        手書文字読取用紙       : B5判, 90kg OCR用紙（1種）
        ドロップアウト・カラー : No.26バイオレット 50%スクリーン（大日本印刷）
        文字枠                 : 横 5mm、縦 7mm
        文字枠ピッチ           : 横 7.62mm、縦 12.7mm
        文字枠数               : 10 x 12 = 120

    対象文字 (計 99文字)
        アラビア数字         : 10
        アルファベット大文字 : 26
        特殊文字             : 12
        カタカナ             : 51

    ＯＣＲシート収集
        記入上の制限 : 「手書文字読取用紙記入上のお願い」で指定
        筆記者数     : 1,445人
        全サンプル数 : 141,319

    観測装置
        入力装置   : Flying Spot Scanner (FSS) (飛点走査管 5CNP16) (光電子増倍管 7696)
        標本化間隔 : 0.133mm x 0.133mm
        スポット径 : 0.1333mm
        濃度レベル : 16 (4bit)
        標本点数   : 72 x 76（後に、中心の 64 x 63 へ）

    データベース作成
        観測場所   : 電子技術総合研究所
        使用計算機 : TOSBAC-3400/41（プログラム：FSSTOMT）
        作成年月   : 1973年9月
        観測期間   : 1973年9月～12月(～1月～3月)

★ＥＴＬ１データベース仕様

File format / ファイルのフォーマット

Contents of files / ファイルの内容

収集サンプル（最初の３０サンプル）

★参考文献

山田博三、森俊二: "手書文字データベースの解析(I)", 「電総研彙報」, Vol.39, No.8, pp.580--599 (1975-08).
電総研、富士通: "手書文字データ・バンク外部仕様書" (1973-09).