「自由手書き文字データベースETL1」

★ETL1作成経緯

ETL1は、 昭和46年度(1971年度)から始まった 工業技術院大型プロジェクト「パターン情報処理システムの研究開発」 の一環として作成されたもので、 昭和48年度(1973年度)に、 7業種1500人の協力を得て、 英数字、特殊記号および片仮名文字99種の 手書き文字を集めたデータベースです。 このデータは、 数字・英字については見本を示さず、自由に書かれたものです。 OCRシート、観測システムの設計は、 電子技術総合研究所と富士通株式会社との共同で行われ、 電子技術総合研究所図形処理研究室に当時設置されていた コンピュータTOSBAC−3400で観測が行われました。 このデータベースについては、個々の文字を人間が見て評価し、 品質の良さを示す値をID情報の一部として、 観測パターンに付属させて入れてあります。

★観測仕様

    OCRシート仕様
        手書文字読取用紙       : B5判, 90kg OCR用紙(1種)
        ドロップアウト・カラー : No.26バイオレット 50%スクリーン(大日本印刷)
        文字枠                 : 横 5mm、縦 7mm
        文字枠ピッチ           : 横 7.62mm、縦 12.7mm
        文字枠数               : 10 x 12 = 120

    対象文字 (計 99文字)
        アラビア数字         : 10
        アルファベット大文字 : 26
        特殊文字             : 12
        カタカナ             : 51

    OCRシート収集
        記入上の制限 : 「手書文字読取用紙記入上のお願い」で指定
        筆記者数     : 1,445人
        全サンプル数 : 141,319

    観測装置
        入力装置   : Flying Spot Scanner (FSS) (飛点走査管 5CNP16) (光電子増倍管 7696)
        標本化間隔 : 0.133mm x 0.133mm
        スポット径 : 0.1333mm
        濃度レベル : 16 (4bit)
        標本点数   : 72 x 76(後に、中心の 64 x 63 へ)

    データベース作成
        観測場所   : 電子技術総合研究所
        使用計算機 : TOSBAC-3400/41(プログラム:FSSTOMT)
        作成年月   : 1973年9月
        観測期間   : 1973年9月〜12月(〜1月〜3月)

★ETL1データベース仕様

★参考文献

  1. 山田博三、森俊二: "手書文字データベースの解析(I)", 「電総研彙報」, Vol.39, No.8, pp.580--599 (1975-08).
  2. 電総研、富士通: "手書文字データ・バンク外部仕様書" (1973-09).