No.19(1989.9.1)p 6


作業内容・入力基準等の解説

中西 裕・山本ちえ子
(和書データベース化事業室)


T<準備>

準備作業はまず遡及入力用に別環境のWINE(Waseda University Information NEtwork System)を作ることからはじめられた。目録データの遡及入力を行う場合、望ましいのは、現在新しい目録が日々蓄積されている(当館の場合は’85年度よりオンラインシステム稼動)同一の目録システム環境で作業を行うべきであろう。だが、今回の当館の計画の場合その方針はとれなかった。その理由としては、

1.゛現行WINE"(現在目録作業、利用者用端末で使用しているWINE環境をこう呼ぶ)ではソースレコードとしてのJapan MARC(以下J/Mと略記する)、TRC MARC、LC MARC をネットワークの共同目録の中にではなく、書誌プールの中にロードして、整理する資料にヒットしたものを共同目録の中に移すという作業を行っている。そして書誌プールの内容に制限があることもあり、MARC 類は近5年分のみとしているまた遡及の作業ではMARC は書誌プールにではなく、先に共同目録にロードして、ヒットしたものはただちにデータ類の追加訂正、所蔵の付与が行える形としたい。

2.紀伊国屋書店との共同事業として行い、能率をはかり、費用の軽減を行うのが第一前提である。そのため、作成するデータ仕様は、現在和書MARC の基本的フォーマットであるJ/M仕様と決定された。J/Mフォーマットは和書の特性を反映して゛巻書名"等、特殊なフィールドがあり、一方早大のシステムWINE は和・洋同一のフォーマットで運営される基本理念のため、J/M仕様を厳守するためには、システムに手を加える必要がある。

3.この事業の第一目標は勿論、早大和書の遡及入力であるが、一方、早大の50万冊の和書データが蓄積され際には、それを図書館界に広く利用され得るものとしたい。また将来的には他館等の参加も可能なデータベースに発展し得る可能性を持つ事業としたい。

以上の理由から独立した別環境を設定することとし、それを通称゛遡及WINE"と呼んでいる。ただ、そのため遡及データの作成はオンラインで行なうが、それがただちに現行WINEには反映せず、ある意味ではバッチ処理であるという結果になっている。そして、またこのことはWINE システムの大きな特性である書誌間のリレーションシステムを遡及においては活用できないという残念な結果ともなってしまった。

遡及WINEシステムが現行WINEシステムと異なるのは、巻書名、巻著者名標目、巻の責任表示のフィールドを設けたこと、現行WINEは書名等のデータの漢字形も読み形も文節分ちであるが、遡及WINEではJ/M仕様に合わせ、漢字形は区切りがなく、読みは単語ごとに区切る、というのが大きな店である。(なお、ホストマンは現行WINEと共通でIBM3090-180E 図書館専用機である。)

J/Mのロード仕様を決め、ロードにかかったのが'88年10月からであり、その間、9月には紀伊国屋書店の専任メンバー3名が決まり、入力者の募集がはじめられた。早大側の体制は'88年6月からワーキンググループが作られ、事業の構想は検討されていたが、専従メンバーの決定は10月1日付けとなり、兼務が解かれ実質専従として作業にかかったのは12月1日からである。(遡及作業特にシステム面では専従メンバー以外の学術情報システム課メンバーに作業の多くを受け持ってもらっている。)

まず入力基準の確定とマニュアル作りに着手した。入力基準はJ/M仕様という点で国立会図書館のNCR77年版の適用細則第2版(昭和54年10月『印刷カード通信』No.53 1979.11に発表)を基本とし、それにオンライン目録に適用するために必要な修正を行った。

基準の変更で大きな点は、次の2点である。

1.刊年の取り方 最新年(最新の刷次年) 同一版の最初の出版年(第1刷の年を刊年とする)
2.標目の選び方 (アクセスポイントの選定の仕方) 国会図書館の基準よりかなり広げる。(副書名・巻書名・叢書名・出版者・巻著者・訳者等すべてアクセスポイントにする。)

ただ、この入力基準は簡略なものであり、常時 NCR87版他を参照しつつ、より詳細な入力基準書としてゆくのが課題である。

同時に、入力手順を説明する画面集を交えたマニュアルを作成し、入力者教育のトゥールとした。

入力者は9月から採用されはじめ、J/Mのロードが終了し遡及WINEシステムが整うまでの間、目録作業を理解するために必要な教育を紀伊国屋書店の専従者と協同して行った。入力者は25人というのが紀伊国屋書店との契約であり、未経験者がほとんどだが(司書資格保持者、司書業務敬虔者も若干名いる)、研修期間がかなり長く取れ、目録規則、分類、件名等の基本的な教育は行うことができた。端末操作の訓練も、テスト環境を別に設定して行うと共に、図書の現物から目録を取る作業も、現行WINEでの目録作業を経験してもらう形で行った。目録作業に必要な参考図書類も紀伊国屋書店により、基本的なものは揃えられ、入力者に対するその使用法の研修も行われた。

J/Mのロードは、遡及作業が'85年以前の図書が対象のため、1969年分から1985年分までの約60万件(1969〜76年までの NDLの簡易整理分はまだJ/Mが完成していない)であり、'88年中に終了させる予定であったが、J/M中の異常に長い書名が原因でロードエラーが生じた事件等もあり、完全な終了は'89年2月半ばとなった。このロードの際にはJ/Mではアクセスポイントではないため読みの付与のなされていない副書名・巻書名・叢書名・出版者名にAJAX(朝日新聞社の開発した自動かな振りプログラム)により、読みの自動付与が行われる。(ただし、機械的な付与のため修正が必要な読みも多く、これらはヒットの際正しいものに訂正する処理を要する。)

作業場所が確定し、専用端末28台の準備も終わり、事務所開きが行われた'89年1月12日以後、ロードの終了を待つ間、未整理の滞貨図書を材料に、テスト環境で実際に目録作成を行い、点検リストを出して、早大専従者いによる点検も行い、必要な修正を指示する模擬稼動の期間もかなり長く取ることができた。

そして'89年2月2日より、いよいよ本番の遡及データ作成が、ロードの完全終了を待たず、同時進行の形ではじめられた。

U<作業手順>

作業手順の概略は以下のようなものである。

まず、毎日目録を取る図書現物を作業場に運び込む。現在一日400〜500冊。作業場所が図書館本館から多少離れているため、紀伊国屋書店が軽トラックを用意して運搬に当たるが、作業場所(2F)の建物にエレベータがないため、これがなかなか大変な作業である。(軽リフトの設置等が可能か考慮中。)入力者は4班に組織され、それぞれリーダーがきめられて互いに協力しつつ、゛競争"する体制が紀伊国屋側で取られている。図書現物がそれぞれ班に分けられ、入力方針(セットもの等の扱いその他)が考えられた上で、まずJapan MARCにヒットするか検索を行う。ヒット基準はマニュアルが作られているが、

1. 同一書だが版が異なるものはヒットとはせず、WINEの持つコピーの機能を用いて、元書誌はそのままにして、コピーによる流用により新たな書誌を作成する。J/Mでは一般注記に記入される゛特殊な版(新装版、普及版、豪華版等)"も異なる場合は同様に別書誌を作成する。

2. J/Mでは多冊物が一括記入となっているものも、ヒットとはせず1冊ずつの書誌を作成する。(一括記入か、物理単位の分割記入かという問題は論議のある所であり、本来のWINEシステムの理念からは゛単行書誌レベルの書誌単位による一括記入方が望ましい。だが、先にも述べた事情で現行WINEとは別環境で行うことから、一括記入の書誌に対する物理単位の所蔵情報との関係が、環境を移す際に保持し得ないという問題があり、また紀伊国屋書店側の意見として、現在他の多くのシステムではやはり物理単位の書誌もある。)

ヒット基準は主に上記2点他であるが、ヒットと見なされたものは、まず手を加えずに点検リストを打ち出す。そのリストを本にはさみ、入力者が第一次点検を行う。

点検の要領は

1. まず機械的に読みを付与したアクセスポイントの読みが正しいかチェックする。
2. その他、すべての項目にわたって図書現物と照らし合わせて誤りがないか確認する。(J/Mの校正ミスによる誤りもしばしばみつけられる。)
3. 分類は、J/Mは1980年の途中からNDC8版によるが、それ以前はNDC6版である。WINEではすべて8版に統一するため、6版の分類しかないものには8版を追加する。(この6版-8版変換については、ある程度機械的な処理ができないか検討した。そして志保田務氏等の編纂になる『NDC変換便覧』(日外アソシエーツ 1986刊)の「6A-8版:相互索引」を利用させていただき機会変換の試みを行った。その詳細については改めて報告したいが、それによりJ/Mの6版分類のもの約30万件のうち、11万件については機械処理による8版追加が行われた。(機会的な追加がなされた8版については、ヒットの際改めてその追加がその図書に対して正しいかの確認を行う。)



書誌画面例(情報内容が多い場合は2画面以上になる)

4. また分類についてはJ/MではNDC分類記号は原則として1冊に対して1つしか与えられておらず、例えば叢書物等では、叢書全体に対する分類のみで、各巻の主題に対する分類は与えられていない。これについても必要と判断される場合は各巻分類を追加し、複合主題の図書に対する2つ目3つ目の分類も場合によっては追加する。
5. 件名についても点検を行うが、件名の形については例えば、読みの乱れや生没年の誤り等J/Mの不備が見つけられる。
6. 著者名のアクセスポイントも特に巻著者が挙げられていないものが多く、責任表示に入れる著者・編者・訳者等、すべてアクセスポイントに追加する。
7. 原書名注記・原文言語コード等J/Mでは省略されているものも多いが、その図書から判明する範囲でこれも追加する。

以上一次点検が行なわれ、点検リストに加えられた修正にもとづき必要なデータ訂正が行なわれ、所蔵情報が付与され、新たな点検リストが打ち出される。入力者はそのリストの修正が正しく行なわれたか確認した上、2枚の点検リストを図書にはさむ。
(「ふみくら」本号の表紙はJ/Mヒットに追加情報を加えた点検リスト例。)

ヒットしない図書(1969年以前の刊年のもの、およびそれ以後でもJ/Mに収録されていないもの)については、ただちにオリジナルの書誌作成が行われる。入力シートのようなものは基本的には用いず、図書現物を見ながらマニュアルに従い書誌作成され、これも一次点検リストで点検の上、修正、所蔵付与、二次点検リスト打ち出し、修正の確認の手順を経る。

そして二枚の点検リスト(修正の必要がなかったものについては1枚)のはさまれた図書は、早大専従者の三次点検用の棚に並べられる。

早大専従者4名はこれらの図書を点検リストと照らし合わせチェックを行う。J/Mヒット分は、一枚目の手を加えられていない点検リストが同時にあるため、入力者の判断により修正された項目等ただちに分かる仕組である。また当然J/Mヒットデータか、オリジナル作成のデータかの区別もはっきり分かり、点検のポイントとなる。

入力の基本がJ/M仕様であり、分類コードもNDLのものを採用し、件名表も「国立国会図書館件名標目表第4版」に拠るため、J/Mにヒットしたものはアクセスポイントの追加や、先に述べた各巻分類等の付加以外、基本的には修正を加えない方針であはある。しかし、実際には図書現物と照らし合わせて点検すると、記述の仕方にしても、与えられている分類、件名にしても、国会のコードから考えても、修正した方が適当と判断されるものもかなりある。それらについては図書現物を用いて目録をとり、詳細な均質なデータベースを作成するという今回の遡及作業の最大の理念に照らしても、修正をおこなうべきと考えている。

国会図書館のNCR77年版適用細則が目録作成に適用されたのは1978年以後であり、現在の1969年以後からあるJ/Mはこの細則以前の目録法による書誌も多数含んでいるため、ヒットした書誌の記述等かなりばらつきがある。必要な修正は行うが、注記等の検索にあまり影響を及ぼさない項目にはさほど手を加えない方針である。しかし、同じシリーズ内でも巻書名の扱いや、内容の取り方などにあまりに相違があるもの等、修正を加えざるを得ない物に出会うことも多い。これはやはり、出版される時点でマニュアルで目録作成を行うのと、すべて揃った時点でまとめてオンラインで目録を作る場合の違いによるものであろう。

典拠管理におけるWINEシステムの大きな特徴は、書名、著者標目、件名、分類、出版者、その他ISBNや請求記号まで、個々の書誌の中にデータを持つのではなく、それぞれ著者名、書名等毎に一定の順序のアクセスポイントファイルとしてデータを持ち、各書誌の中にはその書誌に必要な著者項目なり、書名標目なりのポインター番号のみを持つ方式のシステムである。そのため個々の書誌の情報量はバイト数にすれば非常に少ない形ですむ。また、著者名標目、件名、叢書名、出版社名等、繰り返して使用されるものは、一度データを作成すれば、それを検索して指定するだけで新たな入力の必要はない。また著者名ファイルがそのまま典拠ファイルの性格のものであるため、典拠の統一や、必要な修正等はアクセスポイントファイルのデータを一度直すだけでそれにつながっている何千件もの書誌データの修正がただちに行える。

J/Mをロードした時点で著者名ファイルは、国会図書館の典拠に基づく典拠ファイルが作成されるはずである。しかし、国会図書館がJ/Mをオンラインで典拠管理を正確に行ないながら作成しているわけではないことが典拠の乱れとしてあらわれる。勿論、国会図書館の典拠ファイルを移したわけではないので、必要な参照類は一切入力されていないが、他に大きな問題として著者名の付記事項である生没年の付与の仕方に一貫性がなく、基準がない点がある。時期により、同名異人がいる場合ではなくても生年を付与する割合が多い時や、ほとんど付与しない時がある。また付与の形式も(1931〜)、(1931生)の形の違いや、生年のみのもの、生没年両方あるものがある。アクセスポイントファイル上ではこれらがすべて違う形の著者として並列してしまう結果となる(次頁画面参照)。

この整備は作業を進めつつ拠点管理システムで必要な調査をし、修正してゆく他ないが、国会図書館側にも一貫した方針の維持と、典拠ファイルの公開を望みたい。典拠ファイルに必要な参照等は作業を進める中心で少しずつ作成している。

以上の問題点はあるが、一応擬似国会図書館典拠ファイルを持つことができている点は、作業の上で大変なメリットである。オリジナル目録作成の場合すでに典拠にある標目はただちに用いることができる。ただしJ/Mは1969年以後のデータであるので、典拠の新たな追加は必須である。データシートを先に専従者が作成して入力者に渡す方式はとらないので、入力者が自分の判断で典拠ファイルに登録する手順となる。そのため、入力者には、典拠ファイルの重要性の認識を徹底させ、まず『国立国会図書館著者名典拠録』に当たること、確固とした典拠のない標目は作らないことを原則として、早大の点検の際も新たに追加された標目の検査には充分に気をつけるようにしている。

著者名ファイル画面例(J/Mの標目形の違いにより同一著者が別れている例 右側は書誌の数を示す)


ただ頭の痛いのは外国人名の典拠形の決定である。このことはAACRU後の変更の扱いの問題もからみ、洋書係等とも協議の上、何らかの方針をたてる課題がある。団体名の扱いの難しさも各館共通の悩みであろう。

注記類についての問題として、WINEは注記全体のバイト数が1000バイトまでという制限がある。そのためJ/Mの内容注記で特に長いものは全部入りきらない場合がある。その場合適宜修正をほどこし、一部省略せざるを得ないのは残念である。

早大専従者の点検が終ったものは、図書に必要な修正指示を加えた二枚目の点検リストをはさんで、再び入力者に戻される。

入力者は修正の必要があるものは修正を行った上で、今度は所蔵情報が正しく付与されているかのオンラインによる点検を行う。これはしばしばミスの多いものであるが、所蔵情報が正確でないと、いくら詳細な書誌を作っても利用上意味をなさない。その点検は慎重に行っている。

以上の手順で作業は終了し、あとは原則として3泊4日の期限のある図書を書庫に返却する。

遡及WINEに蓄積されたデータは、ある時期に、所蔵のついたものを取り出すことにより、現行WINEにロードするわけであるが、入力を始めて5ヶ月、まだその作業を実際には行っていない。

遡及WINEの形のものをJ/Mの形にして取り出し、次に、遡及WINEと現行のWINEのシステムや基準の相違などによる、必要なメンテナンス作業を行い、次に現行WINEにロードするプログラムを通して初めて利用者に遡及情報が提供される。ただ、テストとして500件程のJ/Mヒット分、オリジナル分それぞれの書誌をJ/M形に出力する試みは行ない、おおむね成功している。

V<現状>

入力速度であるが、当初の計画では、52万件を3年半でということで、入力者25人で想定すると一日の処理量は約600冊という机上での計算がある。現状は、現在はじめにとりかかった学習図書室分(学生用開架図書約4万冊)については、新館オープンに備えて、請求記号の分類展開、図書記号の変更の作業が、'85年以後のWINEに入力分も含めて必要であり、それに伴う装備替えの仕事まで一度に行うことになり、その処理もかかえている。そのため一日の処理量は、ヒット分が多い時で400冊を超え、オリジナルが主な日は200冊程度といったところである。しかし、これも作業手順の効率化や、入力者の熟練度が加われば件数を伸ばしていくことは可能だろう。勿論、古い時代に入り、目録作業が難しくなれば、問題点も多出してくるだろうが、とにかく方針としては「量」よりも「質」を重視した作業を行うようにしたいという考えである。

学習図書室所蔵分がほぼ総記から文学までの全分野終了し、入力者は各分野にわたってJ/Mを点検することにより、目録法や、分類・件名のつけ方を実務のなかでもかなり学ぶことができたように見受けられる。早大専従者もできるだけ修正指示の中で、目録作業のあり方を理解してもらえるよう努力し、専従者自身もいろいろ学ばせていただいている。

当初、未経験の入力者に、データシートなしでの入力作業がどの程度スムーズに行くものか、危惧の念があり、また分類、件名付与については紀伊国屋側の責任ある専従者が行うべきという考えも持ってはいた。しかし、現在の手順での入力作業を見ていると、入力者はやはり単なる機会のオペレートのみではなく、自身の判断業務がかなりある点で、仕事に対するやりがいを持って積極的に取り組んでいる。向上心も強く、このまま育ってくれれば、この事業に対して先に抱いた゛少々無謀か"の念も杞憂とすることができるかとも思われる。

それにしても、目録業務には重大なものから、瑣末だが解決が必要なものまで問題が山のようにある。特に今までの簡略なカード目録の時代から一挙にオンラインによる詳細なデータベース化への転換には、考え方の切り替えも必要である。

(J/MにはLC NARC等にある種々の固定長データやインジケータ類がほとんど設けられていない。これはデータベースの理念からは残念な点であり、WINEの持つ能力を生かせない不本意さと、欧米との目録思想の違いを感じさせられる。)

様々な問題点の解決や、遡及WINEと現行WINEの間の調整等の問題も話し合いつつ、点検用の棚ずらりと並べられる図書の山の処理に追われる日々が続く。(1989.6.25 記)

なお、紀伊国屋書店との契約により、遡及WINEは早大構内の28台の端末(近く30台に増設予定)以外に紀伊国屋書店に10台提供し、同書店の受注した他大学図書館等の遡及作業にも利用する。まず当分はJ/Mと早大でのオリジナル書誌にヒットする分に他大学の所蔵を付加することに限定している。他大学の遡及は、既に作成されているカード情報のオンライン目録の置き換えが主流であり、当館のように図書現物に必ず当たり、入力基準もJ/Mを上回るレベルという方針をとらないので、カードからのオリジナル目録を同一環境に入力することは、典拠の乱れを引き起こし、データベースの質を落とす結果となる。ただ、紀伊国屋書店の実務上、ヒット分のみでオリジナル分の作成ができないことは不便であるので、協議の上、カード情報よりの入力のために、遡及WINEとまったく同じシステムで、J/Mはロードされていない環境のみを作成して便宜を図ることになった。紀伊国屋書店では他大学の遡及事業に、すでに利用を開始している。




図書館ホームページへ

Copyright (C) Waseda University Library, 1996. All Rights Reserved.
Archived Web, 2002