[トップページ]

トップページ コラム バックナンバー

no. 12 図書館システムと日本語の歴史

9月19日に開催されました「図書館システムの歴史と日本語処理」の資料を掲載いたしました。とても興味深い資料集になっています。

先日、図書館システムについて学生へ説明する機会があり、図書館システムを歴史的に考察してみようと図書館システムの歴史年表を作ってみました。(黒澤さんのページがとても役立ちました。) 学生に話をしてみると、汎用コンピュータ・端末を見たことも無いと指摘され、とても困ってしまいました。セミナーの話題にもあったように、コンピュータで漢字を入力することがとても大変だったことなど説明をしてみましたが、関心を示してもらえなかったようです。既に、そのような時代はノスタルジーで語るしかないのかもしれません。電子ファイリングシステム・磁気テープなど死語もどんどん増えてきています。最近、8インチフロッピーや磁気テープ・パンチカードなどを学生に説明するために集められている先生もいらっしゃるそうです。10年前の出来事が博物館の展示品になってしまったようです。 図書館システムの年表としてシステム構成の変化をまとめてみると図書館システムの変化がよく分かってきます。図書館の事情だけで作って来たシステムがネットワークによって世間と結ばれ変化していく様がハッキリ映し出されて来ます。貸出や目録などの業務システムの効率化が一段落し、やっと利用者へのサービスを目的としてシステムの構築が可能になってきているように思います。

Z39.50のガイドラインをRLGの担当者に見てもらいました。幾つかの助言をいただきましたので、それらを修正しZIGに投げようと思います。

no. 11 OAI (2003/7/3)

6月17日にOAIセミナーを行ない、50人以上の人にご参加いただきました。 Jewelさんと尾城さんの分かりやすい説明のおかげで内容の濃い充実したセミナーだったと思います。ありがとうございました。

OAI-PMH という新しい技術の紹介を行なってもらったわけですが、これは、何でこんなに脚光を浴びているのかもう一つピンと来ていなかったのは私だけだったでしょうか。この講演を聴いて、これを技術的な問題としてだけ考えないで、実現されているアーカイブ機能を評価しないといけないんだと改めて思いました。

"cgi?"の後に記載されるコマンドを決めただけで、HTTPのポートを使ってファイルを交換するということには、新しさを感じない人もいますよね。カスタマイズされたポートの違うftpじゃないのって思いますよね。そんなことを言ったら、今、流行りのOpen URLだって何が新しいのって思う人はいますよね。Open URL構文がなんでSQL的ではないのかなって思っているのは私だけではないでしょう。XPATHってどんな意味があるの?クエリー記述言語を勝手に増やさないでよってつぶやいているSEは結構いるんじゃないでしょうか。

OAIは、技術的に新しいというのではなく、今の技術環境の中でアーカイブを交換するために最も身近で普及しやすい手法を使って業務レベルのプロトコルの標準化を行ない、実際の業務を行なっているっていう点が評価されているんだと思います。やりたいことがあって、比較的身近な環境を使って、業務に実装して標準化させ普及させていることに意味があるんですね。

また、最近の図書館のIT技術は、W3Cの動向と似ていることが多いのに、使っている用語の意味が違っている場合が多いので、とても混乱してしまいます。OAIに似た動きが SOAPという名前で議論されています。しかし、ライブラリー・アーカイブのコミュニティーの用語とW3Cの方々の用語が異なっていて混乱してしまいます。メタデータという言葉もこのような言葉の混乱に乗じて影響力を増してきたやっかいな概念かもしれません。

図書館における日本語処理をテーマにしてセミナーを企画したいと思っています。私より少し年齢が上の方々が図書館を離れたり、大学や企業を離れたりしています。彼らは、汎用機の漢字入力さえも難しかった時代に、図書館システムに日本語処理という土壌を作り、システムを開発してきました。まだ、関係者とのつながりのあるうちに、これまでの日本における図書館システムと日本語処理を整理しておきたいと思っています。また、システムやデータがどんどん日本固有のものから離れようとしている中で、残していかないといけないものを決めるためにも必要な課題だと思います。これまではどちらかというと、図書館的な話題でしたが、今度は、メーカさん中心の話題になると思います。これから企画していきます。

興味のある方は、ぜひまたご参加ください。また、アイデアがあればお教えください

no. 10 RLG加入について (2003/2/28)

[はじめに]

慶應がRLGの正式メンバーになったので、RLGからのオリエンテーションが4日間開催されました。RLGの概要・プロジェクトの紹介・Z39.50を使った目録データベースと RLG Union Catalogとの紹介・ILL MANAGERとARIELを使ったリソースシヤリングの考え方、アーカイブデータベースとなるCMI(culture material initiative)の紹介が行われました。

この中で、この研究会でも、とりあげないとならないテーマが2つありました。

一つは、Holding schemaの問題提起です。Z39.50もILLを行うためには所蔵の状態を交換しないとだめなようで、実装をすすめているそうです。もう一つは、ILL managerの評価です。Z39.50ClientとISO ILLプロトコルを実装するpeer to peer のILLシステムの有用性と日本語環境での問題点の抽出です。サンプル版を受け取ったので、その評価を行い議論していきたいと思っています。

[ありがとうございました]

慶應が開催しました、RLGオリエンテーションでの特別セッションIIに多数ご参加くださりありがとうございます。この呼びかけは、LIBSYSのメーリングリストと国文学研究資料館で立ち上げていらっしゃる「資源共有化に関する懇談会」のメーリングリストに対して行いました。ご協力ありがとうございました。

この特別セッションの議事内容を簡単に紹介します。

15:00 - 15:05 挨拶
慶應大学メディアセンター本部 事務長 天野
15:05 - 15:30 RLGが推進するZ39.50を使った書誌データの交換
RLG Karen Smith-Yoshimura
(urekaを使った DBDへの接続デモ等)
15:30 - 15:45 TRCからRLGへのデータ提供について
図書館資料整備センター 渡辺太郎
TRCがRLGへデータを提供する経緯を整理しながら今後の方向性についてを説明された。
15:55 - 16:05 LIBSYSでの提案とZ39.50プロファイル
慶應大学医学メディアセンター 酒井 由紀子
(発表原稿掲載)
15:45 - 15:55慶應大学におけるZ39.50の適用とRLG-Keioの接続実験
慶應大学メディアセンター本郡 入江伸
(デモ概要のPowerPoint掲載)
RLGの目録データベースは、ドイツ イギリス オーストラリア等の図書館のデータベースとZ39.50で接続され、書誌データが自由にexportできるようになっている。この分散されたデータベースの中で相互にデータを交換するために、ASCIIベースの標準を尊重しながらも、漢字文化圏で活用できるための標準の提案が必要だと強く感じた。

no. 9 セミナー報告 (2002/1/21)

[セミナーの概要報告]
最初に、森本さんから「北米のカタロガーから見たRLIN搭載のTRCデータに関する問題点」の講演が行われ、その後に、パネリストから発言を受けた。パネリストの最初として、大阪市立大学学術情報センター北先生に、森本さんの指摘する問題点の整理をお願いした。北先生は、目録規則の相違による問題・MARCフォーマットの相違による問題・データ変換での問題・文字コードが違うことによる問題・日本に基準が存在しないことによる問題等、問題点を整理された後に、主題目録の考え方と問題点についてお話になった。

その後に、TRCの渡辺さんに森本さんの問題指摘に対しての回答をお願いした。問題点の多くの部分について、TRCとしての次期計画の中で積極的に取り組んで行きたいという回答をしていただき、プログラム変換での問題が考えられる箇所については、早急に調査するとお答えいただいた。

愛知淑徳大の鹿島さんからは、これからの日本の目録の方向性として、目録データへの件名付与の可能性とLCSH付与の提案をしていただいた。

最後に、慶應大学医学メディアの酒井さんから、第4回研究会で提案した国内での新しい目録作成モデルの提案が行われた。

その後、参加者からの以下のような発言を受けた。

参加者からの発言を聞いても、皆さんが多様な意見を持っていると感じた。特に、北米との基準と異なる部分についてのとらえ方と対応方法については、日本のデータなのだからそれを尊重すべき意見と、北米が国際基準に近い位置にあるのなら、その基準との対応を考えるべきという意見がある。どちらにしろ、国内でのコンセンサス(標準)を確立し、それを公開し提案していく必要があると思われる。このセミナーがその一歩になれればいいと考えている。

[目録データのグローバル化について]
慶應大学メディアセンターにおいて、中国書・韓国語図書の整理はOCLC・RLGを利用して行われている。カレントで購入する中国書は、OCLC・RLGで70%以上ヒットし、データを流用できている。この工程によって、中国語処理は、大幅に処理日数を短縮できている。理由としては、Unicodeが国際的に認知され、いろいろなアプリケーションに適用が進んでいること。北米でEACCからUnicodeへの交換が進みつつあること。(交換テーブルが公開されている。)慶應メディアセンターはMARC21フォーマットで運用していること等が上げられる。

このようにデータ交換は、文字コードレベルで交換が可能になれば、フォーマットレベルまたは、データ作成規則レベルでの国際的な調整が行われ、一層促進されていくものであると思われる。また、そのデータ交換に対して、北米が大きな影響力があるとすれば、それとの調整は欠かせないことになってくる。この作業を欠かしてしまうと、国際的なデータ交換から孤立してしまうことになりかねない。この問題認識は、Z39.50Targetの国内のプロファイル作成でも全く同じであった。

この国際的な調整に対するナショナルセンターの責任は極めて大きいと思うが、可能な範囲で業界全体として取り組む必要のあることだと思う。

[件名目録と遡及について]
書名に、その主題的な内容が記載されている保障は無い。それにも関わらず、OPACの利用ログを見る限りでは書名検索が70%以上を占める。このことからOPACへ期待できることは、ある程度書名を知っている利用者が所在場所を探すために利用することだとも言える。残念ながら、ほとんどの図書館では、主題で検索する手段を利用者に十分提供できていない。

そのようになった原因の一つとして遡及との関係を考えてみた。1990年代は、公立図書館と大学図書館の遡及事業の最盛期であった。公立図書館での遡及は、TRC-MARCの供給モデルが代表的であり、図書カードからTRC-MARCを検索し、ヒットすれば所蔵をつけ、ヒットしなければカードか現物からデータを作成するというものであった。このモデルは、TRC-MARCの拡大とともに、公立図書館では大きなシェアを持っている。以前から、国立国会図書館のJP-MARCが提供されていたが、提供されるタイムラグや遡及事業の遅れ・利用環境の未整備で実際遡及に利用されることは少なかった。

大学図書館では、国立大学の共同利用機関としてNACSISが立ち上げられた。これは、目録を作成していく組織では無く、大学図書館へその環境を提供するものであって、データそのものの責任は、参加している各大学図書館にあった。また、NACSISの持つデータベースは、独自な構造であったので、JP-MARCやTRC-MARCを流用する場合には、人が作業を行う必要があった。

これとは別に、早稲田大学と紀伊国屋の共同事業で行われた遡及事業(BACKWINE)がある。このデータは、DOBISという大学図書館システムと併せて販売され、最盛期には 私立大学で大きなシェアをもった。

[遡及の低価格化の推進]
1980年終わりから1990年始めの和書遡及価格は、安く考えても1500円以上だった。それは書誌ユーティリティを利用する環境が整備されていなかったという原因が大きいと言える。1500-2000円の遡及費用が1990年の終わりには、NACSISを利用した場合で200円を切るまでになっていった。この低価格化は、結果として目録データの品質よりも、データ入力を先行させる政策の結果であった。JP-MARC TRC NACSIS BACKWINE等の相互に関係の薄い書誌ユーティリティが独自に運営されたため、データの品質に寄与することは無かった。この政策によって図書館員の専門性が希薄になり、図書館員の専門性が認められなくなっていく。今後、この過程についての評価を交えながら、これからの目録データ作成モデルを考えていかなければならない。


no. 8 共通フォーマット (2002/12/12)

寒い日が続いています。年末に向け皆様お忙しいと思います。大学図書館は人事的にも予算的にも一層厳しさを増しています。(民間に比べれば、まだまだだと思いますが、大学も図書館もがんばっています。)第5回研究会の時期から、いろいろなところへ呼んでいただく機会ができて、Z39.50だけでは無く、いろいろな話を伺っています。そこで、それぞれグループ(コミュニティー)の立場と考え方を理解し、その上で、共通のフォーマットを作ろうとする努力が始まっているような雰囲気に出会います。これは、危機感を反映した切羽詰まった雰囲気に似たものがありますが、一つの希望だと思っています。

そもそもダブリンコアという概念には、異なったコミュニティー間(図書館・博物館・美術館・文書館・情報システム等々)を乗り越えた、共通のスキーマという考えたかがあったと思います。それは、逆にコミュニティーの持つスキーマ(図書館にとってはMARCでしょうか)については、そのコミュニティーで独自に考えて行かないと行けないということも含まれています。これまで、図書館というコミュニティーが作ってきたMARCという概念は、他のコミュニティーに強制する必要もありませんが、その発展を 停止する必要も無いということだと思います。ただ、他のコミュニティーとの整合性を意識的に維持する必要があるということだと思います。


no. 7 1年が経ちました (2002/11/29)

研究会の活動を初めて1年が過ぎました。はじめに、1年間でまとめようと言っていたZ39.50Targetの日本での推奨プロファイルは、保留事項もありながら、なんとかまとまりそうです。この1年間に多くの方々にご協力いただいてなんとかやって これました。いろいろな方々と知り合えてとても有意義な研究会でした。ほんとうにありがとうございました。

第5回の研究会を明治大学リバティータワーで開催することになりました。お知らせに掲載しました。明治大学図書館の皆様ありがとうございました。今後の研究会の活動についても、今回の研究会で提案いたします。個人的には、1年間の成果をまとめ、次のテーマを決めて行きたいと思っております。皆さんのご意見をお聞かせください。


no. 6 第4回での提案と今後 (2002/9/30)

[はじめに]

第4回研究会は、京都の同志社大学において、東京からも多くの参加者を迎え盛大に開催されました。ありがとうございました。 関西でやりたいと8月のはじめに運営委員会から提案させてもらい、同志社大学の方々に準備をお願いし、出欠の確認を流したのは、8月中になってからでした。すでに、夏期休暇の方も多く、なかなか回答がいただけなくて、どうなることかと思いましたが、50人も集まっていただくことができました。皆さん本当にごめんなさい。ありがとうございました。 同志社の田中課長、上田さん中原さん相原さんほんとうにありがとうございました。

せっかく関西へ伺えるので、休暇を取って図書館へ伺わせていただきました。テーマは2つです

見学記については、次号(11月号)に出させていただきます。

[第4回の提案]

[次回へ向けて]

昨年9月に本研究会の第1回を開催した時は、図書館システムに関係する課題と取り扱うが、1年をめどに以下の活動を行うこととしました。

第3回研究会で推奨プロファイルを公開しています。これについては、次回の研究会までに再度論議し、一応の結論としようと思います。これ以降の研究会の方向性について論議して決める必要があります。


no. 5 Unicode対応 (2002/8/31)

9月20日に研究会関西編を開催いたします。この研究会の主な目的であるZ39.50の実装標準の作成については、前回の推奨プロファイルの提案をベースに実装モデルの開発と普及についての議論が重要になってきます。
(ローマ字の標準化については継続となっていますが。)

関西編では、これまでの提案の整理と広報、実装に向けてのメーカさんの報告を中心に行います。 関西の皆様、ぜひご参加ください。
13:00 - 13:30同志社大学図書館見学(希望者)
13:30 - 13:35開会挨拶 同志社大学
13:35 - 14:00これまでの経過と提案 早稲田大学 金子 昌嗣 さん
14:00 - 16:30講演または事例報告(予定)
平和情報センター 沓澤 尚明 さん
富士通 松永 義昭 さん
インフォコム 鳥越 直寿 さん
慶應 酒井由紀子 さん(日本の書誌データの問題点)
16:30 - 17:00移動
17:00 - 懇親会

折角、関西へ行くので、どなたかに関西のアウトソーシングの現状をお話していただきたいと思っています。

慶應大学では、9月13日から9月16日にサーバリプレースを行います。それにより、内部コードはUnicodeになる予定です。Unicodeの漢字の並び順は、JISコードとは全く異なるため、理屈ではわかっていても、なじみにくいものとなってしまいます。それを回避するため、OPACでの一覧表示のソートは、ヨミによって行うように対応しました。 また、かな・カタカナのインデックスでは半角文字を使っていたために、文字コードでソートすると、漢字とカナの順番が逆転してしまうことになったので、通常の全角のカナに割り当てることにしました。試行錯誤しながらの作業です。

Unicodeで日本語処理をするためには、きちんとした日本語処理層(ソート・異体字等)を 開発しないと、使い勝手がいいものにならないと思っています。


no. 4 サーバリプレース (2002/7/31)

慶應の図書館システムサーバのリプレースを9月に向けて行います。そのため、8月10日から9月20日まで、接続が不安定になります。ご迷惑をおかけします。(その期に皆様に指摘されている障害の対応をしようかと思っております。) 今回のサーバリプレースは、Webサービスへの対応と安定性の向上を目指しています。

<Webサービスへの対応>
WebOPACやそれと接続する各種サービスの広がりはとどまることを知らずに成長しています。ISIとOPACのリンクをはじめとして、いろいろな可能性が考えられます。ところが、1月、5月、7月、11月のアクセスピーク時には、サーバが過負荷状態になり、どうしようも無くてリブートを繰り返す日々が続きます。その時期のアクセス量は、HTTPで1時間に1万回近くに達します。HTTPレベルはたいしたことはないのですが、検索エンジンが大変です。昼からOPAC検索エンジンが火をふいて爆発している絵が頭の中で走り回ります。

<安定性の向上>
慶應の図書館システムは、不眠不休の医学部や、夜の遅い藤沢キャンパスの図書館を含んでいるので、大手を振ってサーバを止められるのは、12月30日から1月3日までです。停電やサーバ障害でシステムが停止すると大変なことになってしまいます。ハードウエアの完全2重化は緊急の問題となってきました。

また、このサーバリプレースにより、Z39.50Targetは運用システムとしてサービスを開始する予定です。


no. 3 Traget情報 (2002/6/30)

今月初めに、National University of Singapore Library Automation Department の方からWeb master宛に、Z39.50 Targetの公開依頼がありました。

はじめに接続情報として

  1. Database name : KOSMOS
  2. IP address & Port Number: 131.113.194.17 9900 (character set UTF8)
  3. Services: search, present
  4. Use Attributes: 4,7,8,21,1003,1018

を送りましたが、なかなかうまく検索ができない状態が続きました。

クライアント側のテストアトリビュートです。
We have set the use attributes as follow:
06 > AUTHOR (a): 1:1003, 2:3, 3:1, 4:1, 5:1, 6:1
07 > TITLE (t): 1:4, 2:3, 3:1, 4:1, 5:1, 6:1
08 > SUBJECT (s): 1:21, 2:3, 3:1, 4:1, 5:1, 6:1
09 > WORD (w): 1:1018, 2:3, 3:1, 4:1, 5:1, 6:1
10 > ISBN (j): 1:7, 2:3, 3:1, 4:1, 5:1, 6:1
11 > ISSN (i): 1:8, 2:3, 3:1, 4:1, 5:1, 6:1

それで、丸善の佐藤さん・新日鐵の橋本さん・富士通の松永さんに確認を お願いしました。

その結果 Position が指定されていると慶應のターゲットがエラーで返していることがわかりました。その理屈は、日本語の場合は、Position がANYしか無いので、対応をしていないということで、指定しているとエラーとしてということです。それでは、困るので、サポートしていなくて指定されて時は、指定を無視してデフォルトで動くようにしました。

最近は、中国語圏では、そのような動きが多いですので、何らかの対応が必要だと痛感しました。


no. 2 RLG訪問 (2002/5/2)

2月中旬、出張でRLGへ行ってきました。大学図書館としての目的とは別に、Z39.50の評価とILLシステムについての質問があったので、よい機会に恵まれました。文字コード / ILLシステムコンセプト / XML MARC / メタデータフォーマットなど多くのセッションを持ってきました。

私の勘違いもあるかもしれませんが、RLGというのは、リサーチライブラリーのコンサルテーション機能を持っていて、大学の中にいては手を出しにくい問題を持ち寄り、問題解決に当たるという組織のように思えました。そして、その延長にシステム的な機能を持っているようです。

日頃の作業の中で、いろんな問題が発生します。その多くが、単独の機関では解決できない問題です。そのような問題は、本質的な解決の入り口にも立てずに、そのまま忘れ去られてしまいます。本質的な解決に向けて独自に活動する組織の必要性を強く感じます。

話は変わりますが、最近、いくつかの書店さんが中国・韓国・ロシア・アジア各国のMARCデータを紹介してくれます。各国とも基本的には、MARC21対応になっていますが、ほとんどが880を使わずに245に自国語を記載しています。国際基準に合わそうという気持ちと、合わせられないという悩みがとてもよく理解できます。「国際標準」とは難しいものです。それでも、各国とも書誌データは国際的流通データという認識はあるようです。日本も書誌データの国際流通政策を明確にしなければならない時期にきています。


no. 1 会の趣旨 (2001/10/9)

大学図書館の業務はここ数年、大きな変革のなかにあります。大学図書館界も大学再編の中にあって、リストラや図書費の削減等の要求をうけ、各大学図書館の業務的な協力体制を作り上げることが今までにも増して重要になってきています。

あらゆる分野でグローバリゼーションの流れはとどまることを知らず、日本全体を押し流しています。これまで日本語という障壁のために独自な展開が許されてきた図書館システムが、このグローバリゼーションという波に飲み込まれるのも時間の問題となっています。

図書館システムもNIIの共同目録やILLシステムの普及によりパッケージ化が大きく進みながらも、グローバリゼーションと図書館業務の協力体制への対応が急務となっています。 図書館の業務協力を前提としたシステムを作るには、業務的な標準設定を見据えて活動を進めていかなければなりません。

Z39.50にしても、業務的に標準化しなけらばならない部分は多く残されています。これまで、この業務標準を大学の枠を越えて論議できる場所はありませんでした。また、この論議は図書館の中だけでなく、システム開発者の意見も取り入れたものでなければなりません。そこで、個人参加を基本とした緩やかなグループを作り、業務的な情報交換をしたいと考えました。

この研究会の成果が、実際の標準になるかどうかは、この研究会の内容にかかっていると思います。 具体的な標準化の課題は、システム外部インターフェース部分として以下のように設定します。

    Z39.50の普及とインターフェースに伴う事項
    インターフェースの範囲でMARCフォーマットの標準化も含みます。

    多言語環境 特に文字コードについて
    図書館システムにとって文字コードは土台のようなものです。業務的に検討しなければならない問題が山済みです。

    その他
    図書館システムの標準化に関係があれば、この課題にこだわるものではありません。

本研究会の会議によって論議の土台を作り、メーリングリストで具体的な論議を進めていきたいと思います。加えて、本研究会のホームページを運営し、各大学やメーカの取組の状況やOCLC・RLGの動向をお知らせいたします。