「社会学教育委員会企画テーマセッション「質的データのアーカイブ」」

https://jss-sociology.org/other/20220829post-13244/#t10

---


2022/11/12 日本社会学会発表 「質的データのアーカイブ」 山口発表資料

本邦においてウェブ・アーカイブズはいかに可能か

――「社会運動のウェブ・アーカイブズ構築」試論

山口 和紀(立命館大学先端総合学術研究科)



内容

  • 本報告の目的
  • 現状の問題点
  • 概念の整理
  • 事例の紹介
  • 考察
  • 「集める」ことの問題の整理
  • 「公開する」ことの問題の整理
  • まとめ:本邦においてWAはいかにして可能か

現状の問題点

日々、ウェブ上の記録が消失している。ex.中井報告/光野報告

その消失しつつある記録を残す手立てがない。


本報告の目的

では、どのようにすればウェブ上の記録を残すことができるのか。

そのおおまかな道筋を「集める」/「公開する」に分けて考察する。


概念の整理

そもそも、ウェブアーカイブズとはなにか。


概念の整理――3つのアーカイブ

アーカイブはその収集・保存の特性から3つに大別することができる。

  1. (紙媒体の)アーカイブズ
  2. デジタルアーカイブズ
  3. ウェブアーカイブズ

本報告が検討する範囲は 「ウェブアーカイブズ」 のみである。

では、これらは何が異なるのか。


概念の整理――何が違うのか

  1. アーカイブ

アナログ媒体を集め、アナログ媒体として保存し、公開する。
例えば、紙を集めて、紙として保存し、紙として公開する場合を指す。

  1. デジタルアーカイブ

アナログ媒体を集め、デジタル媒体に変換して保存し、公開する。
例えば、紙をスキャンして、画像データに変換し、公開する。

  1. ウェブアーカイブ

(もともとウェブ上での利用が想定された)デジタル媒体を集め、デジタル媒体として保存し、公開する。
例えば、SNSの投稿を集め、データとして保存し、それを公開する。


光野さんの報告を受けて

ウェブの資料と言うのは、そのコミュニティーの中でどうやって扱うのか、これから議論していくことだという点があるかと思います。それはこの報告の軸になっていて、すごく興味深いと思いました。

「やっぱり消したい」みたいなものをどう扱うか。


概念の整理

つまり:

ウェブアーカイブズは「ボーンデジタル(born digital)」資料を対象とするアーカイブである。

とくに、最初からウェブ上での公開を前提としているような資料・データを扱うことを指す場合が多い。


事例

Wayback Machine

米国の非営利組織「Internet Archive」の提供するウェブアーカイブ。世界中でもっとも知られたウェブアーカイブのひとつ。

WARP事業

日本の国立国会図書館が行う事業「国立国会図書館インターネット資料保存事業」のこと。「Web Archiving Project」の頭文字を取ってWARP。


Wayback Machine


特徴

米国のウェブアーカイブである。主体は非営利組織であるInternet Archiveである。

著作権者の 許諾を得ずにデータを「集め」、許諾を得ずに「公開」 している。

この強引とも言いうる手法は、米国著作権法に定める「フェアユース(fair use)」原則が支えている(塩崎 [2019:4])。

=> フェアユースによる著作権者の同意を得ない「収集」と「公開」が特徴


フェアユースとは

「(著作権者には著作物に対する独占的排他権があるとした上で=報告者)しかし、反面、この独占的排他権は絶対的な権利ではなく、社会・文化の発展に寄与するうえで、社会的公正の範囲で制限が加えられてしかるべきであると考えられる。つまり、「公正な使用(フェア・ユース)」という、ユーザーが著作者の承諾なしに著作物を使用できる範囲を法的に規定したのがフェア・ユースの法理(fair use doctorine)である。」(東[1999:67])

=> Wayback Machineは(米国著作権法上の)フェアユース原則に則って、同意を得ない収集・公開をしているとしている。


国境や著作権者は無関係である

Wayback Machineは原則的に、国や著作権者がどのような者であるかは無関係にデータを収集し、かつ公開している。

アーカイブされたくない場合には、掲載を中止させることができる(Opt-out)。これはアーカイブされたくない側が、その意思を示すコストを払うということでもある。


これに対する理解

アメリカ議会上院は消失の大きな危険性(the great danger of loss)を考えると「アーカイブ保存を目的とした複製物の作成は、たしかに『フェアユース』の範囲に入る(falls within the scope of ‘fair use’)」としている(Hirtle [2003:101])。


WARP事業


特徴

(日本の)国立国会図書館にもとづくウェブアーカイブ。

著作権者の許諾なしに収集・公開を行っている。

ただし、その対象は 「公的機関(およびそれに準じる機関)」のみ である。

*WARPは許諾を得て民間の資料もアーカイブしているが、規模は小さい。


Wayback Machineとの異同

許諾なしの収集・公開という点は同じである。

しかし、WARPは「公的機関」のみにその対象を制限されており、民間のデータは許諾なしの収集・公開の対象になっていない。


考察

ここでは便宜的に「集める」と「公開する」に分けて、現状の問題点を整理する。


集める


同意を得て集める

著作権者の同意(許諾)があれば、その著作物を保存することに問題は生じない。

しかし、いちいちすべての著作物の著作権者から同意を取っていたのでは、ウェブアーカイブズはほとんど成り立たない。

すくなくとも、この膨大に増え続けるウェブ上のデータに対して、いちいち同意を取ることはアーカイブズ側の支払うコストが大きすぎる。そのために極々限られた範囲でしか、集めることができなくなる。


同意を得ずに集める

同意を得ずに集めることができれば、「集める」においては良い。

しかし、日本の法律においては限られた範囲でしかできない(ようである)。

国立国会図書館法(および著作権法)には、国立国会図書館が事業として実施する「インターネット資料の収集」は著作権者の許諾なしに記録媒体への保存が可能と定められている。しかし、その範囲は公的機関とそれに準ずる機関に限られる。


「集める」ことの論点

(当たり前のように思われるかもしれないが)

どのように公開するのか 以前の問題として、
ウェブアーカイブズ機関が、著作権者の許諾なしにウェブ上の資料を保存(複製)することが可能になる必要がある。


仮に国立国会図書館がウェブアーカイブをするならば

国立国会図書館は現在、事業としてウェブアーカイブズを構築している*。これは基本的には「公的機関(+それに準ずる機関」)を対象とするものである。

公的機関に限って許諾を得ずに「集める」ことが法的に可能になっているためである。民間のデータは許諾無しには「集める」ことができない。

仮にNDLによるアーカイブを広げていくのであれば、「公的機関」以外の資料も許諾無しに国立国会図書館が「集める」ことができるようにする必要がある。

*. 国立国会図書館インターネット資料保存事業(通称、WARP事業)は、民間のデータに関しては許諾を得て収集・公開している。


公開する


同意を得て公開する

「集める」ことができたとして、「公開する」ことができるかはまた別の問題である。

「公開する」ことに関しても、一つひとつの許諾を取っていたとすれば、そのコストは極めて大きなものになる。

それでは残されるべきデータのごく一部しか残されない。

一つひとつ許諾を得てアーカイブする方向性を広げることも策ではある。しかし、それではごく一部しか残らない。


勝手に集めて勝手に公開する

事例でみたように、Wayback Machineは有り体に言えば「勝手に集めて、勝手に公開」している。

これが法律上(あるいはその解釈上)で可能になれば、ウェブアーカイブズの構築は容易である。

「勝手に集めて勝手に公開する」ことができるように国内法を整備る。これは有りうる方向性である。


「公開する」の論点

方向性は2つある。

  • 一つひとつ許諾を得て公開する
  • 勝手に集めて勝手に公開する

このどちらを日本が社会として推進するのか。


まとめ

本邦においてウェブアーカイブはいかにして可能か


1. ごく小規模のウェブアーカイブを作る

許諾をひとつひとつ得ながら、ごく小さな規模のウェブアーカイブを構築する*。

*現状のWARP事業が行っている民間のインターネット資料のアーカイブはこれに当たるだろう。


2. 法律(あるいはその解釈)を変え、許諾なしの収集・公開を可能にする

現状では、「公的機関」を除いては、許諾なしの収集・公開は行えないようである。

許諾なしに収集・公開が可能な範囲を広げることが必要ではないか。この議論を、社会として、していく必要がある。許諾なしに収集・公開されれば、それによる損害も生じうるからだ。

そこで生じる損と得をどのように評価するかは社会として考える必要がある。


3. 米国でできるのだから、米国でやればよい。

Wayback Machineは、その著作物が作成された国*は関係なくアーカイブしている。ゆえに、日本語で書かれたホームページも膨大な数がアーカイブされている。

日本のインターネット資料を集めることを日本でやらなければならないという必然性はない。米国でできるのだから、米国でやる。この作戦もあるし、すでにそうなっているとも言いうる。

*それを厳密に定めることができないが、便宜的な表現として。


文献

  • 東 泰正 1999 「インターネットに関する著作権侵害とフェア・ユース原則の適用について」, 帝京短期大学紀要, (11), 67-74.
  • 塩崎 亮 2019 「日本の大学ウェブサイトのアーカイブ状況: Internet Archive と WARP の比較」, 聖学院大学総合研究所Newsletter, 29(2), 4-10.
  • 山口 和紀 2022a 「社会運動のウェブアーカイブス構築に向けた試論――SNS 運動の何を選び残そうとするのか」,『遡航』3:27-40.
  • 山口 和紀 2022b 「ウェブアーカイブの公開を支える法律と仕組み――社会運動のウェブアーカイブズ構築に向けて」, 『遡航』4.
  • PB Hirtle 2009 「Copyright and Cultural Institutions」.

紹介

本報告で発表したことの詳細な議論は、山口[2022a]および山口[2022b]で行っています。

『遡航』にて読むことができます→ http://aru.official.jp/m/index.htm

投稿日:2022/11/12

修正日:2022/11/12