インターネットアーカイブが無料の電子書籍プログラムを2週間前倒しで終了、出版社からの訴訟を受け

National Emergency Library(NEL、全国非常時図書館)は、最終的に反発を招く運命となった多くの善意に基づくアイデアのひとつだ。これはInternet Archive(IA、インターネットアーカイブ)の発案によるプラットフォームで、130万冊を超える本を無料で借りることができる。新型コロナウイルス(COVID-19)のパンデミックにより全国の図書館が閉鎖されていたために、このシステムは教育者の本のニーズを補うようにデザインされていた。

その一方で出版社はそれを良しとしなかった。2020年6月初めに、出版社4社によるコンソーシアムがインターネットアーカイブに対して訴訟を起こした。「『オープン・ライブラリ』という名称にもかかわらず、インターネットアーカイブの行為は合法的な図書館サービスを大幅に上回り、著作権法を踏みにじり、産業規模で故意にデジタル著作権侵害を構成しています」とHachette(アシェット)、HarperCollins(ハーパーコリンズ)、Wiley(ワイリー)、Penguin Random House(ペンギン・ランダムハウス)の4社はニューヨーク連邦裁判所宛の訴状に書いている。

その脅しだけで十分だった。インターネットアーカイブは米国時間6月12日、ライブラリが米国時間6月15日に閉鎖されると発表した。これはもともと閉鎖を予定していた6月30日よりも2週間早い日付だ。

「この苦情は、デジタルブックを所有およびそれを貸し出すという図書館の概念全般を攻撃し、図書館がデジタルの世界でどのようなものかという、考えそのものに異議を唱えているのです」とインターネットアーカイブは述べている。「この訴訟は当初NELについて懸念を表明したものの、最終的には私たちと協力して物理的な学校や図書館から切り離された人びとに、アクセスを提供することを決定した一部の学術出版社たちとは対照的なものです。私たちは、ここでも同様の協力が可能であること、そして出版社たちが費用のかかる攻撃を中止することを望んでいます」。

インターネットアーカイブはさらに、このサービスを利用したすべての教育者や、それを利用して最前線で働く労働者たちに健康維持マニュアルを提供している司書の言葉を引用している。しかしそうした美談を前にしても、出版社たちがひるむことはなかった。訴訟を起こした出版社たちは、特にインターネットアーカイブがライセンス料を払わないことや、従来の図書館と合意してきた制限を欠いていることを問題にしている。

それは出版社たちがインターネットアーカイブに対して抱いてきた長年の不満であり、ついには「産業規模で故意にデジタル著作権侵害」を構成しているとまで言わしめたものなのだ。最終的には、数週間早く店仕舞をすることが最も抵抗が少ない道だったようだ。だがインターネットアーカイブはその投稿を、将来のコラボレーションに含みを残しつつ締めくくっている。「役に立つデジタルシステムをともに作り上げていきましょう」と。

原文へ

(翻訳:sako)

MySpaceの大規模データ喪失の前に集めた45万曲をInternet Archiveがアップロード

先月、MySpaceが2016年よりも前までにアップロードされたユーザーデータの大半を失ったことが露呈した。その中には、2003年から2015年までの、おそらく数百万曲はあると思われる音楽もある。これは、このサイトをもう利用していないユーザーにとっても、いつまでもあるのが当たり前と思っていた人たちには大きな損失だ。それはソーシャルメディアといえばMySpaceと言われた時代から今日までのネット上のスクラップブックみたいなもので、利用者の中には一般消費者だけでなく自分の作品をMySpace上で宣伝していたミュージシャンもいる。しかしInternet ArchiveがホストしているMP3のコレクションで、失われた音楽と(そして思い出を)取り返すユーザーがいるかもしれない。

【Internet ArchiveからのMySpaceコレクションの通知】

そのコレクションはMySpace Music Dragon Hoardと名付けられ、45万曲が収まっている。失われた音楽は、推計によると1400万人のアーティストの5300万曲と言われているから、45万人は微々たる量だが、有名アーティストの初期の作品もある。Twitterのユーザー@pinkpushpopが見つけたのは、Donald GloverやKaty Perryなどだった(下図)。

【よそでは絶対見つからないのもあるわ】

Internet ArchiveのJason Scott氏によるTwitterのこの投稿によると、このコレクションを編纂したのは「匿名の研究者グループで、これまで彼らは音楽ネットワークについて研究し、その過程で1.3TBのmp3を2008年から2010年にかけてのMySpaceを調べるために集めた」。そしてデータ喪失を知った彼らは、そのコレクションをScott氏に提供した。

喪失はデータのマイグレーションの間に起きたようだが、MySpaceはその状況について口を閉ざしている。だから、データ喪失は偶発的ではなかった(故意だった)と思わざるをえない。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

Wikipedia上の壊れたリンク(ページが存在しないリンク)をInternet Archiveらの努力で大量に修復

【抄訳】
Webは、脆(もろ)い場所だということがわかってきた。企業や政府機関や教育機関や個人や団体が、しょっちゅう、サイトを立てたり下ろしたりしている。でも問題は、Webが記録のシステムになってることだ。だからページが存在せずリンクが切れていたら、その記録が得られない。そこで、多くのWebページを永久保存しているボランティアサイトInternet ArchiveとWikipediaが協力して、900万の壊れたリンクを生き返らせ、わずかひとつのナレッジベースではあるけれども、この問題を解決した。

Internet Archiveは、できるかぎり多くのWebサイトのコピーを作り保存して、Webのアーカイブ(‘文書館’)を作っている。なくなったページのリンク(URL)が分かっているときは、Internet ArchiveのアーカイブWayback Machineで3380億ページのWebページを検索できる。そこには、World Wide Webの草創期からのページがある。ただし問題は、現状ではリンクのURLが正確に分かってないと探せないことだ。

しかしWikipediaのページ上の壊れたリンクは、ページのソースにそのリンクのURLが当然ある。WikipediaのコントリビューターMaximilian Doerrが、ソフトウェアの力で、その壊れたリンクの問題を解決した。彼は、Internet Archive botを略したIAbotというプログラムを作った。Internet Archiveがもう一人クレジットしているStephen Balbachは、DoerrとInternet Archiveに協力して、Wikipediaのアーカイブを調べ、データエラーを修復するプログラムを書いた。

まず、IAbotが壊れたリンクを見つけた。そういうページは、404 “page not found”、というエラーを返す。見つかった壊れたリンクをBalbachのプログラムがInternet Archiveで検索し、それがアーカイブにあったら、アーカイブのリンクに置き換える。物理的には同じページではないが、コピーだから内容は同じ…コピーを作った時点のまま…だ。

これで、死んだリンクが生き返る。

これまでの3年間で彼らのソフトウェアは、22のWikipediaサイトの600万のリンクを蘇生した。またWikipediaのボランティアたちは、手作業で300万のリンクを修復した。驚異的な作業量だが、おかげでWebのWebらしさが維持され、監査証跡も得られる。

このプロジェクトの結果を発表するブログ記事でInternet Archiveは、Wikipediaのユーザーが最近10日間にクリックしたリンクについて報告している。それによると、クリックの相当数がInternet Archiveのページだった(下図)。Wikipediaの壊れたリンクを直したことには、大きな効果があったのだ。

〔クリック数のグラフ: グラフのいちばん下の圧倒的に長い棒がアーカイブ、そのすぐ上はbooks.google.com〕

グラフ提供: Internet Archive

【後略】

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

プライバシーとセキュリティの確実な保護はWebのアーキテクチャの改築(非集中化)で可能、と大御所Brewster Kahleが主張

[筆者: Andrew Keen](著書(3冊): Cult of the Amateur, Digital Vertigo, The Internet Is Not The Answer。 Futurecastをプロデュース。本誌インタビューシリーズKeen Onのホスト。)

インターネットを巨大な図書館に例えるならBrewster Kahle日本語Wikipedia)はそのもっとも有名な司書で、インターネットの殿堂(Internet Hall of Fame)のメンバーでもある。彼は、今こそ、もっと良いWeb(a better Web)を築くべき時だ、と信じている。

彼によると、問題は、今のインターネットにプライバシーと安全性がないことだ。そこで、彼が書いた白書のタイトルが、“Locking the Web Open: A Call for a Decentralized Web”(オープンなWebの堅守: 非集中的Webの要求)で、今やWebを改築してユーザーのプライバシーとセキュリティの両方を確実に保証すべきだ、と論じている。

6月に彼はサンフランシスコで、同じく殿堂入りしているTim Berners-LeeVint Cerfなど高名な志士たち集めて、新しいミッションを立ち上げた。KahleがかつてローンチしたInternet ArchiveのWayback Machineには、およそ5000億ページのWebページが保存され一般公開されているが、そんな彼の視点としては、必要とされているWebの大刷新は、決して、商業化する前の初期的な姿のインターネットに戻ることではない。

彼によると、技術の進歩により今では、Webサイトを“至るところに”、そして“場所を特定せずに/されずに”ホストできる。さらに彼によると、今の技術なら、公共的なインターネットと商業的なインターネットの両方が、ユーザーを自分の目的のために利用するのではなく、むしろユーザーを保護できる。彼はスタートアップの起業家たちにも、彼のミッションへの参加を呼びかけている。

いつものように、このインタビューをセットアップしてくれたCALinnovatesに感謝したい。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Internet Archiveが昔のAmigaゲーム1万本あまりをWebに移植

screen-shot-2016-08-08-at-3-48-06-pm

月曜日(米国時間8/8)にこんなニュースを読まされるなんて、人によっては今週は長い週になるね。でも大丈夫、このサイトはどこにも行かないから。待ちきれずに、職場の仕事用のコンピューターでBubble Bobbleなんかを内緒でプレイしたら、ボスに見つかって叱られるかもよ(おっと、ぼくの経験では、この場合ブラウザーは、Firefoxがベストだね)。

最近Archive.orgにポストされたAmigaのゲームは、質よりも量、同サイトによると、10000種以上ある。その中には人気作、Where in the World is Carmen San Diego、King’s QuestDouble Dragonなどもある。一方、ゴミもたくさんあるようだ。Deluxe Pac Man v1.1があって、さらにDeluxe Pac Man v1.7aがある。大きな違いはない、と思うけどねぇ。

ゲームのクォリティーは、それこそピンからキリまでだから、それらのリストをざっと眺めるだけでもおもしろい。土曜まで待ちきれない人は、仕事をするふりをしながら、こっそりとお楽しみを。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

TwitterがツイートへのMS-DOSゲームの埋め込みを禁止

screen-shot-2015-05-04-at-11-58-49-am

Internet ArchiveがホストしているすべてのMS-DOSゲームをツイートに埋め込んで、Twitterの公式のWebクライアントでプレイできる、という新発見の機能が、今日から消える。その機能はTwitterのCards機能を利用していたが、Twitterの埋め込みビデオプレーヤーに完全なゲームのまるまる全体を置くことは同社のサービス規約に違反していた。

それは楽しい機能だったから、このソーシャルネットワークのエンゲージメントをかなり高め、そのためにしばらく黙認されたのだろう。でもThe Guardianの特ダネ記事によると、パーティーは終わった。規約違反であることはかなり明らかだから、閉鎖も当然だ。つまらないし、廃止は誰のプラスにもならないと思うけどね。

でもゲームはArchive.orgでプレイできるから大丈夫だし、自分のWebサイトやブログにゲームを埋め込むのも簡単だ。たとえば、下の例のように:

〔訳注: ここにゲームがない場合は、原文へ行ってください。〕

[原文へ]
(翻訳:iwatani(a.k.a. hiwa