近期,被称为“影子图书馆”的安娜的档案(Anna‘s Archive)再次陷入法律漩涡,而这次的对手是整个出版行业。
根据 torrentfreak 的报道,包括企鹅兰登书屋(Penguin Random House)、爱思唯尔(Elsevier)和哈珀柯林斯(HarperCollins)在内的 13家大型出版商 已联合向美国纽约南区地方法院提起诉讼。他们指控安娜的档案侵犯版权,并寻求新的禁令,意图向域名注册商和注册管理机构施压,以彻底关闭这个网站。

事件背景回顾
安娜的档案在2026年开年以来已经历了一系列波折:
- 2025年12月:据报道,安娜的档案抓取了高达300TB、共计8600万个音乐文件的数据。
- 2026年1月26日:Spotify、索尼、华纳等音乐巨头联合起诉,直接导致其.org域名被下架。
- 2026年2月13日:尽管面临诉讼,平台仍被指“发布”了数百万首来自Spotify的音乐文件。
在接连失去 .org、.se、.li 等域名后,安娜的档案一度启用了 .VG、.PK、.GD 等新域名作为替代,但 .VG 域名很快也被暂停。目前,其可用域名处于不稳定状态。
核心指控:6300万册盗版图书与9500万篇论文
继音乐行业的诉讼后,出版商的诉状将矛头直指安娜的档案的核心资源库。诉状称,该平台存储了约 6300万册图书 和 9500万篇学术论文,其中绝大部分内容属于未经授权的盗版,严重侵犯了出版商的版权。

民事诉讼文件截图,列出了13家原告出版商
诉状中有一句引人注目的描述,揭示了运营者的态度:
“Defendants shamelessly describe themselves as a collection of ‘pirates’ not ‘bound by the law’.”
(被告毫不避讳地把自己称作一群“不受法律约束”的“海盗”。)
平台影响力数据披露
诉讼文件及安娜的档案自身披露的数据,揭示了这个“影子图书馆”惊人的规模与活跃度:
- 资源规模:6300万册图书 + 9500万篇论文。
- 访问流量:过去30天内,日均下载量达76.3万次,相当于每小时3.2万次。
- 商业价值:在与一名咨询AI训练数据集价格的研究人员邮件往来中,安娜的档案曾报价20万美元,以提供其全部数据的高级访问权限,这使其成为了潜在的大模型训练数据源,总计约 1.4亿文本。

安娜的档案网站展示的过去30天每小时下载量趋势图
1950万美元的赔偿诉求
出版商在诉讼中提出了具体的金钱赔偿要求。他们列举了 130部 明确受版权保护的作品,并主张按照每部作品最高 15万美元 的法定赔偿金计算。据此,出版商寻求的赔偿总额最高可达 1950万美元。
不过,由于安娜的档案的实际运营者身份隐匿,难以联系,外界普遍认为出版商最终获得这笔巨额赔偿的可能性较低。
寻求全面的新禁令
除了经济赔偿,出版商更重要的诉求是获得一项全面的法院禁令,以期从根源上瓦解安娜的档案的运营。其请求包括:
- 命令被告立即停止所有侵权行为。
- 命令被告销毁其持有的所有侵权图书和论文副本。
- 要求第三方服务提供商停止为安娜的档案提供服务,具体指向:
目前,法院尚未对这份禁令请求作出裁决。
相关诉讼文件
根据报道,出版商提交的诉讼文件副本可公开获取:
这场诉讼是数字时代版权保护与信息自由获取之间矛盾的又一次激烈碰撞。安娜的档案的命运,以及此案对类似平台和未来AI训练数据来源的影响,值得持续关注。关于技术伦理、法律边界的更多讨论,欢迎在云栈社区的开发者广场参与交流。
原文链接:https://www.appinn.com/annas-archive-13-publishers/
|