2026/1/22 9:33:04
网站建设
项目流程
高校学风建设专栏网站,网站建设与规划总结怎么写,广东卫视你会怎么做网站,上海最大的企业全球最大的影子图书馆Annas Archive在本周末震惊互联网#xff0c;宣布已备份Spotify并开始通过种子文件大规模分发300TB的元数据和音乐文件。这个日益受到AI开发者资助的平台此举引发广泛关注。据Annas Archive称#xff0c;此次数据获取涵盖了Spotify上超过99%…全球最大的影子图书馆Annas Archive在本周末震惊互联网宣布已备份Spotify并开始通过种子文件大规模分发300TB的元数据和音乐文件。这个日益受到AI开发者资助的平台此举引发广泛关注。据Annas Archive称此次数据获取涵盖了Spotify上超过99%的播放内容形成了拥有2.56亿首歌曲的最大公开音乐元数据库。该档案库还声称这是全球首个完全开放的音乐保存档案包含8600万个音乐文件。这些音乐文件据称约占2025年7月Spotify可用歌曲的37%。抓取的文件按照受欢迎程度进行了优先排序Annas Archive过滤掉了许多从未被播放或质量较差的歌曲比如AI生成的歌曲。Spotify在周一告诉Android Authority正在调查Annas Archive是否确实如其博客所声称的那样大规模抓取了其平台。针对未经授权访问的调查发现第三方抓取了公共元数据并使用非法手段绕过数字版权管理来访问平台的部分音频文件Spotify表示。我们正在积极调查此事件。目前尚不清楚实际抓取了多少Spotify数据Android Authority指出也不确定该公司是否可能采取法律行动来删除这些种子文件。当被要求评论时Spotify发言人告诉ArsSpotify已经识别并禁用了参与非法抓取的恶意用户账户。对于Annas Archive来说在一段时间前偶然发现了大规模抓取Spotify的方法后抓取数据的诱惑可能太大了。我们看到自己在这里的作用是建立一个主要以保存为目标的音乐档案库该档案库表示。抓取Spotify数据是一个很好的开始他们说目标是建立一个旨在代表所有音乐作品的权威种子列表。该档案库表示这样的列表在音乐领域并不存在类似于LibGen——这个被Meta等科技巨头和Anthropic等初创公司恶名昭彰地用来盗版书籍数据集以训练AI的平台。Annas Archive表示12月发布元数据种子是实现这一保存使命的第一步。接下来该档案库将发布音乐文件的种子首先从最受欢迎的流媒体开始然后最终发布不太受欢迎歌曲和专辑封面的种子。博客中说未来如果有足够的兴趣我们可以在Annas Archive中添加单个文件的下载功能。Spotify告诉Ars正在采取措施避免未来的任何抓取行为。我们已经为这类反版权攻击实施了新的保障措施并正在积极监控可疑行为Spotify发言人说。从第一天起我们就与艺术家社区一起反对盗版我们正在积极与行业合作伙伴合作保护创作者并维护他们的权利。用户担心数据抓取将毁掉档案库Annas Archive声称抓取Spotify数据是为了帮助保存人类的音乐遗产永远保护它免受自然灾害、战争、预算削减和其他灾难的破坏。然而一些Annas Archive的粉丝——他们主要使用该搜索引擎查找书籍、学术论文和杂志文章——对Spotify数据被抓取的消息感到震惊。在Hacker News上一些用户质疑这些数据是否对AI研究人员以外的任何人有用因为在大量种子中搜索单个歌曲对音乐爱好者来说似乎不切实际。一位用户指出已经有工具可以自动定位和流式传输盗版电视和电影内容——这表明音乐爱好者可能会找到流式传输这些数据的方法。但其他人担心Annas Archive可能被诱导去抓取Spotify可能承担了那些倾向于模糊其训练数据来源的AI公司希望避免的法律风险。这太疯狂了一位热门评论者写道。绝对想知道这是否是对希望获得这些资料的AI研究人员/公司需求的回应。或者主要唱片公司是否已经廉价地许可其整个目录用于训练目的所以这真的只是纯粹作为保存努力但Annas Archive显然在努力支持AI开发者另一位用户指出Annas Archive推广向企业级大语言模型数据销售高速访问包括未发布的集合。该档案库在其网页上建议任何人都可以捐赠数万美元来获得这种访问权限任何有兴趣的AI研究人员都可以联系讨论我们如何合作。AI可能不是他们原始/主要的动机但他们显然支持促进AI实验室的盗版最大化第三位评论者建议。与此同时在Reddit上一些人担心Annas Archive可能因为抓取数据而注定了自己的命运。对他们来说在看到互联网档案库努力在去年以保密和解结束的唱片公司法律攻击中生存后档案库似乎只是让自己成为目标。我对AA把这个目标背在自己身上感到愤怒一位Reddit用户在一个宣布这次Spotify黑客行为只会毁掉真正重要的文学档案库的帖子上写道。随着Annas Archive粉丝的情绪螺旋式下降甚至有人提出阴谋论认为该档案库只是为AI兄弟们做的他们是在幕后付费支撑档案库运行的人。Ars无法立即联系到Annas Archive就用户的担忧或Spotify的调查发表评论。在Reddit上一位用户对档案库设计为抗打击的事实感到安慰这可能防止法律行动真正毁掉档案库。域名之类的可以消失当然但核心软件和其数据可以一次又一次地重新浮出水面该用户解释说。但并非所有人都相信Annas Archive能够在如此明目张胆地种子Spotify大量数据后生存下来。这就像说泰坦尼克号不会沉没该用户警告说暗示如果Spotify引发的下架不断让下载受挫Annas Archive可能会失去捐赠。当然理论上数据确实可以一次又一次地重新浮现但每次这样做都需要金钱和资源而这些是有限的。在人们放弃之前他们愿意做多少次呢QAQ1Annas Archive是什么为什么要抓取Spotify数据AAnnas Archive是全球最大的影子图书馆声称此次抓取Spotify的300TB数据是为了保存人类的音乐遗产建立一个包含所有音乐作品的权威档案库防止这些文化资产因自然灾害、战争等因素而丢失。Q2Spotify对数据被抓取有什么回应ASpotify表示正在积极调查此事件已经识别并禁用了参与非法抓取的恶意用户账户并实施了新的保障措施来防止此类反版权攻击同时与行业合作伙伴合作保护创作者权利。Q3Annas Archive的这一行为会带来什么风险A用户担心此举可能让Annas Archive面临法律风险就像互联网档案库去年遭受唱片公司法律攻击一样。虽然该档案库设计为抗打击但持续的法律压力可能导致资金和资源耗尽最终影响其正常运营。