Reddit 近期在纽约联邦法院对 AI 搜索公司 Perplexity 和三家数据抓取服务商提起诉讼。Reddit 指控这些公司通过绕过平台访问限制,包括利用谷歌搜索结果进行抓取,以规模化获取其社区内的海量内容。
核心争议点:数据使用与访问权限
Perplexity 声称其仅对 Reddit 讨论进行总结,并在回答中引用相关帖子,此举与用户分享链接的行为类似。公司表示,他们并没有直接使用 Reddit 的帖子来训练其 AI 模型。
然而,Reddit 在诉讼文件中提出了技术性指控,质疑 Perplexity 的说法。据称,Reddit 创建了一个仅对谷歌搜索引擎可见,而不在互联网上其他地方公开的测试帖子。在数小时内,该隐藏内容就出现在了 Perplexity 的搜索结果中。Reddit 认为,这表明 Perplexity 及其合作方采取了绕过其安全措施的手段。
过往案例与 Perplexity 的回应
在此类纠纷中,Perplexity 曾表示问题源于产品新功能的“粗糙之处”,并承诺改进归因方式。该公司也曾论辩部分媒体组织试图控制“公开报道的事实”。针对此次诉讼,Perplexity 在其公开声明中强调:“我们总结 Reddit 的讨论……我们不会被勒索,也不会帮助 Reddit 勒索谷歌。”
案件的重要性与潜在影响
此案的判决可能对 AI 助手如何使用论坛内容,以及内容发布者如何保护其数据产生深远影响。法律问题不仅关乎训练数据,还可能涉及技术控制的规避、内容总结是否构成侵权,以及使用第三方抓取工具的法律责任。
如果法院支持 Reddit 的反规避论点,可能会促使 AI 助手在引用或链接 Reddit 内容的方式上发生改变。反之,若法院认同 Perplexity 的观点,AI 助手可能会更多地依赖那些受版权限制较少的论坛讨论。
目前,诉讼文件中并未明确指出 Perplexity 通过哪个具体的数据抓取服务商获取了数据,也未包含交易细节。







