您现在的位置是: 首页 > SEO学习 > 正文
知网cnki给秘塔AI搜索告知函,AI搜索引擎只是另一种方式的“洗稿”?
发布时间:2024-08-23 16:04:44 编辑:admin 浏览:75
关于这个说法,你怎么看,看完可以留言。 作者:韦专家
这两天有个新闻,就是知网cnki给秘塔AI搜索(http://metaso.cn)发了封告知函,意思是秘塔搜索擅自收录知网的文献摘要等信息。
秘塔在公众号宣称:
依照学术规范,文献的摘要和题录应具有独立性和自明性,能够使读者不阅读全文就能获得必要的信息。秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。知识的价值在于流动,学术文献作为汇集了人类智力成果的重要载体,具有极强的不可替代性。科学文献若成为一种奢侈品,既不利于知识的公平获取,也不利于科学研究的发展。近些年国际学术界、出版界和图书情报界联合推动的《布达佩斯开放存取倡议》(BOAI)即在不断推进学术文献的免费阅读、下载、复制、传播、打印和检索。没有search,就没有research。“知识发现”是知识传播链路上的第一步。秘塔官方,公众号:AI秘塔完蛋!我们收到了知网28页的侵权告知函
关于这个问题,我曾经在过去的文章中《ChatGPT的原罪》提到过:
传统搜索引擎,链接的是用户和网站,或者也可以理解为链接着内容消费者和内容生产者。
对于内容生产者而言,搜索引擎作为平台,进行索引和评估,将大量精准的流量导入内容生产者的网站。
内容生产者从而可以获得精准流量和用户,从而进行变现,或者获得行业地位和影响力。
对于内容消费者而言,搜索引擎不断在优化对于优质内容的判断标准,让内容消费者可以尽快找到自己想要的内容。正如Google的宗旨是让用户尽快离开搜索引擎一样。
同时,搜索引擎严格遵守robots协议,内容生产者可以很方便地屏蔽搜索引擎的抓取。
这才是一个完整且健康的生态。有供给,有需求,各取所需。
但ChatGPT呢?
在获取内容的时候是未得到授权的,在输出内容的时候,是以自己的角色输出,所以内容生产者什么都得不到?
关于这个,白杨SEO之前在:SEO还有用吗?AI或AI搜索会取代搜索引擎吗?说过另一种看法,没看过我可以看看。
----------------------------------------------------------
虽然秘塔搜索宣称:
秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,阅读正文需通过来源链接跳转至网站获取。
但实际情况是,AI基本已经把结果通过大模型输出了,所谓的来源链接只是一个数字角标以及最下面的“参考文献”。
需要注意的是,虽然最下面有“参考文献”,但被参考的文献作者实际上并未得到任何好处,不管是文献购买的费用,还是文献被引用的次数和去向。
我曾在《没有了链接的互联网》中提到:
以前评判一个页面的内容是否优质,就看外部引入的超链接是否多,是否优质。而这种外部链接的引入,在搜索引擎看来,就是一种投票。氧先森,公众号:韦专家没有了链接的互联网
对于文献也是如此,一篇论文的质量,除了它的内容是否优质外,发布的平台是否权威,被引用的次数和范围也是极其重要的标准。
而AI搜索输出的内容,是随机性和临时性的。
(题外话:抖音旗下的AI平台“豆包”曾经做过一件事情,就是把用户的提问和AI的回答输出为网页,供搜索引擎收录,所谓AI生成内容来投喂自己训练自己,完美闭环了
这种临时性导致了被引用的文献,完全是在为爱发电。而AI结果的随机性,实际上就是另一种方式的洗稿。
那,该怎么办?
ChatGPT引爆了LLM的浪潮,我们也不能因噎废食,要积极拥抱科技,拥抱变化不是?那如何把握其中的平衡呢?尤其对于社科领域的知识、文献、分享、观点,更需要尊重内容创作者的智慧和心血。
首先,AI搜索引擎的训练库,必须要得到内容所有者的允许。
我看到CloudFlare已经提醒可以通过WAF屏蔽AI蜘蛛了,也看到ChatGPT也宣告自己的蜘蛛名为GPTBot并承诺遵循Robots协议。但国内这些AI搜索未看到相关信息。
其次,AI搜索引擎的训练库,必要时需要给内容所有者支付费用。
去年12月,《纽约时报》起诉OpenAI前不久,OpenAI与德国新闻出版巨头阿克塞尔·施普林格(Axel Springer)达成合作。施普林格是欧洲最大的数字出版公司,旗下拥有包括Business Insider、《世界报》等在内的知名新闻品牌。双方签订为期多年的协议,ChatGPT可以在回复中给用户提供施普林格新闻媒体的报道摘要,包含原始出处和链接,保证新闻网站获得流量。同时,施普林格的内容将被OpenAI用于训练模型。Information援引知情人士称,该交易的规模在上千亿美元左右。这已经是OpenAI与新闻机构达成的第二个大型合作,同年7月其曾与美联社达成类似协议,金额未公开。https://m.huxiu.com/article/2538576.html
除了这些大的媒体机构,小博客主,广大内容创作者的付出也需要得到回报(物质和精神的),正如:
在前不久提交给英国上议院通信和数字事务特别委员会关于大语言模型调查的文件中,OpenAI承认,像ChatGPT这样的AI工具的开发离不开受版权保护的素材,并称如果没有这些素材,GPT根本无法诞生:“由于当前版权涵盖了几乎所有形式的人类表达方式,包括博客文章、照片、论坛帖子、软件代码片段和政府文件,如果不使用受版权保护的内容,就不可能训练当今领先的人工智能模型。”https://m.huxiu.com/article/2538576.html
最后,AI搜索引擎引用过的展示结果,可以提升被引用方的权重。
这样,每次被引用时,内容创作者也变得欣慰以及更加期待。正如传统搜索引擎用外链来判断被引用页面是否优质一样,如果AI搜索引擎的引用也实质上提高了被引用对象的权重,内容创作者的热情才不会被浇灭,人类的文明、创造和延续才生生不息。
文章到最后,我还是好奇一下:
一个没有广告,无需付费的平台,未来如何商业化?又将如何为内容生态作出贡献呢?亦或是快播一样宣称的“技术无罪”?
相关推荐:
白杨SEO:ChatGPT怎么用?大家都用ChatGPT及类似AIGC工具干什么?
AI写作指令有哪些?做全网SEO精准流量怎么写AI提示词?【收藏】
关键字词: