大模型没有“知识围城”
知识平台与大模型的“反击战”:是封锁还是共赢?
近日,两大知识平台——知网和知乎——相继采取措施,限制大模型对其内容的搜索和链接。知网因引发学术界震动而要求秘塔AI搜索终止对其内容的搜索和链接,而知乎则通过乱码标题和正文的方式,避免其内容被用于训练AI模型。这些举措引发了业界对大模型与知识平台关系的广泛关注。
知识平台与大模型之间的矛盾,主要源于大模型训练过程中对高质量知识内容的需求。大模型的“知识密度”被视为衡量其先进性的重要指标,类似于半导体领域的“先进制程”。然而,知识平台对大模型的“关门政策”是否会影响大模型的发展?答案并不简单。
清华大学张钹院士指出,推动AI创新应用与产业化需要综合考虑知识、数据、算法和算力,其中知识的作用尤为重要。尽管大模型训练并不高度依赖于特定平台的内容,但知识平台与大模型之间的矛盾仍需深入探讨。某AI创业公司在基于GPT4-Turbo模型开发产品时发现,即便模型性能领先,仍难以回答涉及隐性知识的问题。这些隐性知识在某些场景下是必需的,但大模型往往无法捕捉。
由此可见,知识平台与大模型之间的“反击战”并非简单的封锁与反封锁,而是反映了双方在知识获取与利用上的博弈。未来,如何在保护知识产权的同时,促进知识的共享与应用,将成为业界关注的焦点。