ChatGPT 们能讲人话后,AI 污染互联网将变本加厉
生成式AI污染语言:Wordfreq项目宣告终结
AI兴起导致语言污染
随着AI技术的发展,人们越来越难以区分网络上的内容是由AI生成还是人类创作。这种现象不仅出现在新闻报道和游戏中,甚至在直播中也难以辨别真人与AI的区别。这种混淆引发了人们对语言污染的担忧。
Wordfreq项目受创
原本用于追踪和分析多语言词汇流行度的项目Wordfreq,如今成为AI污染的最新受害者。项目创建者罗宾·斯皮尔表示,由于生成式AI的广泛使用,目前无法获取2021年以后人类真实语言使用的可靠数据。这一现状使得Wordfreq失去了准确性,并最终宣布停止更新。
数据来源受污染
Wordfreq曾通过分析维基百科、电影字幕、新闻报道和社交媒体等内容来追踪语言变化。然而,随着生成式AI如ChatGPT的普及,AI生成的文本大量涌入这些数据源,导致词频统计失真。例如,“delve”一词原本较少使用,但在AI文本中频繁出现,从而影响了对人类语言习惯的准确分析。
人类或将买单
斯皮尔的无奈与愤怒反映了当前语言污染的问题。如果不能有效解决,人类可能最终为这种污染买单。生成式AI带来的语言污染不仅影响学术研究,还可能误导社会对语言发展的认知。