近年来,AI系统的不可预测性和难以控制性已经有了充足的证据。Dario Amodei在谈论他公司销售的技术时指出了这一点。与此形成对比的是,许多人在LinkedIn上宣称自己对AI的运作了如指掌,甚至提出了一些具体的优化策略,比如通过某些方法可以提升13%的引用率或2.8倍的转化率。
构建AI系统的人怎么说?
Anthropic公司在2024年5月发布了一篇关于AI可解释性研究的文章,称他们大多将AI模型视为一个黑箱:输入一些东西,输出一个结果,但不清楚模型为何会给出特定的响应。即便两年后,信心也没有增加。Neel Nanda在2025年接受采访时表示,关于AI可解释性的最雄心勃勃的版本可能已经搁浅。他不认为这个领域能提供一些人想要的稳健保证。
销售AI的人怎么说?
在AI的市场营销中,很多术语似乎是确定性的,比如“确保”、“保证”、“决定”等等。许多公司自信地宣传他们的方法可以带来显著的效果,但这些语言与构建这些系统的人在描述系统行为时使用的语言截然不同。
测试时发生了什么?
许多顾问对他们自己测量的战术充满信心,他们在几个客户身上使用相同的方法,看某些指标是否移动,然后称之为证据。然而,这些测试往往缺乏对照组,没有预先登记的假设,也没有测量战术实际上改变了什么。真正的测试需要更高的标准,而不是仅仅穿着确认的外衣。
同样的模型,Anthropic公开表示无法完全解释,而一些人却自信地声称知道自己在做什么,这种信心水平与真实情况相差甚远。
这篇文章揭示了AI领域中不同声音之间的巨大差距,以及在这种背景下进行决策时需要保持的谨慎态度。

TopsTip