“`html
代理运行时已成为新的浏览器层,您的网站将根据运行时而非单个模型进行评估。这是一个网络专业人士尚未完全适应的转变。当前的讨论仍然围绕模型展开,哪种模型写得更好?哪种引用更准确?哪种API更便宜?这些问题的热度很高,因为新模型每隔几周就会发布,每次发布都备受关注。
四月发布的运行时技术堆栈
本周发生的事情让我们无法忽视这个基础的重建。4月15日,Cloudflare推出了Project Think,这是一个围绕持久执行、崩溃恢复和检查点构建的新的Agents SDK,具有子代理、树结构消息的持久会话和在动态工作者上运行的沙盒代码执行。同一天,OpenAI发布了其Agents SDK的下一次进化,具有本地沙盒执行和模型本地管理。两大网络基础设施运营商对“AI代理在生产环境中如何长时间运行”这一问题给出了不同的答案。
4月16日,Cloudflare又增加了五个新功能:AI平台、AI搜索、电子邮件服务、PlanetScale Postgres和MySQL以及用于托管大型开源LLM的工程基础。Google CEO Sundar Pichai在4月7日的播客中也提到了类似的转变。搜索本身将成为一个“代理管理器”,信息查询任务将会被代理化。
错误的问题与新的方向
过去18个月里,网络专业人士一直在问错误的问题:我们应该为哪个AI模型优化?ChatGPT、Claude、Gemini还是Perplexity?这些问题曾经合理,因为模型直接读取您的网站。
但现在情况不同了,模型读取的是运行时传递给它的内容。运行时获取您的页面,解析它,执行(或不执行)您的JavaScript,解析您的结构化数据,并协商认证。模型看到的任何内容都是运行时的解释。
新的问题是,您的网站对哪个代理运行时是可读的。以下是下周前需要测试的三件事:这些都是运行时可读性问题,与模型无关。运行时决定您的答案是否在模型的上下文窗口中,模型只从运行时传递的内容中选择。
网络的基础设施正在重建。未来两年内,所有模型都将通过这些运行时之一查看您的网站,而不是直接查看。您网站的任务是对运行时可读。
关于模型的讨论将继续在会议和主题演讲中进行,而运行时的讨论则发生在基础设施公司的产品更新日志中。那些提供运行时的公司将决定哪些网站能通过AI搜索和AI商务到达用户。停止问哪个模型,开始问哪个运行时。
“`

TopsTip