代理运行时战争打响,你的网站准备好了吗?

在新的浏览器层面,网站的评估标准正在发生变化。如今,网站将被代理运行时(agent runtime)所评估,而不是单个模型。这是一个尚未被网络专业人士完全接受的转变。当前的讨论仍然围绕着哪种模型更好、更准确、或更经济展开。然而,真正的故事在于基础设施的重建,而本周的事件让这一点变得不容忽视。

四月发布的运行时技术堆栈

4月15日,Cloudflare推出了Project Think,一个围绕持久执行、崩溃恢复和检查点构建的新型Agents SDK。这个项目包含了隔离子代理、树结构消息的持久会话,以及在动态工作者上运行的沙盒代码执行。就在同一天,OpenAI也发布了其Agents SDK的最新版本,具备本地沙盒执行和模型原生控制。两大网络基础设施运营商几乎同时给出了长时间运行AI代理在生产中实际运行的答案。

4月16日,Cloudflare又增加了五个新功能,包括一个供应商无关的推理层AI Platform,一个专门为代理检索设计的AI Search,与Pinecone和Algolia竞争的RAG层,以及面向代理使用的公共测试版电子邮件服务。Cloudflare还在其网络上直接托管了像Kimi K2.5这样的大型开源LLM的工程基础。



错误的问题与新的挑战

谷歌CEO Sundar Pichai在4月7日与Stripe联合创始人John Collison的播客中,将搜索描述为一个“代理管理器”,强调信息查询将更具代理性,任务将会被完成,多个线程将同时运行。这个描述与本周Cloudflare和OpenAI发布的技术底层一致。

过去18个月,网络专业人士一直在问错误的问题:应该优化哪种AI模型?ChatGPT、Claude、Gemini或者Perplexity?然而,模型不再直接读取你的网站,而是通过运行时层获取信息。运行时决定了模型能看到什么,而不是模型本身。

新的问题是,你的网站能否被代理运行时理解?在下周之前,你需要测试三个关键点。这些都是关于运行时可读性的问题,模型与这些问题无关。运行时决定了你的答案是否在模型的上下文窗口中,并且模型从运行时获取信息。

网络的基础设施正在重建。未来两年内,每个模型都将通过这些运行时之一查看你的网站,而不是直接查看。现在开始,你的网站需要对运行时可读。

模型的讨论仍将在会议和主题演讲中继续进行,而运行时的讨论则发生在基础设施公司产品更新日志中。发布运行时的公司将决定哪些网站能被AI搜索和AI商业访问。停止询问哪个模型,开始关注哪个运行时。

-=||=-收藏赞 (0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《代理运行时战争打响,你的网站准备好了吗?》
文章链接:https://topstip.com/daili-yunxing-shijian-zhanzheng-dakaishi/
转载说明:请注明来自“TopsTip”并加入转载内容页的超链接。
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。