4 月 23 日,微软发布了开源小模型 Phi 3-mini,这是 Phi-3 系列的第一个模型。Phi-3-mini 拥有 38 亿参数,能理解很多复杂的指令,目前可以在 Azure、Hugging Face 和 Ollama 上使用。
微软在去年 12 月发布了 Phi-2,性能可以与 Llama 2 这样的大模型相比,新发布的 Phi-3 系列会优于之前的版本, 与 GPT-4 这样的大语言模型相比,Phi-3-mini 训练数据集相对较小,但其性能已不亚于GPT-3.5,微软计划还会发布 Phi-3 Small(7B 参数)和 Phi-3 Medium(14B 参数),除了 Phi,该公司还发布了用于专门解决数学问题的模型。
据 The Information 报道,微软正在组建一个专注于轻量级 AI 模型的团队,与 AI 大模型相比,小型人工智能模型的运行成本通常比较低,更能在个人设备如手机或笔记本电脑上发挥更好的作用。除了 Phi,该公司还发布了用于专门解决数学问题的模型。
小型 AI 模型能在日常生活中处理一些比较简单的任务时发挥作用,因此除了微软之外,其竞争对手也发布了很多实用的模型,Google 的 Gemma 2B 和 7B 可以充当聊天机器人,并完成一些与语言相关的工作;Anthropic 研发的 Claude 3 Haiku 可以阅读带有图表的复杂研究型论文并迅速总结其内容;Meta 最近发布的 Llama 3 8B可以作为聊天机器人或进行编码辅助。
Microsoft Azure AI 平台公司副总裁 Eric Boyd 表示,Phi-1 专注于编码,Phi-2 开始学习推理,Phi-3 在此基础上,对编码和推理都有了更出色的表现,但它无法与 GPT-4 这样的大语言模型相提并论,由整个互联网数据训练成的大语言模型与 Phi-3 这样的较小模型在回答问题的方式上存在很大的差异。
但对于内部数据集比较小的公司来说,Phi-3 是它们完成一些定制应用的首选,小型 AI 模型足以完成任务,并且使用的计算资源较少,价格实惠,
评论前必须登录!
立即登录 注册