塔斯娱乐资讯网

Apple高管详解了公司全新Apple基础大模型(AFM)的架构,并明确说明谷歌

Apple高管详解了公司全新Apple基础大模型(AFM)的架构,并明确说明谷歌相关技术在研发过程中起到的具体作用。

周一主题演讲结束后,软件工程高级副总裁Craig Federighi联合人工智能副总裁Amar Soubrat Manya、Siri负责人Mike Rockwell、软件副总裁Sebastian Marino-Metz面向媒体开展技术分享会,讲解第三代Apple基础大模型系列的研发思路,以及该系列如何为Apple智能提供算力支撑。

“我们完全没有使用任何谷歌助手相关技术,”Craig Federighi表示。他解释,Apple没有采用任何面向谷歌普通用户开放的Gemini大模型、谷歌任何端侧程序代码,也没有将谷歌搜索体系作为自身AI系统的知识库底座。

“我们自然不会搭载Gemini应用,iOS系统运行逻辑中完全不含谷歌的客户端代码。针对我们自研的大模型,我们既不使用谷歌对外提供的各类模型,也不采用谷歌部署模型所用的配套基础设施与方案。至于知识库层面,我们同样不会把谷歌搜索或同类服务当作整套系统的底层支撑。”

Amar Soubrat Manya介绍了全新Apple基础大模型家族,该系列包含两款端侧模型与三款云端模型。端侧层级分为两款:一是采用下一代稠密架构的AFM Core;二是基于稀疏架构、原生支持多模态的AFM Core Advanced。

Amar Soubrat Manya称,AFM Core Advanced和我们以往所有端侧模型都截然不同,无需向云端发起请求,就能实现邀约生成、富有情感的AI语音等全新功能。云端侧,AFM Cloud负责低延迟优化的私有云端计算任务;AFM Cloud Image则支撑图像生成、图像编辑功能,其中包含空间画面重构能力。

关于和谷歌合作的核心细节,Amar Soubrat Manya在介绍四款模型的训练流程时作出说明:“所有模型均为Apple芯片量身定制,依托自有专属数据完成强化学习训练,并借助Gemini前沿大模型的输出结果做迭代优化。”这段话清晰表明,谷歌仅参与了模型蒸馏环节,Apple并未全盘接入、直接使用Gemini完整模型。

第五款、也是性能最强的AFM Cloud Pro,专门面向智能代理工具调用与复杂逻辑推理任务,Amar Soubrat Manya称效果对标Gemini前沿系列大模型。这款模型脱离了Apple标准私有云端计算框架。

为运行该模型,Apple联合谷歌、英伟达拓展私有云端算力,在谷歌云服务器中部署英伟达显卡。Sebastian Marino-Metz表示,Apple希望用上英伟达最新芯片,但同时要求硬件配置做到无法读取Apple服务器内任何数据,英伟达一项名为模糊保密计算的新技术实现了这一需求。

“我们希望用上英伟达最新硬件,因此着手将私有云端计算能力拓展至第三方云平台。”

Craig Federighi介绍,整套系统架构的核心调度组件为系统协调器,他称这款程序是整套系统隐私架构的关键。协调器会根据指令复杂度、所需个人隐私信息,将用户请求分配至适配的端侧模型或云端模型处理。

系统可调取应用工具箱实现软件内操作、借助聚焦语义索引读取个人本地内容,同时读取屏幕画面获取实时场景信息。若查询内容涉及时事资讯,系统会通过Apple自研全球知识库获取答案,Craig Federighi透露该知识库已研发多年。

Apple同时强调,全部私有云端计算基础设施(包括部署在谷歌云内的英伟达显卡扩容算力)均可由第三方研究人员独立核验,确保用户数据绝不会被存储、调取。