本文作者:访客

苹果自研多模态AI模型Manzano探索揭秘

访客 2025-09-28 14:15:36 1 抢沙发
苹果公司正在探索自主研发多模态AI模型Manzano,这一模型能够融合不同模态的数据,包括文本、语音、图像和视频等,以实现更高效和智能的用户交互体验,Manzano的研发将有助于苹果进一步拓展其在人工智能领域的应用,提升产品的智能化水平,从而满足用户的需求,该模型的具体细节和应用场景尚未公布,但预计将广泛应用于苹果的各种产品和服务中。

据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。

文章版权及转载声明

作者:访客本文地址:https://shucuo.cn/post/1837.html发布于 2025-09-28 14:15:36
文章转载或复制请以超链接形式并注明出处数错网

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

验证码

评论列表 (暂无评论,1人围观)参与讨论

还没有评论,来说两句吧...