近日,谷歌Gemini超越ChatGPT,强势登顶苹果好意思区App Store免费应用榜。
Gemini这一轮“逆袭”的最大元勋,是谷歌8月底推出的代号为Nano Banana(纳米香蕉)的AI图像生成与裁剪模子。
它的火爆进程远超念念象:谷歌实际室副总裁Josh Woodward显现,Nano Banana上线仅一周,就完成了超2亿次图像裁剪,并诱惑超1000万新用户涌入Gemini应用。其火爆进程一度导致谷歌里面“TPU(张量搞定单位)严重过载”。
《逐日经济新闻》记者实测发现,Nano Banana的图像生成智商竟然弘远,达成了复杂图像裁剪时刻的“全球化”,让等闲用户能用随意的话语完成以往需要专科软件身手完成的任务。
Nano Banana“出圈”的背后是谷歌十年打磨自有算力芯片、整合全生态资源的发奋。凭借谷歌“硬件自主+生态渗入”的双重护城河,一场对于AI时间话语权的争夺战,正借一根“香蕉”认真打响。
图片开始:每经记者 郑雨航 摄
一直以来,ChatGPT都是AI应用领域不成撼动的霸主。不外,这一边幅正在被谷歌冲破。
最新数据骄矜,在好意思区AppStore中,谷歌Gemini的下载量已高出OpenAI的ChatGPT,成为免费榜排行第一的应用。此外,在加拿大、印度、摩洛哥等国度,Gemini雷同达成了登顶。
市集分析多半合计,Gemini此轮爆发的最要道身分,是谷歌在8月底推出的新一代AI图像生成与裁剪模子Gemini 2.5 Flash Image,其代号为Nano Banana。Nano Banana在图像质地、裁剪为止和应用场景上有大幅更变,一推出就受到了用户的激烈追捧。
模子上线一周后,谷歌实际室副总裁Josh Woodward显现,Nano Banana累计完成超2亿次图像裁剪,带动超1000万新用户涌入Gemini应用,其火爆进程以致导致谷歌里面“TPU严重过载,SRE(站点可靠性工程)警报束缚”。
簇拥而来的用户让Nano Banana简直刷屏了全球各大酬酢媒体。这一幕,像极了数月前GPT-4o凭借“吉卜力”格调创作风潮的刷屏惬心。那时,OpenAI的CEO奥特曼曾经示意,ChatGPT在“吉卜力效应”当周创下了活跃用户、App下载和订阅收入的历史记录。
如今,Nano Banana正为谷歌复制这一胜利旅途。DeepMind CEO哈萨比斯在最新采访中也示意,Nano Banana是同类产物中最佳的。
应用端的火爆,速即传递到成本市集。受益于Nano Banana的精良市集发挥过头他利好身分,谷歌母公司Alphabet股价近期持续飞腾。当地时刻9月15日(周一)收盘,Alphabet的市值达到3.05万亿好意思元,成为全球第四家市值突破三万亿好意思元大关的公司。
华尔街也速即跟进。同日,花旗集团分析师Ron Josey将Alphabet的倡导股价从225好意思元上调至280好意思元,明确指出Gemini在告白和云业务中的收受加快,正带来更快的产物拓荒周期。
实测Nano Banana:图片生成智商不凡,但仍有短板Nano Banana之是以能激发“病毒式”传播,绝非只是是营销的胜利,其中枢在于它达成了复杂图像裁剪时刻的“全球化”,将以往需要专科软件身手完成的任务,转机为等闲用户通过当然话语就能搪塞达成的操作。
从时刻拆解来看,Nano Banana自身具备多个“杀手锏”。
据谷歌官方博客,其中枢智商包括——
多图像和会:将不同的图像组合成一张“毫无PS印迹”、具有新视觉后果的图片。
变装和格调一致性:在屡次生成经由中,保持主体对象或视觉格调的斡旋,大致搪塞将并吞变装或产物置于不同场景中,且保持原始特征。
对话式裁剪:用户不错通过随意的对话对图像进行更动。
在实质体验中,全球用户用Nano Banana玩出了多样名堂。其中,最出圈的即是生成3D手办图片。用户上传自家宠物或我方的相片,下令生成手办图像,Nano Banana就能给出传神的建模图以及制品图。
记者实测发现,唯一上传一张宠物相片,再输入将图片转成手办的请示词,即可生成一张高清传神的3D宠物手办图片。
图片开始:左图为记者供图,右图为Nano Banana生成
多元素拼接这个玩法也颠倒火爆。用户不错上传一张包含多个元素排布的图片,并给图中物品打好标签,模子便能将其和会成一张斡旋的图片。
图片开始:Nano Banana生成
不外,记者实测发现,Nano Banana也存在彰着短板。比如,生成的汉字常常乱码。当记者条目模子生成一张带有“逐日经济新闻”几个汉字的海报时,所有六个汉字,Nano Banana“写”对了四个。
图片开始:由Nano Banana生成
固然,Gemini并不单是是一个P图用具,它是一个定位与ChatGPT相通的通用助手。近期爆火的Nano Banana只是其功能之一。
除了Nano Banana,Gemini还集成了诸多智商,比如——
系念功能:补皆了跨对话的“系念”功能,不错保存用户偏好,举例“我是素食者,不要推选带肉的食谱”。
音频上传:Gemini近期终于援救上传音频文献。这意味着用户不错把会议灌音、采访视频等顺利交给Gemini搞定,省去手动整理的穷苦。
Canvas(画布):访佛于ChatGPT的画布预览功能,不错将创意变为应用步调、游戏等。该功能近期也赢得更新,援救“选拔并参议”(Select and Ask),用户可顺利点击应用预览中的某个元素,用当然话语修改它。
视频生成:集成了Veo3视频生胜利能(预览版)。
Deep Research:提供深度商酌功能。
图片开始:Gemini
Gemini登顶背后:谷歌的双重“护城河”在Nano Banana的火爆和Gemini登裁夺国榜单的背后,是谷歌十年打磨自有算力芯片、整合全生态资源的势必扫尾。
TPU自主:比英伟达决策省20%算力运营成本
谷歌手中抓着一张常常被市集低估的“王牌”——TPU。自2015年起,谷歌便运转研发其专为加快机器学习职责负载而经营的定制芯片TPU。
据谷歌先容,中央搞定器(CPU)被经营为计较机的通用“大脑”,而GPU那时是有益经营用于与 CPU协同职责以加快图形、视频渲染和模拟中的复杂任务的专用芯片,TPU则是专为 AI 而经营的。在尔后的十年中,TPU的性能和服从不时跨越,并迟缓成为谷歌简直通盘产物的AI因循。
这种“垂直整合”的交代,让谷歌胜利开脱了对英伟达(Nvidia)品级三方硬件供应商的“算力镣铐”,从而逃匿了全球GPU供应链的瓶颈和端淑成本。
英伟达最新财报骄矜,其毛利率高达72.4%,这也意味着,依赖英伟达芯片的公司需要为算力支付一笔端淑的溢价,而谷歌凭借自有TPU,当然跳过了这层涨价。
分析师忖度,与依赖英伟达GPU的公司比较,谷歌运营其TPU基础步调的成本要低约20%。
从App到智能体,Gemini“无处不在”
硬件除外,谷歌正火力全开,期骗其生态系统,将Gemini强势镶嵌其中。
Gemini并非一个伶仃的应用,而是被全面“武装”到谷歌的通盘产物矩阵中:在安卓系统上,它经受“Hey Google”语音助手的大脑;在Google Workspace(文档、Gmail、表格)中,它化身智能援助;在谷歌搜索中,它驱动AI概览(AI Overviews)功能。
谷歌的愿景远不啻于此,更要打响“智能体”战争。其“智能体平台”(Agentic platforms)如Agentspace,允许企业客户将Gemini与其里面数据和系统相齐集,创建大致自动推论复杂职责流的定制化AI智能体。
谷歌首席推论官桑达尔·皮查伊(Sundar Pichai)在2025年计谋中明确指出,将来的要点是扩大Gemini手脚主要用户交互界面的边界,这预示着谷歌正从传统的搜索框样式,向一个更集成、多模态和智能体化的AI体验转型。
免责声明:本文内容与数据仅供参考,不组成投资提议,使用前请核实。据此操作,风险自担。
逐日经济新闻