推理成本仅GPT-5.5二十分之一,Gemini 3.2实时模型现身谷歌云

2026年05月17日 12:04快讯2
据动察 Beating 监测,谷歌云控制台的模型筛选列表中出现名为 gemini-3.2-flash-lite-live-preview 的基础模型选项。这是继本月初在 iOS 应用构建包和 AI Studio 暴露痕迹后,该系列模型在官方平台的再次曝光。 新选项带有 lite 与 live 后缀,表明谷歌正切分出针对极低延迟实时交互的特化版本。Abacus.AI 首席执行官 Bindu Reddy 此前透露,Gemini 3.2 Flash 的编码与推理能力达到 GPT-5.5 的 92%,但得益于蒸馏加稀疏化技术,推理成本仅为后者的二十分之一,多数查询延迟低于 200 毫秒。 随着云端接口提前抢跑,业内预计这一定位极致性价比的轻量模型将在 5 月 20 日的谷歌 I/O 大会上正式发布。

免责声明:本站所有资讯仅代表作者个人观点,不构成任何投资理财建议。

本文链接:https://coin123.link/post/1785.html

相关文章

宁德时代加码全场景零碳解决方案

9月27日,宁德时代创始人兼CEO曾毓群在海口举办的“2024世界新能源汽车大会”上表示宁德时代已推出全场景零碳解决方案,将通过科技创新、新型商业模式,推动基础设施升级,打造“零碳新基建”。曾毓群表示…

香港虚拟资产交易量同比增长86%

Chainalysis报告显示过去一年香港的虚拟资产交易量同比增长了86%,香港的虚拟资产采用率在东亚地区也较为领先。业内人士认为,接下来香港虚拟资产行业的发展将集中于技术的创新和应用,包括区块链、人…

交易员在MOODENG上获利500万美元

Arkham在X发文表示,某用户曾利用800美元成本在MOODENG上浮盈1000万美元,现在利润回落至500万美元。交易员Db3P在MOODENG上线的第一周花费800美元买入,这些代币在上周六一度…

印度央行将维持政策回购利率在6.50%

高盛经济学家表示,印度央行新组建的货币政策委员会下周可能会将政策回购利率维持在6.50%不变。高盛预计印度央行将保持“退出宽松”的政策立场,并继续重申对4%总体通胀目标的承诺。高盛指出,新任命的外部货…

Ebury市场对英央行降息预期反应过度

Ebury称,英镑温和上涨,因英国央行首席经济学家皮尔暗示降息将是渐进的,市场对英国央行行长贝利有关更快降息前景的言论反应过度。Ebury策略师马修•瑞安表示,皮尔的言论证实了市场对贝利讲话的理解过于…

OpenAI最新一轮融资中估值达1570亿

OpenAI 投资者 Khosla Ventures 表示,OpenAI 当前的公司架构不适合 IPO,但他不担心公司高管离职。据悉,OpenAI 在最新一轮融资中估值达1570亿美元,其团队仍然很强…

Fractal Bitcoin发布24年第四季度路线图

Fractal Bitcoin 于 10 月 6 日发布 2024 年第四季度路线图。十月:Runes 激活、UniSat 钱包中的 CAT20 索引和转账、无信任 CAT20 交易市场和第一季追溯性…

平台“X”的罚款可能会计入其它收入

欧盟警告称,在计算对社交媒体平台“X”的罚款时,可能会计入马斯克其他业务的收入,包括SpaceX和Neuralink。这将大大增加潜在处罚。根据欧盟的《数字服务法案》,如果未能解决非法内容和虚假信息问…

设定以太坊达到 100,000 TPS 的目标

以太坊联合创始人 Vitalik Buterin 在周四的博客文章中设定了以太坊达到 100,000 TPS 的目标。Buterin 表示,这一目标将通过 Layer 2 的集成实现,但首先需要进行标…

autism 今日凌晨市值创下历史新高

GOAT 持续在 3000 万美元震荡,AI 发币热潮暂时有所退却。SYDNEY 上线半小时内市值冲到 400 万美元,然后快速下跌崩盘。Marud 宣传的 cult 和抽象文化代币迎来「收获期」。a…