谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看

科技巨头谷歌在年度I/O开发者大会重磅发布人工智能新品

北京时间5月15日凌晨,谷歌年度科技盛会I/O开发者大会拉开帷幕。正如预期,人工智能无疑成为了本次大会的核心主题。在为期两小时的精彩演讲中,谷歌相继发布了一系列人工智能创新产品和服务,引领AI科技浪潮。

人工智能新品抢先看:

图片[1]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

 

人工智能新品抢先看:

Gemini的广泛升级

谷歌推出了新模型“Gemini 1.5 Flash”,以作为Gemini 1.5 Pro更具成本效益的替代方案,同时仍具有强大的功能。Gemini 1.5 Flash从活动当天开始在谷歌的AI工作室和Vertex AI中提供公开预览版。

 

图片[2]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

2月份公布的Gemini 1.5 Pro也将迎来升级,在今年晚些时候将会把100万Tokens的窗口进一步扩大至200万,这将使其能够同时处理2小时的视频、22小时的音频、超过60,000行代码或超过140万个单词。

谷歌CEO皮查伊强调了Gemini在跨语言方面的改进,它将以35种语言向全球所有开发人员提供。皮查伊表示,Gemini 1.5 Pro可以分析PDF和视频以提供摘要,这意味着当用户假期归来后,模型可以将电子邮件和附件一起进行总结。

专为在智能手机上运行而设计的Gemini Nano也从纯文本输入扩展到可以图片输入。谷歌表示,“手机将能通过文字、图片、视频、音频,理解用户的世界。”并且整个过程都是在本地运行,不会引发隐私泄露。

开源大模型Gemma也将有一系列的更新,定于下月推出的Gemma 2参数量将能达到270亿。最后,谷歌的第一个视觉语言模型PaliGemma也被添加到Gemma模型系列中。

Veo、Imagen 3、音频概述

针对OpenAI的Sora,谷歌也推出了自己的视频生成模型“Veo”,可以根据文字、图片和视频的提示,生成各种风格的高质量1080P视频。

公司表示,Veo可以更好地理解自然语言,从而生成更能代表用户视觉的视频。它还能理解“延时拍摄”等电影术语,以生成各种风格的视频,并让用户更好地控制最终输出。

图片[3]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

去年,谷歌推出了一款名为“SynthID”的工具,可以在AI生成的图像中嵌入人眼不可见的水印。在今天的大会上,公司宣布正在将这项工具扩展到文本和视频之中。上文提到的视频生成模型Veo,在该平台生成的所有视频都会包含SynthID水印。

谷歌还推出了新一代的图像生成模型“Imagen 3”,根据公司的说法该模型可生成迄今为止最高质量的图像,图像中具有更多细节和更少伪影,有助于创建更真实的视觉体验。

与Veo一样,Imagen 3也改进了其自然语言功能,可以更好地理解用户提示及其背后的意图。谷歌称,Imagen 3是渲染文本的最佳选择,目前只有选定的创作者才能使用,很快就会在Vertex AI中推出。

通过Gemini 1.5 Pro,音频概述(Audio Overview)功能可以基于源文件生成个性化和交互式音频对话。

AI赋能谷歌搜索

作为主业,谷歌自然会大力将AI融进其主导全球的搜索引擎之中。从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。

同时谷歌搜索也将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题,并支持“拍视频”搜索解决方案的新搜索形式。

图片[4]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

根据现场演示,搜索引擎具备多步骤推理的能力,例如寻找一个瑜伽教室,同时展示新手优惠报价,和距离特定位置的步行时间。这个AI搜索引擎助手,还能介绍食谱、安排行程,以及接受视频形式的提问。

许多人可能都曾经历过花费数小时滚动浏览网页信息流来查找想要搜索的图片,对此,谷歌推出了AI解决方案。借助Gemini,用户可以在Google Photos中通过对话提示来查找他们寻找的图像。

在谷歌提供的案例中,一位用户希望看到他的女儿作为游泳运动员随着时间推移的进步,Google Photos自动筛选给出。谷歌表示,这项名为“Ask Photos”的功能将于今年夏季晚些时候推出。

Astra项目

谷歌在大会上宣布了一个名为“Astra”的高级视觉和对话响应智能体项目,即开发能在日常生活中提供帮助的通用AI智能体。媒体分析认为,这个项目旨在开发一种类似《钢铁侠》中人工智能系统“贾维斯”。

 

根据谷歌的说法,为了做到真正实用,智能体需要能够像人一样理解周围复杂多变的环境并做出反应——它需要能接收并记忆所见所闻,从而了解上下文信息并采取行动。

谷歌表示,它还需要具备主动性、“会学习”并能满足个性化需求,这样用户才能自然地与它交谈,不会有滞后或延迟。

DeepMind首席执行官Demis Hassabis在台上表示,“将响应时间缩短为对话式的内容是一项艰巨的工程挑战。”

AI芯片等硬件

谷歌推出了第六代TPU(张量处理单元)“Trillium”,将在2024年底向云客户提供。公司表示,与上一代TPU v5e相比,每个芯片的计算性能提高了4.7倍。

图片[5]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

除了TPU,谷歌也会推出CPU和GPU来支持工作负载。

皮查伊也在大会上提到,谷歌云将成为首批提供英伟达Blackwell GPU的云提供商之一,他在演讲中强调了谷歌“与英伟达的长期合作伙伴关系”。

THE END
点赞1527 分享
ARC 浏览器,替代 Chrome 的 “最新爆火” AI 浏览器-零度会员

ARC 浏览器,替代 Chrome 的 “最新爆火” AI 浏览器

在当今互联网时代,谷歌 Chrome 和微软 Edge 成为浏览器市场的双雄,新的浏览器难以突破。然而,ARC 浏览器的问世,以其独创性和创新体验,成功吸引了众多用户的关注。   ARC 浏览器基于 C...
admin的头像-零度会员admin
1.5W+1529
Win10 /11 必备的快捷键,堪称效率神器!让你学习、工作如鱼得水! |  零度解说-零度会员
媲美GPT4,本地搭建谷歌 Gemini Pro 智能聊天机器人!无需翻墙就可使用 | 零度解说-零度会员

媲美GPT4,本地搭建谷歌 Gemini Pro 智能聊天机器人!无需翻墙就可使用 | 零度解说

https://youtu.be/xefaQug_eyk ========= Gemini 密钥申请和说明:https://www.lingdu80.com/11128.html
admin的头像-零度会员admin
1.7W+1683
电脑远程自动开/关机,通过手机一键唤醒,100%免费!只需几步设置即可搞定 | 零度解说-零度会员
Windows 11 最新官方正版下载(2024)-零度会员

Windows 11 最新官方正版下载(2024)

  Windows 11 最新官方正式版:【点击下载】 下载 Windows 11 (当前版本:Windows 11 2023 更新 l 版本 23H2) 可通过下面的 3 个选项来安装或创建 Windows 11 介质。请分别查看每一个选项...
admin的头像-零度会员admin
1.4W+1527
重磅消息!Stable Diffusion 3 震撼发布,能否吊打Sora就看它了!! | 零度解说-零度会员

重磅消息!Stable Diffusion 3 震撼发布,能否吊打Sora就看它了!! | 零度解说

https://youtu.be/A01J_NOdGbU ============== Stable Diffusion 3 申请:https://www.lingdu80.com/11665.html https://www.lingdu80.com/11665.html
admin的头像-零度会员admin
1.3W+1527
终于来了!ChatGPT 官方 APP正式版发布,居然暗藏福利!可无限制使用 GPT4,附“非美区”用户安装教程! | 零度解说-零度会员
ChatTTS 最强文本转语音!一键本地安装,100%成功!效果逼真如真人,完全免费开源!!| 零度解说-零度会员

ChatTTS 最强文本转语音!一键本地安装,100%成功!效果逼真如真人,完全免费开源!!| 零度解说

https://youtu.be/aUcFDNyMuVc ============= ChatTTS 一键安装包下载:https://www.lingdu80.com/12621.html
Win 11 和 Win 10 合二为一个 ISO 文件 ,多个系统版本可供选择!-零度会员

Win 11 和 Win 10 合二为一个 ISO 文件 ,多个系统版本可供选择!

    Win 11 和 Win 10 合二为一个 ISO 文件 ,多个系统版本可供选择! 合并只需用到3个命令: Dism /Get-ImageInfo /ImageFile:C:\ISO\install.esd Dism /Get-ImageInfo /ImageFile:C:\IS...
admin的头像-零度会员admin
1.9W+2253