谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看

科技巨头谷歌在年度I/O开发者大会重磅发布人工智能新品

北京时间5月15日凌晨,谷歌年度科技盛会I/O开发者大会拉开帷幕。正如预期,人工智能无疑成为了本次大会的核心主题。在为期两小时的精彩演讲中,谷歌相继发布了一系列人工智能创新产品和服务,引领AI科技浪潮。

人工智能新品抢先看:

图片[1]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

 

人工智能新品抢先看:

Gemini的广泛升级

谷歌推出了新模型“Gemini 1.5 Flash”,以作为Gemini 1.5 Pro更具成本效益的替代方案,同时仍具有强大的功能。Gemini 1.5 Flash从活动当天开始在谷歌的AI工作室和Vertex AI中提供公开预览版。

 

图片[2]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

2月份公布的Gemini 1.5 Pro也将迎来升级,在今年晚些时候将会把100万Tokens的窗口进一步扩大至200万,这将使其能够同时处理2小时的视频、22小时的音频、超过60,000行代码或超过140万个单词。

谷歌CEO皮查伊强调了Gemini在跨语言方面的改进,它将以35种语言向全球所有开发人员提供。皮查伊表示,Gemini 1.5 Pro可以分析PDF和视频以提供摘要,这意味着当用户假期归来后,模型可以将电子邮件和附件一起进行总结。

专为在智能手机上运行而设计的Gemini Nano也从纯文本输入扩展到可以图片输入。谷歌表示,“手机将能通过文字、图片、视频、音频,理解用户的世界。”并且整个过程都是在本地运行,不会引发隐私泄露。

开源大模型Gemma也将有一系列的更新,定于下月推出的Gemma 2参数量将能达到270亿。最后,谷歌的第一个视觉语言模型PaliGemma也被添加到Gemma模型系列中。

Veo、Imagen 3、音频概述

针对OpenAI的Sora,谷歌也推出了自己的视频生成模型“Veo”,可以根据文字、图片和视频的提示,生成各种风格的高质量1080P视频。

公司表示,Veo可以更好地理解自然语言,从而生成更能代表用户视觉的视频。它还能理解“延时拍摄”等电影术语,以生成各种风格的视频,并让用户更好地控制最终输出。

图片[3]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

去年,谷歌推出了一款名为“SynthID”的工具,可以在AI生成的图像中嵌入人眼不可见的水印。在今天的大会上,公司宣布正在将这项工具扩展到文本和视频之中。上文提到的视频生成模型Veo,在该平台生成的所有视频都会包含SynthID水印。

谷歌还推出了新一代的图像生成模型“Imagen 3”,根据公司的说法该模型可生成迄今为止最高质量的图像,图像中具有更多细节和更少伪影,有助于创建更真实的视觉体验。

与Veo一样,Imagen 3也改进了其自然语言功能,可以更好地理解用户提示及其背后的意图。谷歌称,Imagen 3是渲染文本的最佳选择,目前只有选定的创作者才能使用,很快就会在Vertex AI中推出。

通过Gemini 1.5 Pro,音频概述(Audio Overview)功能可以基于源文件生成个性化和交互式音频对话。

AI赋能谷歌搜索

作为主业,谷歌自然会大力将AI融进其主导全球的搜索引擎之中。从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。

同时谷歌搜索也将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题,并支持“拍视频”搜索解决方案的新搜索形式。

图片[4]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

根据现场演示,搜索引擎具备多步骤推理的能力,例如寻找一个瑜伽教室,同时展示新手优惠报价,和距离特定位置的步行时间。这个AI搜索引擎助手,还能介绍食谱、安排行程,以及接受视频形式的提问。

许多人可能都曾经历过花费数小时滚动浏览网页信息流来查找想要搜索的图片,对此,谷歌推出了AI解决方案。借助Gemini,用户可以在Google Photos中通过对话提示来查找他们寻找的图像。

在谷歌提供的案例中,一位用户希望看到他的女儿作为游泳运动员随着时间推移的进步,Google Photos自动筛选给出。谷歌表示,这项名为“Ask Photos”的功能将于今年夏季晚些时候推出。

Astra项目

谷歌在大会上宣布了一个名为“Astra”的高级视觉和对话响应智能体项目,即开发能在日常生活中提供帮助的通用AI智能体。媒体分析认为,这个项目旨在开发一种类似《钢铁侠》中人工智能系统“贾维斯”。

 

根据谷歌的说法,为了做到真正实用,智能体需要能够像人一样理解周围复杂多变的环境并做出反应——它需要能接收并记忆所见所闻,从而了解上下文信息并采取行动。

谷歌表示,它还需要具备主动性、“会学习”并能满足个性化需求,这样用户才能自然地与它交谈,不会有滞后或延迟。

DeepMind首席执行官Demis Hassabis在台上表示,“将响应时间缩短为对话式的内容是一项艰巨的工程挑战。”

AI芯片等硬件

谷歌推出了第六代TPU(张量处理单元)“Trillium”,将在2024年底向云客户提供。公司表示,与上一代TPU v5e相比,每个芯片的计算性能提高了4.7倍。

图片[5]-谷歌I/O发布会掀起科技狂潮,五大黑科技抢先看-零度会员

除了TPU,谷歌也会推出CPU和GPU来支持工作负载。

皮查伊也在大会上提到,谷歌云将成为首批提供英伟达Blackwell GPU的云提供商之一,他在演讲中强调了谷歌“与英伟达的长期合作伙伴关系”。

THE END
点赞1527 分享
HARDiNFO 8 Professional – 免费获取专业系统信息查看工具 [Windows][$39.5→免费]-零度会员

HARDiNFO 8 Professional – 免费获取专业系统信息查看工具 [Windows][$39.5→免费]

HARDiNFO Professional 是一款功能强大的系统信息查看工具,可详细展示当前电脑中各硬件的具体信息,以及系统、网络等参数。此外,它还内置了实用的跑分功能,让您轻松评估设备性能。  获取地...
admin的头像-零度会员admin
3.5W+2816
Windows 11 正版 ISO 系统镜像下载大全! 含最新、最简单的安装教程 (2022)| 零度解说-零度会员

Windows 11 正版 ISO 系统镜像下载大全! 含最新、最简单的安装教程 (2022)| 零度解说

https://youtu.be/yfw6vcqpqtE     Windows 11 系统官方下载地址:https://bittly.cc/AGm4q winddows 11 企业版下载:https://bittly.cc/cileE WinMD5 验证工具下载:https://bittly....
谷歌 Chrome浏览器最近一次重大升级!Chrome 90 新版功能体验 2021-零度会员
Medianex:跨平台网盘视频播放器,支持多网盘挂载+海报墙、刮削-零度会员

Medianex:跨平台网盘视频播放器,支持多网盘挂载+海报墙、刮削

Medianex 是一款跨平台的网盘视频播放器,支持通过插件接入多种网盘,包括 WebDAV、SFTP、115网盘、夸克网盘、阿里云盘、百度网盘、Alist 等,并可生成海报墙,实现电视剧、电影等内容的自动分...
admin的头像-零度会员admin
2.2W+794
谷歌 Chrome 浏览器显示“贵单位管理状态” 的彻底解决方法!-零度会员

谷歌 Chrome 浏览器显示“贵单位管理状态” 的彻底解决方法!

如果你在网上找了很多方法,都不起作用,那么可以使用下方的批处理代码来进行一键去除谷歌Chrome浏览器显示的“贵单位管理状态” 将下面的代码保存为bat批处理,然后以管理员权限打开运行即可搞...
admin的头像-零度会员admin
1.5W+2039
【限免】XenArmor 电子邮件密码恢复专业版【免费密钥】!-零度会员

【限免】XenArmor 电子邮件密码恢复专业版【免费密钥】!

XenArmor Email Password Recovery Pro可帮助 Windows 用户从电子邮件客户端和浏览器(例如 Chrome、Firefox、IE、Outlook、Thunderbird、IncrediMail 等)恢复忘记的电子邮件密码。该软件功能...
admin的头像-零度会员admin
83521366
Dark Reader 强制暗黑模式-零度会员

Dark Reader 强制暗黑模式

  适用于所有网站的暗色主题。关爱眼睛,就使用 Dark Reader 进行日常浏览。 这是一个护眼扩展程序,通过实时生成黑暗主题,为每一个网站启用夜间模式。 Dark Reader 反转明亮的颜色,使网...
admin的头像-零度会员admin
2.2W+2177
如何破解 WiFi密码,保姆级的教程,包教包会!(上) - Kali 系统安装-零度会员
“白嫖” 小红伞杀毒软件专业版,活动只剩3天,堪称白送!  | 零度解说-零度会员