微软推出最新视觉基础模型Florence-2 ,可在WebGPU的浏览器独立运行!

图片[1]-微软推出最新视觉基础模型Florence-2 ,可在WebGPU的浏览器独立运行!-零度博客

Florence-2:微软全新开源视觉模型!

能够执行超过10种不同的视觉任务 包括图像字幕生成、对象检测、图像区域关联和分割等。

它不仅能描述图片的内容,还能识别图片中的物体,并指出这些物体的位置。

比如,如果你给它一张公园里的图片,它可以告诉你图片里有一个穿蓝衣服的女孩在玩耍,旁边还有一只狗。

Florence-2 系列包括 Florence-2-base 和 Florence-2-large,参数分别为 0.23 亿和 0.77 亿。尽管模型较小,但性能并不逊色。

可以运行在各种资源受限的移动端设备上。 Florence-2 采用统一的、基于提示的表示方式来处理各种视觉任务。 通过简单的文本提示,模型可以生成所需的文本形式结果,无论是图片描述、目标检测、视觉定位还是图像分割。这种方法简化了多任务处理的复杂性,提高了模型的通用性和适应性

图片[2]-微软推出最新视觉基础模型Florence-2 ,可在WebGPU的浏览器独立运行!-零度博客

 

Florence-2是Microsoft 在MIT 许可下开源的轻量级视觉语言模式。该模型在字幕、物件侦测、接地和分割等任务中展示了强大的零样本和微调功能。

尽管尺寸很小,但它所取得的结果与大许多倍的模型(如Kosmos-2)相当。该模型的优势不在于复杂的架构,而在于大规模的FLD-5B 资料集,其中包含1.26 亿张影像和54 亿个综合视觉注释。

微软推出最新视觉基础模型Florence-2 ,可在支援WebGPU的浏览器独立运行

该模型支持多种功能,可用于生成图像、识别字元、分割图像、检测物体等等。

Florence-2 比其前身更小、更精确。 Florence-2系列由两个模型组成:Florence-2-base和Florence-2-large,分别有2.3亿和7.7亿参数。此尺寸甚至允许部署在行动装置上。

尽管规模较小,但Florence-2 在所有基准测试中都取得了比Kosmos-2 更好的零样本结果,尽管Kosmos-2 拥有16 亿个参数。

Florence-2的本地化运行得益于Transformers.js和ONNX Runtime Web技术的支持。这一突破不仅提高了使用者隐私保护水平,还大大降低了使用成本,为AI视觉技术的普及应用铺平了道路。

THE END
喜欢就支持一下吧
点赞2176 分享
相关推荐
11 个 无需注册的免费电影流媒体网站-零度博客

11 个 无需注册的免费电影流媒体网站

想无忧无虑地看电影?使用这些免费、合法且无需注册的网站。那么接下来的11个网站非常适合你! Netflix、Paramount+ 和 Disney+ 等无数流媒体服务可以让您轻松观看电影,但您需要注册并支付每月...
admin的头像-零度博客admin
1.9W+2251
我们是谁?来自哪里?为什么这么做?为什么要出国? 一名80后UP主的心声!| 零度解说-零度博客
SingleFile 将完整的页面(包括 CSS、图片、字体、框架等)保存为一个文件-零度博客

SingleFile 将完整的页面(包括 CSS、图片、字体、框架等)保存为一个文件

SingleFile 是一个扩展程序,可帮助您将整个页面(包含 CSS、图像、字体、框架等)保存为单个 HTML 文件。入门- 等待页面完全加载。- 单击扩展工具栏中的 SingleFile 按钮以处理并保存页面。- ...
admin的头像-零度博客admin
2.7W+6249
WinX MediaTrans – iOS 、Mac/ Win 设备数据传输工具-零度博客

WinX MediaTrans – iOS 、Mac/ Win 设备数据传输工具

WinX MediaTrans是一款功能强大的iOS设备多媒体数据管理软件。它可以帮助用户在iPhone、iPad、iPod、Mac  和Windows电脑之间轻松传输、备份和管理各种类型的数据文件,包括照片、音乐、视频、电...
admin的头像-零度博客admin
1.3W+1528
CloudFlare 优选ip 和 优选域名的获取方法!懒人加速必备-零度博客

CloudFlare 优选ip 和 优选域名的获取方法!懒人加速必备

  1.CloudFlare优选IP网站:【链接直达】   2.CloudFlare 优选IP工具:【开源软件】     3.CloudFlare 优选域名:【GitHub开源工具】   4.CF优选域名推荐: time.cloud...
admin的头像-零度博客admin
12.8W+1708
黑客正在侵入 AT&T 的电子邮件账户以窃取加密货币-零度博客

黑客正在侵入 AT&T 的电子邮件账户以窃取加密货币

AT&T 称网络犯罪分子利用 API 问题控制了受害者的电子邮件地址 获悉,未知黑客正在侵入拥有 AT&T 电子邮件地址的人的账户,并利用该访问权限侵入受害者的加密货币交易所账户并窃取他们...
admin的头像-零度博客admin
1.2W+6539
一键删除 Windows 自带的臃肿软件!只需这行代码,让你的电脑更高效运行!| 零度解说-零度博客
Chrome AI - Chrome 内置免费/离线 AI 对话/翻译-零度博客

Chrome AI – Chrome 内置免费/离线 AI 对话/翻译

    【点击前往】下载安装插件   在侧边栏(Side panel)里打开 Chrome 内置 Gemini Nano AI,可以免费离线使用 AI 对话和翻译功能。
admin的头像-零度博客admin
2.2W+2176
Telegram 服务器出现大范围的宕机!导致大量用户无法正常使用电报-零度博客

Telegram 服务器出现大范围的宕机!导致大量用户无法正常使用电报

  2022年 1月17号 22点左右开始 全球流行的私密聊天应用程序:telegram 俗称电报,出现大范围的宕机现象。 零度TG群:https://t.me/lingdutg ,平时晚间都会有1000多人在线, 但是今晚一直...