新模型接连炸场AI视觉迎来GPT-3时刻,微美全息(WIMI.US)先声夺人进入爆发期
短短一周不到,视觉领域接连迎来新模型“炸场”,图像识别门槛大幅降低——这场AI热潮中鲜见动静的Meta(META.US)终于出手,推出Segment Anything工具,可准确识别图像中的对象,模型和数据全部开源。
据悉,Meta的项目包括模型Segment Anything Model(SAM)、数据集Segment Anything 1-Billion mask dataset(SA-1B),公司称后者是有史以来最大的分割数据集。
(资料图片)
引起业内轰动的便是这一SAM模型,正如名字“Segment Anything”一样,该模型可以用于分割图像中的一切对象,包括训练数据中没有的内容。
在交互方面,SAM可使用点击、框选、文字等各种输入提示(prompt),指定要在图像中分割的内容,这也意味着,用于自然语言处理的Prompt模式也开始被应用在计算机视觉领域。并且对于视频中物体,SAM也能准确识别并快速标记物品的种类、名字、大小,并自动用ID为这些物品进行记录和分类。
AI视觉迎来GPT-3时刻
对于SAM工具,英伟达(NVDA.US)人工智能科学家Jim Fan将Meta的这项研究称作计算机视觉领域的“GPT-3时刻”之一——其分割方法可以通用,可对不熟悉的物体和图像进行零样本泛化,初步验证了多模态技术路径及其泛化能力。
进一步来说,SAM可以灵活集成于更大的AI系统。例如,理解网页的视觉和文本内容;在AR/VR领域,将头显用户视线作为提示来选择对象,然后将其“提升”到3D中;对于内容创作者,SAM可提取图像区域以进行拼贴或视频编辑;SAM还可通过定位动物或物体在视频中进行研究和跟踪。
AI视觉有望飞跃式提升
公开资料显示,计算机视觉模拟大脑完成对图像的处理和解释,实现对相应场景的多维理解。以图像、视频为代表的视觉数据是互联网时代信息的主要载体之一,赋以人工智能模型感知并理解这些海量的视觉数据的能力,有助于提高人工智能自主适应环境的能力。
作为人工智能(AI)和深度学习的子领域,计算机视觉可训练卷积神经网络(CNN),以便针对各种应用场合开发仿人类视觉功能,利用图像和视频进行数据分割、分类和检测。
国盛证券预计,预计1-5年内,多模态发展将带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活;5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。
首创证券翟炜在研报中指出,META发布了视觉大模型SAM,紧接着智源研究院视觉团队也推出通用分割模型SegGPT,通用视觉大模型之战也打响。视觉大模型能把任意图像从像素阵列解析为视觉结构单元,像人类视觉那样理解各类场景,这对自动驾驶、安防、智能家居、工业视觉等众多行业都将带来飞跃式提升。
西部证券指出,Meta此次推出SAM,预示着大模型在多模态发展方面更进一步,布局计算机视觉/视频的厂商有望持续受;还有券商补充称,SAM模型突破了机器视觉底层技术。
微美全息(WIMI.US)有望进入爆发期
目前,中国计算机视觉厂商具有基于基础算法进行改进和优化并形成各自特有算法的技术能力,而作为全球领先的AI视觉解决方案提供商微美全息(WIMI.US)将成为受益者之一,据悉,该公司专注于计算机视觉全息云服务,为全球规模、覆盖产业链、业绩等方面较优秀的全息云产业综合实体之一,目标是成为有潜力、有国际影响力的全息云平台。
公开资料显示,微美全息(WIMI.US)目前已经将计算机视觉技术与虚拟现实技术相结合,开发了基于计算机视觉的三维人机交互系统。在人机之间构建自然直观的三维交互环境,并构造三维用户界面,实现和谐的、“以人为中心”的人机交互界面。
在微美全息的三维人机交互系统中,采用了视觉作为有效的输入模态。计算机视觉是一种引导系统并与视觉世界交互的人工智能技术,其从获取的输入中识别对象并提供最终结果。计算机视觉中包含了获取、转换和分析数字图像等任务,可协助人类完成识别任务、启用交互等,并基于训练数据集进行评估。使人机通讯信息交换量更大、形式更丰富,发挥人机彼此不同的认知潜力。
在AI视觉算法技术能力方面,微美全息开发了聚和聚类算法,用于支持新一代互联网的算法处理需求。聚类算法是一种机器学习算法,它将相似的数据点组合在一起形成簇(Cluster),聚合聚类新型算法能够自适应地根据图像特征进行聚类,能够处理不同类型、尺寸和分辨率的图像,并且能够结合机器学习和深度学习技术,实现更高级别的图像处理和分析。
随着深度学习、计算机视觉算法和虚拟现实技术的迅猛发展,微美全息开发的AI视觉相关应用在许多行业中都有广泛的应用,如金融、医疗、制造业、社交网络、市场营销等。同时,由于市场需求也在不断扩大,微美全息的AI视觉应用前景将进入新的爆发期。
AI视觉市场规模快速增长
国海证券陈梦竹在研报中表示,2021年中国计算机视觉技术核心产品、带动相关产业市场规模达990亿元、3079亿元,预计2025年分别达1873亿元、5771亿元。
从全球来看,2022年全球视觉人工智能市场销售额达到了113.51亿美元,预计2029年将达到218.10亿美元,年复合增长率(CAGR)为10.51%(2023-2029)。中国市场在过去几年变化较快,2022年市场规模为28.12亿美元,约占全球的24.77%,预计2029年将达到61.72亿美元,届时全球占比将达到28.30%。
总之,随着视觉技术、深度学习、高精度成像等技术的持续发展,视觉人工智能的应用场景将持续扩展。视觉人工智能无论在速度、精度、还是环境要求方面都存在着显著优势,能够替代人类视觉,更好的助力工业自动化、各行各业智能化的发展。
标签:
相关推荐:
最新新闻:
- 18-55mm镜头什么意思?镜头18-55mm适合拍什么?
- Msvcr100.dll是什么?msvcr120.dll丢失怎样修复?vcomp100dll为什么缺失?
- usb视频设备黑屏如何解决?电脑为什么一插usb直接黑屏?
- 笔记本发出滋滋的声音怎么办?笔记本喇叭滋滋响是不是坏了?
- 显卡散热不良怎么办?显卡散热器有必要吗?
- 每日速递:小米14 Pro外观曝光:后悔买小米13了?
- st500dm002-1bd142是什么硬盘?st500dm002硬盘参数
- 三星笔记本好吗?三星笔记本电脑值得买吗?
- 国产笔记本电池品牌有哪些?笔记本电池容量查看方法
- 天天信息:华为P50系列官翻开售:2988元
- 摄像头驱动精灵怎么安装?摄像头安装驱动的方法有哪些?
- 佳能1180打印机墨盒怎么装?佳能ip1180墨盒安装有哪几种方法?
- 怎样安装摄像头驱动程序?摄像头需要安装驱动么?
- 小米MIX Fold 3真机曝光:8月发布 世界最新
- 电脑未能正确启动怎么办?windows7系统开机时间怎么看?查看win7系统开机时间的方法
- 没有光驱如何重装系统?电脑有没有光驱怎么看?
- U盘文件损坏怎么修复?怎么检测自己的U盘是否损坏?
- 佳能980性能怎么样?佳能相机有哪些推荐的镜头?
- i5处理器笔记本电脑多少钱?笔记本电脑什么品牌质量最好?
- 石楠花不好闻,为啥还大面积种植?
- usb音箱有电流声怎么解决?usb音箱有哧哧的电流声怎么办?
- 理性对待校外教育培训
- 打印机怎么扫描文件到电脑?如何用打印机进行扫描?
- 卡片机是什么意思?卡片机与数码相机有什么不同?
- 微单和单反哪个好?买微单需要注意什么?
- 《红楼梦》读后感600字 读《棋王》有感600字
- 煤气罐起火该怎么办 煤气罐着火怎么办
- 天天热资讯!总投资超13亿!昆明西山景前区将提升改造
- 新模型接连炸场AI视觉迎来GPT-3时刻,微美全息(WIMI.US)先声夺人进入爆发期
- 数码视讯AI超高清耀眼美国NAB Show|热讯
- 世界今日讯!甘肃兰州中考满分作文:我相信你一定来临(1) 齐齐哈尔中考满
- 环球观焦点:看人生_山东临沂中考满分作文 新疆哈密中考满分作文:生命诚可
- 市关工委等部门编印家教指导用书
- 颍州万达广场有场退役军人招聘会
- 高考满分作文赏析:拒绝平庸900字 北京高考满分作文500字-重点聚焦
- 气温大幅“跳水” 大风雨水来袭-当前时讯
- 焦点资讯:举报违法违规使用医保基金最高奖励20万元
- 重庆高考满分作文600字:自我认识的成功走向 重庆卷高考满分|每日视点
- 内蒙古赤峰中考满分作文:与书相伴的日子 齐齐哈尔中考满分作文 焦点热闻
- 战俘、部队、记忆_读《将军的部队》有感1600字 《谁动了我-今日热门
- 当前快讯:市投资集团:上海长阳大厦项目资产转让签约圆满完成
- 重点聚焦!4月24日生意社丙二醇基准价为8633.33元/吨
- 《铁拳8》莉莉角色宣传片:千金大小姐华丽登场
- 4月24日生意社丙烯腈基准价为9525.00元/吨
- 4月24日生意社双酚A基准价为9737.50元/吨 焦点资讯
- 全球热点!超8成图书被已婚人群买走 教辅书和童书销量最高
- 环球看热讯:4月24日生意社小苏打基准价为2112.50元/吨
- 焦点速递!桥本环奈主演 童话推理小说《小红帽,在旅途中遇见尸体》宣布真人电影化
- 【环球新要闻】4月24日生意社POM基准价为13550.00元/吨
- 4月24日生意社PP(熔喷)基准价为8375.00元/吨 全球视点
- 4月24日生意社PP(熔喷)基准价为8375.00元/吨 全球视点
- 4月24日生意社双酚A基准价为9737.50元/吨 焦点资讯
- 天天速讯:合肥重大责任事故罪立案标准需要什么条件
- 喜欢喝这款饮料的注意!这8类人不宜喝
- 下一代ColorOS支持88115个汉字输入 OPPO加入腾讯汉字守护计划 全球热推荐
- 产品爆发初心未变 看宏碁全球春季新品发布会有感|天天速读
- 3699元卖爆了!一加Ace 2原神定制礼盒首销
- 卢伟冰:小米13 Ultra销量远超预期 各大平台供不应求_世界热议
- 天天通讯!降800元!华为Mate 50系列:4G信号比苹果都快!
- 广开控股拟发行2.5亿元90天超短融 用于偿还3笔银行借款
- 斗破苍穹被骂夹带私货,区别对待太过明显,真成“云破苍穹”了 环球报资讯
- 个人看法
- 不良人导演发声,李星云寿命问题已解决,女帝还有戏,三个坑会填_热推荐
- 重看才发现,李星云表面是帮漠北对付李嗣源,其实是在帮李嗣源
- 全球快报:四大尸祖下线,三圣姬已无出场必要,三千院终于不用打三份工了
- 【剧透】生肉搬运 筋肉人 新连载 412-414-观天下
- 王者荣耀 五五朋友节九大活动内容抢先看 看看你期待哪个活动先上线 天天短讯
- 我国在部分省份实施大学生村医计划
- 上海虹口:让阅读“点亮”菜场
- 数字技术加持 守护青少年心理健康
- “让越南学生的中国留学梦想触手可及”——中国留学展凸显越南青年中文求学热
- 世界视点!世界读书日 书香满中国
- 重庆丰都:助力青少年健康成长
- 全球观天下!中国首次火星探测火星全球影像图发布
- 网红花500万日元买NFT暴跌近9成 怒骂NFT是骗局|每日速看
- 《蜘蛛侠纵横宇宙》新剧照:印度蜘蛛侠宇宙亮相!|天天即时看
- 《极限竞速2023》正处于打磨阶段 今年晚些时候发布
- 户外经济激发消费动能
- 第二十次全国国民阅读调查结果发布,去年我国人均读纸质图书4.78本
- 环球简讯:触目惊心,小铲子挖出大矿洞!亲子研学竟是“带娃挖宝”
- 刷牙前牙膏要不要蘸水?先吃早饭还是先刷牙?一文读懂!
- 天天实时:自行车道悄然变宽,河畔绿荫路段越来越多,城六区步行骑行比例创近10年新高
- 今年高考6月7日至10日进行,放弃专项计划入学资格不得再报|全球热消息
- 天天滚动:汇总!各区义务教育入学咨询电话公布
- 全市2023年乡村振兴示范区建设第一季度现场观摩推进会召开