• 财讯网
  • 主页 > 要闻 > 正文

    今日最新!脸书发布SAM图片分割新模型炸场!通用视觉GPT将临

    2023-04-11 12:17:26  |  来源:九方智投  |  编辑:  |  

    投资机会:重点公司韦尔股份、思特威、奥普特、虹软科技

    CMOS图像传感器芯片:韦尔股份、格科微、思特威;

    智慧安防:海康威视、大华股份;


    (资料图)

    自动驾驶:中科创达、德赛西威;

    AR/VR:当虹科技、虹软科技;

    机器视觉:奥普特、凌云光;

    卫星遥感:航天宏图、中科星图;

    一、AI分割一切:新模型炸场,通用视觉GPT将临,图像识别门槛大降

    4月5日,MetaAI发布首个图像分割开源基础模型SAM新模型和图像数据集,用GPT方式(基于Transform模型架构)让计算机具备理解图像个体“对象”的通用能力(识别哪些图像像素属于一个对象)。图像数据集包含1100万张图像和11亿个掩码的训练数据集SA-1B,该数据集包含的图像数量是以前可用分割数据集的六倍,分割掩码数量是以前的400倍。

    SAM模型大幅度提高标注效率:建立一个可以接受文本提示、基于海量数据训练而获得泛化能力的图像分割大模型。计算机视觉通过图像分割识别和确认图像中的不同物体,把它们从背景中分离出来,将在自动驾驶(检测其他汽车、行人和障碍物)、医学成像(提取特定结构或潜在病灶)等应用中特别重要。

    亮点:分割重大进展,优化标注,大幅度提高标注效率

    第一,分割可能有大模型,CV的大模型是可能存在的;

    第二,一个大模型可能同时实现分割、检测、追踪;

    第三,一个简单设计满足三个约束,称为SAM。一个强大的图像编码器计算图像嵌入,一个提示编码器嵌入提示,然后将两个信息源组合在一个预测分割掩码的轻量级掩码解码器中。

    SAM“一触即通”:通过一个点或边界框,在待预测图片上给出交互提示,识别分割画面上的指定物体。SegGPT训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸等等。所提出的FeatureEnsemble方法可以支持任意数量的prompt示例,实现丰俭由人的推理效果。

    同时,智源研究院视觉团队也推出通用分割模型SegGPT(SegmentEverythingInContext)——利用视觉提示(prompt)完成任意分割任务的通用视觉模型。智源通用视觉模型Painter(CVPR2023)的衍生模型,针对分割一切物体的目标做出优化。SegGPT训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸等等。1.通用能力:具有上下文推理能力;2.灵活推理能力:支持任意数量的prompt;2.灵活推理能力:支持任意数量的prompt;

    SegGPT“一通百通”:给出一个或几个示例图像和意图掩码,模型就能get用户意图,“有样学样”地完成类似分割任务。用户在画面上标注识别一类物体,即可批量化识别分割同类物体,无论是在当前画面还是其他画面或视频环境中。

    通用视觉GPT已曙光乍现。无论是“一触即通”还是“一通百通”,都意味着视觉模型已经“理解”了图像结构。SAM精细标注能力与SegGPT的通用分割标注能力相结合,能把任意图像从像素阵列解析为视觉结构单元,像生物视觉那样理解任意场景,通用视觉GPT曙光乍现。

    二、SAM有望赋能众多垂直领域,释放AI强大潜力。

    SAM是一个可以执行交互式分割和自动分割的通用模型。展望将来,SAM可以成为更大的AI系统的一个组成部分,用于对世界做更通用的多模态理解,例如,理解网页的视觉和文本内容;在AR/VR领域,SAM可以根据用户的目光选择对象,然后将其“提升”到3D中;对于内容创作者,SAM可以提取图像区域以进行拼贴或视频编辑;SAM还可通过定位动物或物体在视频中进行研究和跟踪。预计1~5年内,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。

    预计5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

    1)AR/VR:SAM可以根据AR/VR头显传来的用户视觉焦点信息,来选择对应的物体,有望推动AR/VR产业发展。多模态技术还能助力游戏内容与元宇宙构造,随着AR/VR技术的发展,未来将能构建逼真的虚拟现实。比如传统的3D模型构建需要耗费大量时间和人力成本,但用AI可以快速构建3D模型,还能快速制作游戏中的NPC,对游戏创作和元宇宙构造起到降本增效的作用。

    Meta公司内部已开始使用SAM,对其网站的图片、审核、Facebook和Instagram用户推荐内容等进行标记,同时,其官网也展示了SAM在VR/AR、智慧农业等领域的颠覆性应用畅想。

    2)自动驾驶:图像分割在自动驾驶中有重要作用,对基于纯视觉方法的自动驾驶分辨技术,图像分割的精度是决定自动驾驶效果的重要因素。SAM模型的提出有望为自动驾驶中图像分割问题提供新的思路和方法。SAM有利于检测行人、汽车、障碍物等,提升智能汽车算法数据标注的效率,使算法迭代加速。

    3)SAM模型有望在卫星遥感领域也得到广泛的应用。卫星遥感:在卫星的遥感图像中,一般植被或建筑物是比较大明显物体,相对而言,路属于较难的目标,在图像分割时,不进行特殊处理,会导致无法正确分类分割。

    4)SAM的出现让视觉泛化能力迈进了一大步,有望应用于人形机器人。

    机器视觉:为机器植入眼睛和大脑,让机器取代人工,帮助制造业实现自动化和智能化,是现代化制造提质、增效、降本、减排的推动力,是推动智能制造的关键引擎。

    在工业的瑕疵检测等场景中,对于目标物体的识别和分割也是关键环节,SAM模型有望赋能机器视觉。机器人下游场景差别很大,若想要实现应用大规模快速落地,需要增强模型泛化能力,提升模型的通用性,以降低推广成本。

    图:机器视觉与人工视觉对比

    资料来源:奥普特招股说明书,公司公告,九方智投、中信建投

    据MarketsandMarkets统计,2015年至2020年,全球机器视觉器件市场以13.83%的复合增长率增长,市场规模至2020年达到107亿美元;2021年至2025年,全球机器视觉器件市场规模将以6.56%的复合增长率增长,至2025年市场规模将达147亿美元。

    中国市场已成为全球机器视觉市场规模增长最快的市场之一。根据中国机器视觉产业联盟的统计,中国机器视觉行业的销售额从2018年的101.80亿元增长至2020年的144.20亿元,复合增长率达19.02%。得益于宏观经济回暖、新基建投资增加、数据中心建设加速、制造业自动化推进等因素,预计2020年至2023年,中国机器视觉行业的销售额将以27.15%的复合增长率增长,至2023年销售额将达296.00亿元。

    机器视觉助力工业生产线智能化升级主要应用在消费电子,其次是新型显示、印刷包装、半导体检测、新能源。

    图:全球与中国机器视觉器件市场规模

    中国机器视觉产业链生态图谱

    中国机器视觉行业竞争梯队(按注册资本)

    资料来源:MarketsandMarkets,中国机器视觉产业联盟,依据2020年中国机器视觉产业联盟企业调查,包括133家受访企业,,前瞻研究院,九方智投

    在工业领域,零部件在工业生产线包装过程中存在检测速度慢、自动化检测水平低下、检测准确率不高等问题,SAM可有效改善这些问题;

    在医疗领域,SAM可对医学影像进行分割标注,帮助医生进行病理分析和诊断;

    在数据标注领域,SAM可提高注释图像效率,新注释数据则可反过来用于更新SA,迭代改善模型和数据集。

    机械控制:人形机器人在运行的时候不需要特殊的环境或对环境进行改造,具备更开放的生态、更快的场景适应性。但由于不同的关节构造、不同的轴、不同的手指数或手之间承担的力量、转动幅度和灵活性存在差异,人形机器人的关节机械控制成为难点。

    光纤器件主要包括超高速光模块、波长选择光开关、超连续谱光源、特种光纤、特种光栅等产品;光纤仪器包括特种光纤熔接机、测试仪表等产品。广电光接入网设备包括光放大器、光接收机、光发射机、各类MoCA接入网设备和光接入ONU/OLT(光网络单元/光网络终端设备)等。主要厂商包括万隆股份、无锡雷华、成都康特和路通视信等企业。

    投资机会:

    智慧安防:海康威视、大华股份;

    自动驾驶:中科创达、德赛西威;

    AR/VR:当虹科技、虹软科技;

    机器视觉:奥普特、凌云光;

    卫星遥感:航天宏图、中科星图;

    CMOS图像传感器芯片:韦尔股份、格科微、思特威;

    重点公司:

    韦尔股份:库存有望于2023Q2向正常水位回归。2022年消费电子及安防需求影响,公司在产品价格端及库存端承压大,预计通过供应链调整及存货跌价准备,22Q4起库存进入积极调整阶段。公司库存由2022Q3的141.1亿降至2022Q4的123.6亿元,2023Q1-Q2我们预计将继续以每季度12~18亿的水平下降。

    车载CMOS图像传感器

    安防CMOS图像传感器

    在本轮安卓库存去化结束后、公司产品结构有望迈上新台阶。公司集中资源、精兵攻克车规级Serdes、PMIC及LCoS等核心料号,韦豪创芯赋能,新品陆续推出,公司提供产品单车价值量及车相关营收占比有望持续提升,2023年轻装上阵。新品发布加速,非凡研发实力持续显现。智能手机领域,豪威已经成功破局高端,且部分产品已走在全球先列。公司已正式发布/正式量产高端产品包括OVA0B\OVB0B、OV50A(旗舰大底主摄)、OV60A、OV50E(1.0um像素尺寸,交错式HDR和DCG技术)、OV60B10(CIS/EVS融合视觉芯片)等新品。

    汽车领域,豪威持续领先业界推出革命性产品。2022年领先业界推出汽车行业首款用于车内监控系统(IMS)的500万像素RGB-IRBSI全局快门传感器OX05B1S。丰富新品包括升级版300万像素1/2.7英寸CIS产品OS03B10、500万像素RGB-IR全局快门车内监控OX05B1S、汽车环视系统、后视系统和电子后照镜摄像监控系统OX03D等,2023年拳头新品有望超预期。韦豪创芯赋能,延伸汽车电子、AI布局。

    韦豪创芯已投资于一批优质的AI、汽车电子相关厂商,助力集团从车载CIS拓展至更多汽车电子产品,与公司现有业务形成强协同,同时布局供应链增加公司未来新品产能保障;从公开披露来看韦豪创芯投资包括景略半导体、爱芯元智、地平线、共达电声等。公司提供产品单车价值量有望提升,从而深度受益AI+汽车硅含量提升大趋势。

    思特威:CMOS图像传感器已覆盖安防监控、机器视觉、智能车载电子、智能手机等多场景应用领域的全性能需求。2020年公司安防监控CIS出货量1.46亿颗,位列全球第一。从竞争格局来看,CMOS图像传感器出货量排名全球前十家企业依次为格科微电子,索尼,三星,豪威,SK海力士,思特威,意法半导体,安森美,松下及晶相光电,中国企业仅上榜3家,CMOS图像传感器国产替代空间仍然巨大,叠加行业内生的快速增长,中国厂商尤其高性能CMOS的本土公司将在庞大的蓝海市场充分成长。

    公司目前在安防监控应用领域已经拥有了覆盖全市场的各类像素水平及前照式、背照式各系多款产品,满足行业各种细分场景、从高端到低端的各类应用需求,同时还前瞻性地洞察客户差异化需求,旨在为客户终端产品提供更优的附加值。以2020年出货量口径计算,公司的产品在安防CMOS图像传感器领域位列全球第一。随着国内安防市场对包括CMOS图像传感器在内的安防监控产品的需求也由一线城市延伸至二、三线城市及农村地区,以及视频监控系统的复杂度逐步提高,对CMOS图像传感器性能的要求的不断升级,公司高端产品的市场份额将进一步提升。

    开拓车载业务和机器视觉打造公司新成长曲线。公司在优势的安防监控领域保持持续增长外,随着公司产品线的逐步扩展,应用领域不断扩大。车载电子领域,公司积极顺应市场需求进行快速研发和产业化布局,已实现智能车载系列化产品,应用场景涵盖智能车载前装和后装的应用,产品层面从倒车后视、360度环视、车内监控和驾驶员疲劳检测实现全系列覆盖,能够适应不同的应用场景和技术需求。

    2021年应用ISP片上集成二合一技术的新产品销售增加,同时有产品达到车规级标准,进入车载前装市场,高端产品占比的进一步提升带动智能车载电子领域毛利率提升。机器视觉领域,公司产品涵盖消费级机器视觉、工业相机、智能交通等多样化的应用领域,能够广泛覆盖下游客户的需求,从技术角度来看,公司已布局高像素、大靶面和高分辨率产品,锚定高端定位的同时解决客户需求痛点,保持独特的竞争优势。

    奥普特:营收实现快速增长,核心领域成长良好。

    公司充分受益于行业龙头扩产带来的大量新增机器视觉需求,同时客户对产品安全性的重视提升,也带来更多高标准检测需求。此外,公司还布局了汽车、半导体等领域,协助下游客户增强智能制造能力,伴随着行业国产化进程不断推进,有望成为新增长点。

    高研发投入巩固技术优势,工业AI打开成长空间。公司始终坚持以产品和技术为引领,在多个种类的机器视觉核心部件上实现了产品突破和迭代。在视觉软件产品线方面,公司持续加大对深度学习(工业AI)领域的投入,基于自研算法,在迁移学习、领域自适应、小样本学习方面取得突破性进展,在锂电、3C等行业的数十个场景取得良好应用效果。

    公司光源产品线推出具有多颜色切换功能的1000万lux照度的光纤光源、风冷散热的500万lux照度的线扫光源。此外,公司的3D、智能读码器、镜头、相机等产品线上也实现了更新迭代。公司深耕机器视觉领域多年,在3C电子、新能源、半导体行业积累了大量数据,有助于公司快速训练和提升AI模型的响应速度和准确度。

    虹软科技:AIGC+VRAR+SAM黑科技的技术领军

    虹软适应AI趋势的原因是底层技术裁剪的好,甚至有从汇编开始优化的能力。

    1)随着2023年大模型技术变化成为焦点,AIGC、VRAR、多模、SAM模型、甚至更高端的AI技术,都与虹软科技产生了技术甚至业务联系。

    2)由于其底层技术裁剪的好,甚至通过汇编语言局部优化(比C更加底层)。外部技术趋势的巨大变化,虹软都可以很快适应并切入客户应用。虹软视觉开放平台就是证据,展现底层SDK、OS级AI模组、公开课,可见其底层能力。由于底层有核心技术,所以技术组合应对新趋势更容易。

    商业效果:大单增加,AI的ASP提高,竞争力不受趋势变化反而提高。

    1)其在载体较大的业务粘性,会转化为订单提高、附加值ASP提高,因此受益于AIGC+VRAR+SAM+多模态(甚至更多AI应用)技术趋势的更迭。

    2)3月21日,OPPO今日发布全新影像旗舰FindX6系列,背后即为虹软的AI力量。

    3)披露《关于签订软件授权合同的公告》,4579万美元大合同,2023年4月开始。该订单意味着:该领域AI算法需要更新,虹软有业务粘性,强者恒强,已经提前技术更新。

    参考资料:

    20230408-国盛证券-多模态GPT的号角:SAM

    20230410-安信证券-计算机:平衡发展和安全,关注SAM模型和AI监管

    20230410-国盛证券-韦尔股份:新品迭出,2023年轻装上阵

    20230403-国元证券-奥普特年度报告点评:营收实现快速增长,核心领域成长良好

    20230404-东亚前海-思特威:安防领域稳发展,汽车+手机拓宽引增长

    20230410-申银万国-虹软科技:AIGC+VRAR+SAM黑科技的技术领军!

    本报告由研究助理协助资料整理,由投资顾问撰写。投资顾问:王德慧(登记编号:A0740621120003)

    关键词:

    上一篇:    下一篇: