1.8万字！或许是全网较全面的机器人视觉传感器行业分析（数据丰富）

发布日期：2025-01-08 10:15:49 来源：传感器专家网作者：传感器专家网浏览量：8

传感器专家网传感器专家网发布日期：2025-01-08 10:15:49

视觉传感器，也称为机器视觉，它能够模仿人类视觉系统，赋予机器“观看”和“认知”的能力，在识别、测量、定位和检测等多个领域替代人眼的功能。作为现代工业和技术发展的重要推动力，机器视觉在提升生产效率、保障作业安全以及推进智能制造等方面发挥着显著的作用并拥有巨大的发展潜力。当前，3D视觉技术正在用于提升人形机器人的环境感知和交互能力。随着未来人形机器人出货量的增加以及技术的不断迭代升级，视觉解决方案也将逐步优化并定型，机器视觉行业市场规模也将更加广阔。

本文将探讨机器视觉这一领域，详细介绍其主要功能、技术原理等基础知识，并梳理推动机器视觉发展的相关政策。接下来，我们将深入分析机器视觉的主流技术分类，并对产业链的关键环节进行详细梳理，探讨产品价格。此外，我们还将整理不同人形机器人所采用的视觉方案。文章最后，将列举相关企业，以期这些内容能够增进大家对机器视觉的认识和理解。

01 行业概述

1、机器视觉的概念及工作原理

视觉传感器，即机器视觉，是由计算机或图像处理器以及相关设备来模拟人的视觉行为，完成得到人的视觉系统所得到的信息。在工业生产中，机器视觉的引入旨在提升效率、减少误差、降低成本，并从繁重或危险的工作环境中解放人力。该技术的运作机制主要包括以下几个步骤：

首先，利用工业相机和镜头等视觉设备捕获待检测物品的图像。接着，这些图像信息被转换成图像信号，并送入图像处理系统。在图像处理系统中，物品的亮度、颜色、尺寸等属性被转换成数字信号。最终，机器视觉系统通过对这些信号进行分析和处理，提取出关键特征，并根据这些特征来控制现场的设备运作。

根据图像数据的维度，机器视觉的应用可分为二维（2D）和三维（3D）两大类。2D技术能够获取平面图像，并在二维空间内定位目标，但其无法提供物体的三维信息，如高度和体积，且易受光照变化和物体运动的影响。相比之下，3D技术能够提供更全面的物体信息，并在三维空间内定位目标，从而实现更为复杂的功能，如人脸识别和3D建模。尽管3D技术在数据处理和存储方面仍存在挑战，但它在许多应用场景中展现出独特的优势。机器视觉技术是一个跨学科的领域，它融合了图像处理、机械工程、光源照明、光学、传感技术、算法开发以及计算机科学等多方面的技术和知识。通过这些技术的结合，机器视觉能够实现对复杂场景的高效识别和处理，为自动化和智能化生产提供强有力的技术支持。

2、视觉传感器的主要功能及应用

机器视觉的主要功能包括识别、测量、定位和检测。

1)识别功能：基于目标物的特征进行甄别，包括外形、颜色、字符、条码等。识别的准确度和速度是评估识别性能的关键指标。通过机器视觉，可以快速且准确地识别出目标物，提高生产效率。

2)测量功能：将获取的图像像素信息转换为常用的度量衡单位，从而精确计算出目标物的几何尺寸。机器视觉在高精度以及复杂形态的测量方面具有显著优势，能够提供更准确、更可靠的测量结果。

3)定位功能：用于获取目标物体的位置信息，可以是二维或三维的位置信息。定位的精度和速度是定位功能的主要评价标准。机器视觉能够实时、准确地获取目标物体的位置信息，为自动化生产提供有力支持。

4)检测功能：外观检测，其种类繁多。例如，产品装配后的完整性检测可以确保元器件被正确安装在印刷电路板上；外观缺陷检测则可以检测产品表面是否有划痕、凹凸不平等问题。机器视觉在检测领域的应用能够及时发现并处理潜在问题，提高产品质量和生产效率。机器视觉应用广泛，目前主要应用在智能制造的工业场景，医学、智能交通等场景也有应用。

3、视觉传感器助力人形机器人感知世界

未来的人形机器人将会拥有语音感知交互能力（“嘴巴”和“耳朵”）、视觉感知交互能力（“眼睛”），以及各种AI决策分析能力（“大脑”）。人类约80%的信息是通过人眼感知获取的，未来的机器人也将和人类一样，大量信息都将通过视觉感知获取。现实物理世界是三维的，发展多年的2D成像技术难以完整重现各类三维场景，3D视觉感知技术则可以让终端获取更多精准的三维信息，助力各类终端更好地看懂三维世界。

从人形机器人来看，机器视觉技术的主要用途是实现视觉感知和交互。视觉感知层面，人形机器人需要通过摄像头等传感器获取周围的环境信息，例如障碍物、人和物品等，以此做出相应的行动。机器视觉技术可以通过识别图像和视频中的目标，如人脸、手势、表情等，实现智能化的感知。人机交互领域，人形机器人需要与人类进行交互，使其具有更加人性化的功能和行为表现。机器视觉技术可以通过识别人类的面部表情、手势等，来实现人机交互和情感交流，从而增加其交互体验和智能化的感知。

4、机器视觉和人类视觉对比

机器视觉技术在人形机器人发展中的优势在于其具有精确性强、速度快、适应性强、客观性高、重复性强、检测效果稳定可靠、效率高、方便信息集成等特点，可以使人形机器人更加能够感知周围环境，并根据所获取的信息做出相应的动作和反应，从而增加其更加人性化的功能与表现，这将会提高人形机器人在各个领域中的应用价值和前景。但其需要满足高精度、大数据量和实时性等多个方面的要求，同时还需要具备更高的安全性、智能化和可靠性等技术挑战。

02 政策利好机器视觉

国家出台多项政策利好机器视觉行业发展。政策从拓展产业链应用场景、发展机器视觉底层技术等方向促进中国机器视觉产业的发展，同时AI+机器视觉技术与设备在“十四五”规划中受到高度重视，2021年底《“十四五”数字经济发展规划》中重点推进机器视觉、机器学习等技术应用，良好的政策环境有利于为行业的可持续发展奠定良好的政策支持，为机器视觉行业的健康发展保驾护航。

03 机器视觉主流技术分析

不同应用领域或场景对视觉的测量范围、测量精度、尺寸和功耗等性能要求均不同。视觉技术按照成像维度的不同，可以划分为2D和3D两大类别。

1、2D视觉技术

2D视觉技术在过去几十年里经历了显著的进步，分辨率从最初的数十万像素提升至现今的数亿像素，图像的色彩还原变得更加真实，图像质量也得到了显著提升。尽管如此，2D成像技术使用到的传统RGB相机，仅能捕捉到物体表面的纹理信息，没有物体到相机的距离信息，无法提供对于精确的识别、追踪等功能所需的空间形态、几何尺寸和位姿信息等。

2、3D视觉感知技术

3D视觉相对于2D应用场景更加复杂、精度更高、视觉信息获取量更加丰富。3D视觉成像技术可分为光学和非光学成像方法。目前应用最多的还是光学方法，包括：飞行时间（ToF）法（包括dToF、iToF）、双目视觉法、结构光法、激光扫描法、激光散斑法、干涉法、照相测量法、激光跟踪法等等，常用的为前三种方法。目前机器人视觉由于人形机器人的与外界复杂环境交互需求的提升，同样也需要使用3D视觉系统。机器人视觉相比传统机器视觉更加3D化、高度集成化、场景复杂化。作为机器人感知的前沿和核心手段，3D视觉通过使用相关仪器来获取物体的图像数据信息，然后再对获取的数据信息进行分析处理，利用三维重建的相关理论重建出真实环境中物体表面的轮廓信息，让机器人感知周围环境中物体的轮廓和距离，为后续执行指令动作参考使用。

（1）双目立体视觉法

双目视觉（Stereo）法的工作原理来源于人类的双目视觉系统，也就是说从不同的视角通过两个相同的相机捕获同一个位置下的左右两侧图像进行匹配，然后再利用三角测量原理获取物体的深度信息，通过这些深度信息重建出物体的三维模型。此外基于类似原理还衍生出多目视觉法，是在双目视觉的基础上，增加一台或者多台摄像机作为辅助进行测量，从而获得不同角度下同一物体的多对图像。多目视觉法大多数的理论与双目视觉法是相同的，唯一不同的是，多目视觉采用了三个或三个以上的摄像头进行环境中目标物体的获取，使得当测量物体的表面倾斜的角度太大导致其中的一个或两个摄像机不能接收到漫反射光时，其他的摄像机可继续工作。双目立体视觉法优点在于具有高3D成像分辨率、高精度、高抗强光干扰等优势，且可以保持较低成本。

缺点主要有二，一是需要通过大量的CPU/ASIC演算取得它的深度和幅度信息其算法极为复杂较难实现，同时该技术易受环境因素干扰，对环境光照强度比较敏感，且比较依赖图像本身的特征，因而拍摄暗光场景时表现差；其二是过度的依赖于被拍摄物体的表面纹理，如果被摄物体表面没有明显的纹理，使用双目立体视觉法会无法匹配与之对应的像素。

（2）结构光法

结构光法（Structured Light）是一种主动双目视觉技术，其基本原理是通过近红外激光器，将具有已知的结构特征（比如离散光斑、条纹光、编码结构光等）的光线投射到被拍摄物体上，再由专门的红外摄像头进行采集三维物体物理表面成像的畸变情况，最后通过观测图案与原始图案之前发生的形变由此来得到图案上的各个像素的视差。这个技术通过光学手段获取被拍摄物体的三维结构，再将获取到的信息进行更深入的应用。其工作原理可看作是另一种双目法，红外激光器和红外摄像头可当做是双目立体视觉法中的左右双目的观测原理。结构光技术相较于双目技术的优势在于：

（1）在场景较暗的场景下也可以运作正常结构光的红外激光器是主动发射光的光源，可以照亮被扫描物体，所以结构光并不像双目结构一样依赖于光源；

（2）在表面较平整、没有明显图案纹理的物体表面也可以实现深度扫描，从而测算出物体的三维深度。

（3）飞行时间法飞行时间法（ToF,Time of Flight）是一种3D测量方法，其原理是通过给目标连续发送光脉冲，然后用传感器接收从物体返回的光，通过探测这些发射和接收光脉冲的飞行（往返）时间来得到目标物距离。传感器通过计算光线发射和反射时间差或相位差，来换算被拍摄景物的距离，以产生深度信息，此外再结合传统的相机拍摄，就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。

ToF技术具有以下的优点：

1）软件复杂性低，设计与应用简单；

2）在暗光与强光环境下表现不错；

3）功耗不高；

4）有较远的探测距离；

5）成本低；

6）响应速度快。缺点则在于室外受自然光红外线影响大、远距离无法保证精度。

ToF又分为两种，一是直接飞行时间（Direct ToF即dToF），其原理比较简单，即直接发射一个光脉冲，之后测量反射光脉冲和发射光脉冲之间的时间间隔，就可以得到光的飞行时间。探测器系统在发射光脉冲产生的同时启动一个高精度的秒表，当探测到目标发出的光回波时，秒表停止并直接存储往返时间。 dToF通常用于单点测距系统，但由于像素级亚纳秒电子秒表的实现困难，dToF的成本以及技术难度相较于iToF更高。目前主流方案是采用SPAD（一种高灵敏度的半导体光电检测器，被广泛运用于弱光信号检测领域）结合dToF技术，来精确检测记录光子的时间和空间信息，从而进行场景的三维重构。dToF的原理看起来虽然简单，但实际上很难达到较高的精度，主要原因是过程中对于秒表和脉冲信号的精度都有很高要求，且dToF中核心组件SPAD制作工艺复杂，综合成本对比iToF高很多，故目前多数厂家都在推进iToF的研究。二是间接飞行时间（Indirect ToF即iToF）。iToF的原理要复杂一些，其发射的并非一个光脉冲，而是调制过的光。接收到的反射调制光和发射的调制光之间存在一个相位差，通过检测该相位差就能测量出飞行时间，从而估计出距离。其中，往返行程时间是从光强度的时间选通测量中间接外推的。在这种情况下，不需要精确的秒表，而是需要时间选通光子计数器或电荷积分器，它们只需较少的计算工作和硅面积，就可以在像素级实现。

3、常见的3D视觉产品

（1）激光雷达

激光雷达（LiDAR）全称为Light Detectionand Ranging激光探测和测距，是发射激光束探测目标的位置、速度等特征量的雷达系统。其工作原理是向目标发射探测信号（激光束），然后将接收到的从目标反射回来的信号（目标回波）与发射信号进行比较，经运算处理后，获得目标距离、位置、速度、形状等信息，从而对被测物体进行探测、跟踪和识别。激光雷达包括四大要素：测距原理、光束操纵方法、光源和探测器。激光雷达的测距原理包含ToF和FWCW（相干测距法）。目前，ToF型激光雷达在产业链成熟度上更为领先，是当前市场上的主流技术路径。

（2）深度相机

深度相机，又称为3D相机，通过该相机能拍摄出空间景深距离，这也是与普通摄像头（2D）的最大区别。通过3D相机获取到的数据，能准确知道图像中每个点离摄像头的距离，这样加上该点在2D图像中的(x,y)坐标，就能获取图像中每个点的三维空间坐标。目前常用的RGB-D（Depth）相机即为能够结合传统2DRGB相机图像与距离信息的一种深度相机。3D相机按照成像即结构光、双目视觉、光飞行时间(ToF)。

04 产业链分析

机器视觉的产业链中，工业视觉上游主要有光源、镜头、工业相机、工控机（包含图像采集卡）、图像处理软件等机器视觉组件设备。用于消费领域的3D视觉主要由红外光发射器、红外光摄像头、可见光摄像头、图像处理芯片构成。产业中游包括基于视觉应用软件的应用系统（如检测、测量、定位、识别系统/定位引导系统等）以及各类视觉设备；产业链下游主要为各行业的产线综合解决方案供应商终端行业，如3C电子、汽车与零部件、新能源、半导体、医疗制药等。

1、工业相机：捕捉和分析对象的核心部件

工业相机是机器视觉系统的核心部件，其本质是一个光电转换器件，主要功能是将收到的光信号转变成有序的电信号，然后再通过模数转换并送到处理器以合成图像，并进一步进行处理、识别和分析。工业相机按传感器的结构特性分为线阵相机和面阵相机；按照输出信号的方式分为模拟相机和数字相机；按照响应频率的范围分为可见光（普通）相机、红外相机和紫外相机等。工业相机性能指标包括分辨率、动态范围、最大行/率、最大信噪比、光时间、功耗。工业相机可以分为2D工业相机、3D工业相机等品类，我国2D工业相机市场稳步发展，3D工业相机市场仍处于早期发展阶段。 2023年我国2D工业相机市场规模达37.9亿元。

从市场规模来看，GGII数据显示，2023年我国2D工业相机市场规模为37.90亿元，同比增长8.12%。伴随下游行业迎来恢复性增长，据GGII预计，2028年2D工业相机市场规模将超过70亿元，2024-2028年复合增长率超过14%。国产化进程加速，国产品牌主导地位初步形成。全球2D工业相机行业由国外知名企业如德国Basler、加拿大DALSA、美国康耐视等主导。我国对于工业相机的研究起步较晚，最初主要由大恒图像等几家老牌相机公司代理国外品牌。近些年我国也逐步发展出一批自主研发工业相机的国产品牌，如大恒图像、海康机器人、华睿科技和维视图像等。目前我国工业相机行业主要布局于中低端市场，逐步实现进口替代；而在高分辨率、高速的高端工业相机领域仍以进口品牌为主。据GGII数据，从市场竞争格局看，2023年海康机器人、华睿科技两家头部企业出货量合计占比超过60%，我国2D工业相机市场的国产化进程将持续深入。

我国3D工业相机发展迅速，成长空间广阔。据GGII数据显示，2023年我国3D工业相机市场规模23.62亿元，同比增长28.35%。从整体来看，虽然市场增速出现下滑，但3D视觉确定性趋势已形成，据GGII预计，2024年3D工业相机市场仍将延续增长态势，2028年市场规模将接近80亿元，2024-2028年复合增长率约29%。整体来看，目前我国3D工业相机市场仍处于早期市场发展阶段，市场竞争激烈，尚未出现明显市场格局。从硬件构成来看，工业相机主要由图像传感器、驱动器、时序发生器以及传输接口组成。

图像传感器按照半导体感光元器件类型的差异主要分为两大类：CCD和CMOS。CCD（charge coupled device）和CMOS（complementary metal oxide semiconductor）都基于光电效应将光信号转换为电信号。CCD是电荷耦合器件的简称，在感光像点接受光照之后，感光元件产生对应的电流，电流大小与光强对应，因此感光元件直接输出的电信号是模拟的。CMOS是互补金属氧化物半导体的简称，CMOS传感器中每一个感光元件都直接整合了放大器和模数转换逻辑，当感光二极管接受光照、产生模拟的电信号之后，电信号首先被该感光元件中的放大器放大，然后直接转换成对应的数字信号。

CCD和CMOS有各自的优缺点，根据其特点应用于不同的场合。随着CMOS传感器在消费电子设备上的大量应用推动了CMOS技术的发展，其性能已显著提高，而制造成本大幅下降。CMOS传感器的分辨率和图像质量正在逼近CCD传感器。凭借高速度(帧速率)、高分辨率(像素数)、低功耗以及最新改良的噪声指数、量子效率及色彩观念等各方面优势，CMOS芯片逐渐在CCD芯片主导的领域里占据了一席之地，在工业图像处理的众多领域正逐步取代CCD传感器。

据中商产业研究院数据，2023年索尼占据全球CIS市场最高份额，达到42%；三星位居第二，市场份额19%；中国厂商豪威科技（韦尔股份）市场份额11%，居于第三；出货前三企业市场份额合计超过70%。中国厂商正加速突破，除了豪威科技，格科微和思特微在全球CIS市场份额都已进入前十，其份额分别为4%和2%，中国本土厂商占有全球CIS市场份额超过17%。

2、图像采集卡：高速图像采集卡依赖进口

图像采集卡是构建完整的机器视觉系统的一个重要部件，其功能是建立和前端相机中的连接，管理相机控制信号，从相机中获取数据，并将其转换成计算机能处理的信息。图像采集卡与工业相机在数量、帧率、接口等方面均需要匹配。从工业相机和图像采集卡的数量配套关系来看，通常情况下，1张图像采集卡适配1台工业相机，但也存在1张图像采集卡适配2台及以上工业相机的情形。从帧率匹配关系来看，由于图像采集卡的每一个通道都有吞吐量限制，因此单通道和多通道对相机最高率的支持是不同的。从接口匹配来看，不同类型的图像采集卡适配于不同接口类型的工业相机。

目前机器视觉系统中较常见的包括CameraLink、CoaXPress、GigE、USB3.0接口，其中Camera Link特点为高速率、高可靠性、实时性强，CoaXPress特点为高速率、吞吐量大、传输距离长，而GigE和USB3.0一般为中小幅面相机设计采用。埃科光电产品涵盖基于PCIe接口的Camera Link、CoaXPress和10GigE Vision三大类图像采集卡。高速图像采集卡依赖进口。在机器视觉产业联盟统计的2021年中国机器视觉行业销售额排名前九的企业中，仅有四家主营产品涉及图像采集卡，分别为凌云光技术股份有限公司、中国大恒集团有限公司北京图像视觉技术分公司、宝视纳视觉技术（北京）有限公司及埃科光电；同时，凌云光尚未批量自产图像采集卡，中国大恒集团有限公司北京图像视觉技术分公司主要以代理其他品牌为主，宝视纳视觉技术（北京）有限公司为德国Basler在中国的资子公司。另外，据埃科光电招股说明书可知，我国机器视觉设备厂商使用的高速图像采集卡主要依赖进口，国产化率很低。

3、镜头：机器视觉的“眼球”

镜头是机器视觉图像采集部分重要的成像部件。镜头的主要作用是将目标成像在图像传感器的光敏面上，分辨率、对比度、景深以及像差等指标对成像质量具有关键性影响。在机器视觉系统中，镜头的主要功能是将成像目标对准图像传感器的光敏表面。机器视觉系统处理的所有图像信息均通过镜头得到，镜头的质量直接影响到视觉系统的整体性能。按功能分类，镜头可分为定焦镜头、变焦镜头、变光圈镜头；按视角可分为普通镜头、广角镜头和远摄镜头；其他特殊用途的镜头有远心镜头、显微镜头、微距镜头、紫外镜头和红外镜头等。 2023年我国光学镜头市场规模达161.3亿元。

随着光电子技术快速发展，作为光电子领域重要信息输入端口的光学镜头应用范围也从最初的光学显微镜、望远镜、胶片相机等领域不断向安防视频监控、数码相机、摄像机、智能手机等领域渗透。随着移动互联网、物联网、人工智能等技术快速发展，光学镜头的应用领域进一步拓宽，智能驾驶、智能家居、全景/运动相机、VR/AR设备、无人机、3DSensing、机器视觉等新兴领域层出不穷，为光学镜头及摄像模组行业的持续发展注入了新的动力。据中商产业研究院，2023年中国光学镜头市场规模达到161.3亿元，较上年增长3.9%；2024年中国光学镜头市场规模将达到173.90亿元。国内优质厂商从中低端市场开始布局、逐步向高端产品拓展，实现国产替代，未来将迎来高速发展。海外机器视觉工业镜头细分领域发展较早，德国、日本品牌占据着全球主要市场份额。国内厂商在工业镜头领域目前体量较小，但许多企业依托高性价比优势布局中低端市场，且发展迅速，如东莞普密斯。同时，也有以深圳东正光学、江苏慕藤光为主的部分企业通过整合制造设备和多种技术平台，已经能够提供全系列工业镜头，进军高端产品领域。

4、光源：提供视觉照明方案

光源对于机器视觉中的图像采集部分具有重要影响，为后续图像识别与分析奠定必要的基础。光源是影响成像质量的重要因素，它的作用是突出物体的特点，抑制不相关特征，提高被探测区域和未探测区域的反差，并保证光源有足够的亮度和稳定性，从而保证图像的成像质量。由于光源种类繁多，为了获得最佳的使用效果，需要根据实际情况选择适当光源。在选择光源时，选择不同的光源以达到反射的目的，并吸收不必要的光。奥普特是国内光源环节最具竞争力的公司之一。机器视觉光源在照度、均匀性和稳定性三个核心指标上有较高的要求，按照类别区分，光源可分为LED光源、卤素灯以及高频荧光灯；按照形状区分，光源也可分为环形、条形、平面、线等形状。全球的视觉照明市场早期由海外企业占据大部分市场，如日本的CCS、美国的AI。

近年来中国厂家逐步崛起，出现了奥普特、沃德普、锐视光电、纬朗光电等专业的机器视觉光源制造商，其技术足以与国际厂商竞争。从市场竞争梯队来看，以代表企业占据全球市场份额为依据进行分类，第一梯队主要为市场份额大于5%的企业，其中以日本CCS为代表，其全球市场份额达到10%以上；随着中国市场在全球市场占比的不断提升，中国龙头企业奥普特也位于全球市场第一梯队。第二梯队的代表企业主要包括美国AI、中国锐视光电、中国康视达、中国嘉励等企业，其市场份额位于1%-5%之间。第三梯队主要为机器视觉光源业务占比较小或企业整体市场规模较小的企业，以日本Moritex、中国沃德普和中国纬朗光电等企业为代表，机器视觉光源市场规模不足1%。

5、图像处理软件：以算法为核心竞争力机器视觉系统的视觉处理使用算法来分析传感器产生的数字图像。视觉处理涉及一系列步骤，在外部（通过计算机）或在内部（对于独立机器视觉系统）执行。首先，数字图像从图像传感器中提取出来并传送到计算机。接下来，通过突出图像上的必要特征来准备用于分析的数字图像。然后分析图像以定位需要观察和测量的特定特征。完成对特征的观察和测量后，会将它们与定义和预编程的规范和标准进行比较。最后，做出决定，并传达结果。具体说，机器视觉软件类似人的“大脑”，通过图像处理算法完成对目标物的识别、定位、测量、检测等功能。机器视觉软件分为底层算法和二次开发的软件包两类。前者是包含大量处理算法的工具库，用以开发特定应用，主要使用者为集成商与设备商。后者是封装好的、用以实现某些功能的应用软件，主要供最终用户使用。机器视觉软件以自主研发或开源平台的二次开发为主。

据GGII数据显示，2023年我国机器视觉软件品牌销售规模22.05亿元，同比增长5.25%；预计至2028年，该市场规模将超过40亿元，同时品牌销售的占比有望超过45%。从竞争格局看，MVTec的Halcon和海康机器人的VisionMaster占据前两位，康耐视的VisionPro位居第三。从整体来看，由于中国市场大部分视觉应用厂商都是基于自主研发软件或开源平台的二次开发为主，因此目前真正对外采购品牌软件的占比相对较小。

6、3D视觉核心部件：需努力实现自主可控 3D视觉成像方案是在2D相机基础上进行的结构及软件重构，相机多作为零部件进行外购。3D视觉通常由红外光发射器发射红外光到物体表面，红外光传感器采集物体的深度图像（Z轴信息），可见光传感器采集物体平面图像（X、Y轴信息），经过图像处理芯片得到三维位置信息。红外摄像头需要特制的窄带滤色片，结构光方案还需要在发射端添加光学棱镜与光栅，双目立体成像多一颗红外光摄像头。

（1）3D光源：红外激光发射器

在3D相机中，光源是红外激光发射器，其发射图像的质量对整个识别效果至关重要，VCSEL是近红外光源最佳方案。红外线的主要波长是700nm~2500nm。目前的摄像头图像传感器对900nm以上的红外光感应差，需要更强的光才能感测到，这就要求红外发射器有更大的电流，更多的功耗。而800nm以下的波长，太靠近可见光，极其容易受到太阳光的干扰，所以一般红外的波长选择在800nm~900nm。可以提供800-1000nm波段的近红外光源主要有三种：红外LED、红外LD-EEL（边发射激光二极管）和VCSEL（垂直腔面发射激光器）。

早期3D传感系统一般都使用LED作为红外光源，但由于LED不具有谐振器，导致光束更加发散，在耦合性方面也不如VCSEL，因此演变成了从LED向VCSEL的转变。 VCSEL厂商布局众多。全球主要的VCSEL供应商包括Finsar、Lumentum、Princeton Optronics、ⅡⅥ、ams和Osram等，它们在移动端VCSEL处于前沿的研发角色。国内厂商：武汉光迅、山东太平洋、深圳源国、国星光电、华工科技、光迅科技、三安光电、乾照光电、华灿光电以及睿熙科技等具备中低端VCSEL的设计和生产能力，长春光机所在VCSEL技术研发方面有一定竞争力。结构光需要采用pattern图像进行空间标识，因此需要定制DOE衍射光学元件（苹果、奇景光电、福晶科技、驭光科技等）和WLO晶圆级光学原件（AMS、奇景光电、采钰、晶方科技等）。红外传感器是距离传感器的高配版，主要由AMS/Heptagon和意法半导体两大厂商主导。Heptagon一直致力于小型化TOF传感器开发，2016年被AMS收购。TI和infineon也在这一领域有所布局。

（2）3D红外光摄像头

红外光摄像头主要包括：光学镜头、红外窄带干涉滤色片、红外CMOS传感器。以手机摄像头成本构成做参考，CIS是价值量占比最大的部分，模组封装占比20%，光学镜头占比19%。红外摄像头对光学镜头的要求不如可见光摄像头的要求高，对光线的通光量、畸变矫正等指标容忍度高，多采用成熟的普通镜头。可见光摄像头，采用普通镜头模组，用于2D彩色图片拍摄。厂商主要有德国施耐德、卡尔蔡司、美国Navitar、日本KOWA、CBCComputar、Moritex、意大利Opto等，基本垄断国内高端市场领域。滤光片在近红外识别系统中以窄带滤光片为主。

对于3D视觉而言，IR红外摄像头与RGB可见光摄像头在滤色片方面存在较大的差异。传统的RGB可见光摄像头，需要采用高通红外滤色片，将不必要的低频近红外光过滤掉，以免红外光线对可见光部分造成影响，产生伪色或波纹，同时可以提高有效分辨率和彩色还原性。但是红外摄像头，为了不受到环境光线的干扰，需要使用窄带滤色片，只允许特定波段的近红外光通过，目前近红外窄带滤色片主要采用干涉原理，需要几十层光学镀膜构成，相比于RGB吸收型滤色片具有更高的技术难度和产品价格。全球范围内窄带滤光片主要厂商包括美国的Viavi、水晶光电。其他厂商还有布勒莱宝光学（Buhler）、美题隆精密光学（Materion）、波长科技（Wavelength）等。

05 机器视觉产品价格水平

机器视觉产品按照下游应用场景的性能要求，可以大致分为消费级和工业级两类。工业级机器视觉对于技术、精度、稳定性等的要求相对更高，而且取决于应用场景及需求不同，整体定制化程度较高，主要通过国外品牌采购上游核心零部件，因此整体成本较高。消费级视觉方案对于精度的要求相对较低，市场参与者更多竞争更为激烈，故而对于成本控制的需求更为严苛。

工业级机器视觉产品的价格水平来看：以主营工业相机的埃科光电为例，根据其招股书中的信息，其上游零部件如图像传感器、处理器等，主要使用国外知名品牌如Sony（索尼）、AMS（艾迈斯）、ON（安森美）、Altera（阿特拉）、Xilinx（赛灵思）等，图像传感器均价近3000元，处理器均价约550元。埃科光电的主营产品工业线/面扫描相机平均单价为6626.54、36695.15元。消费级3D视觉方案产品的价格水平来看：以供货给优必选的奥比中光为例，根据其招股书中的信息，感光芯片供应商有索尼、三星、韦尔股份、思特威等；滤光片供应商有Viavi、五方光电等，光学镜头供应商有大立光、玉晶光电、新旭光学等；激光发射器供应商有Lumentum、菲尼萨（Finisar）、艾迈斯半导体（AMS）等，衍射光学元件供应商有CDA、AMS、驭光科技等。现阶段人形机器人进入规模量产阶段，对视觉方案的需求更关注于产能供应和成本控制两方面，推测消费级3D视觉产品有望成为需求主流。

但随着未来人形机器人应用场景的复杂化及多元化之后，也不排除需求工业级机器视觉产品的可能性。

06 机器视觉市场分析及预测

1、2025年全球机器视觉市场规模有望达千亿，全球市场集中度高

随着工业自动化技术的不断发展，机器视觉在工业领域的应用越来越多，市场规模不断扩大。据Marketsand Markets及中商产业，2022年全球机器视觉市场规模约为879.17亿元，同比增长9.35%。GGII预计至2025年该市场规模将超过1200亿元，2022-2025年CAGR为13.22%，增长稳健。全球机器视觉市场的高端市场主要被美、德、日品牌占据，以美国康耐视(Cognex)、德国巴斯勒(Basler)、日本基恩士(Keyence)和欧姆龙(Omron)等为主。其中康耐视和基恩士作为全球机器视觉行业的两大巨头，垄断了超过50%的全球市场份额，2023财年，康耐视和基恩士的营收分别为8.38亿美元和61.67亿美元，市场份额分别为6%左右和48%左右。

2、2027年全国机器视觉市场规模将达到565.65亿元

随着全球制造中心向中国转移，中国已成为国际机器视觉厂商的重要目标市场。2021年，国内3C电子、新能源、快递物流等行业的蓬勃发展拉动了相关企业的扩产需求，机器视觉需求增长明显。GGII数据显示，2021年中国机器视觉市场规模138.16亿元（该数据未包含自动化集成设备规模），同比增长46.79%。其中，2D视觉市场规模约为126.65亿元，3D视觉市场约为11.51亿元。2022年受宏观环境影响增速略有降低，但仍保持23.51%的同比增长，约为170.65亿元。根据GGII预测，至2027年我国机器视觉市场规模将达到565.65亿元。

3、我国机器视觉市场规模将持续高增

机器视觉下游应用广泛。随着国内机器视觉技术与产品的不断完善，机器视觉技术已经在消费电子、汽车、锂电池、半导体、医药行业、食品包装等领域，实现了较为广泛的应用。中国机器视觉细分应用市场中，3C电子占比25%，位列第一；其次是汽车、锂电池和半导体，占比依次为10.9%、10.3%、10%；医药、食品包装和物流仓储占比分别为8.2%、5.8%、5.1%。我国机器视觉市场规模将持续高增。随着机器视觉硬件方案的不断成熟和运算能力的提升，以及软件在各种应用解决方案、3D算法、深度学习能力的不断完善，机器视觉在电子产业（如PCB、FPC、面板、半导体等领域）应用的广度和深度都在提高，并加快向新能源锂电、光伏等其他领域渗透，在AI、自动驾驶、人脸识别等新兴技术兴起的带动下，我国机器视觉市场规模将继续保持较高的增速。据GGII数据统计，2022年中国3C电子、半导体、新能源锂电、汽车、医药医疗、快递物流行业的机器视觉市场规模分别为42.74/17.15/17.50/18.59/13.97/8.63亿元，分别同比增长5.22%/30.32%/53.64%/30.82%/34.84%/14.91%，预计2027年将超70/70/75/（达到近）60/38/20亿元，整体呈稳定上升态势，机器视觉需求增长明显。

07 参考研报

1.中邮证券-机械设备行业深度报告：视觉传感器~人形机器人视觉感知交互硬件

2. 国元证券-机器视觉行业深度报告：机器视觉，智能制造之眼

3. 华安证券-机械行业产业链梳理概况：人形机器人风起云涌

4. 浙商证券-电子行业专题报告：人形机器人专题，视觉传感器

5. 国泰君安-机器人产业深度（四）：机器人的眼睛，3D工业视觉

6. 国金证券-24年人形机器人行业策略报告：以T链为锚，寻找短板和高壁垒赛道

7. 德邦证券-电子行业：机器视觉行业长坡厚雪，消费电子有望驱动新一轮需求周期

8. 上海证券-埃科光电-688610-公司深度：机器视觉迎来需求成长及国产替代浪潮，上游高端核心部件领航者充分受益

9. 申万宏源-奥比中光-688322-深耕立体视觉感知，AI时代“机器之眼”（申万机器人系列报告9视觉篇）