“下一款量产激光雷达,选SiPM方案还是SPAD方案?”
随着上游的激光雷达厂商“卷技术领先性”进入了新阶段,这个看似简单的选择题,牵动着整个产业链的神经。当下,很多车企的自动驾驶负责人、感知负责人正为这一问题而陷入犹豫不决的状态中。
其实,这个问题的答案,并不是“非黑即白”的。
实际上,并不存在绝对的“哪个更好”,关键在于:你家公司是预算充足、对下一款激光雷达的需求是“300线以上、追求超远距探测”,还是在对成本比较敏感、对下一款激光雷的需求是“256线以内综合性能和性价比皆优”?
尤其值得一提的是:尽管SPAD方案是300线以上激光雷达的最佳选择,但在当下,SPAD无论是芯片本身还是应用端都不算成熟,需要继续迭代调优之后才可以达到更好效果。
接下来,笔者将用1万字的篇幅对上述问题做详细的分析。
此外,一个公司在某个阶段的主打产品上选择怎样的技术路线,这不只是一个关于“技术判断”的问题,而且,还关乎技术负责人对商业的认知——在文本末尾,笔者将借用自己跟禾赛联合创始人兼技术负责人的对话来阐释这一观点。
SiPM 和 SPAD在底层技术原理上是一样的,其最小感光单元完全相同——都是单光子雪崩二极管。可以说,两者从物理层面、像素层面上是完全相同的东西,连尺寸都可以是一样的(一个 SiPM 里面包含数百个 SPAD)。
SiPM由多个SPAD单体及电容电阻并联组成,单个SiPM像素通常包含几百至上千个SPAD。
在SiPM方案中,多个SPAD像素组成一个SiPM测量通道。每个SPAD像素能够独立俘获光子信号,每个测量通道将多个SPAD像素并联,在模拟信号上进行相加,形成最终输出的累加信号输出。由于SPAD像素单光子增益较高,链路信噪比几乎不受后级读出电路噪声影响。
1.3 核心差异:从物理结构到信号链
SiPM方案中的SPAD单元在数量、尺寸及探测能力上跟SPAD方案中的SPAD单元有何区别?
不同于单个SiPM像素通常包含几百至上千个SPAD,SPAD阵列通常以固定比例的NxN(3x3等)SPAD单元组成一个像素,故两者单通道/单像素的SPAD微单元数量不同——SiPM中的SPAD微单元显著更多。
SPAD(单光子雪崩二极管)和SiPM(硅光电倍增管)虽然都基于单光子探测原理,但在信号处理链路上存在差异:
SiPM方案:
在SiPM方案中,感光器件、数字化处理模块,是“横向平铺”在同一个面上;而在SPAD方案中,感光器件、数字化处理模块,是“纵向堆叠”在一个立体的空间中的(3D堆叠)。
在这两种架构中,数字化处理模块所处的位置是不同的。
SPADs 方案形态:数字化处理模块在感光器件(SPADs)下的 SoC 中,如下图——
从上面的图可以看出,SPAD更容易将体积做小——但实际上,这个优势只有在高性能雷达上才能发挥出来(后面会详述)。
3D堆叠架构:
系统级简化:
通道密度突破:
大面阵SPAD既要求分辨率足够高,又要求探测距离足够长,还要信噪比较高,这对数据采集和处理都提出了很高的要求。
在发射端元器件及功率既定的情况下,激光雷达的探测距离主要取决于反射信号的光功率,而反射信号的光功率又跟传感距离的平方成反比。因此,既要准确检测0.5米的障碍物,又要在100米处的时候也要看得很清楚,这是1千倍的差距,而对反射信号的光功率来说,这意味着100万倍的动态范围,其中的难度可想而知。
还有,大面阵SPAD的芯片尺寸本身也带来了物理层面的挑战——芯片设计面对的本质上是一个二维的平面的世界,伴随芯片面积的增加,信号通路的拥挤程度是几何级数上升的。而且,面阵芯片中的2D寻址又会将设计难度推向一个新的高度。
此外,信号通路,供电网络、时钟网络、发热管理、DFM等等一系列问题,在大面阵SPAD芯片的设计中都需要拥有丰富实战经验的资深专家来解决。
客观地说,上述几个问题,在技术原理层面并不存在多大挑战,真正的挑战在工程层面。 而一个公司能否突破这些工程难题,最关键的一点是,他们收到了多少来自真实实践的反馈,知道客户真正在意的是哪些方面的参数优化——这又取决于他们把多少激光雷达出货给了量产车、并且这些车真正在路上跑。
当前,能提供可量产的车规级SPAD芯片的供应商只有索尼一家。国内做SPAD激光雷达的主流厂商,选择的大面阵SPAD芯片以索尼的IMX459为主——毕竟,用一款现成的芯片,开发时间短、上手门槛低。
下面,我们就以IMX 459为例来说说当前的大面阵SPAD在量产应用中所面临的实际挑战。
SiPM和SPAD的工作原理是都在反向偏压下形成强电场(通常高于击穿电压)。当光子入射时,产生的电子-空穴对在电场中被加速,引发雪崩倍增。偏压越高,电场越强,载流子被加速的几率越大,雪崩触发效率越高,因此,光子探测效率(PDE)随着偏压高而降低。
SiPM探测器两端的偏压可以达到5V甚至更高,相比之下,SPAD受限于3D堆叠的CMOS的标准工艺,探测器两端加的偏压的超付范围只能在3.3V左右。因此,跟SiPM相比,SPAD的光子探测效率反而会低一些。
低PDE会从信噪比、探测距离、测距精度、多目标分辨能力、实时性、功耗、环境鲁棒性等多维度削弱SPAD激光雷达性能。
PDE这个问题会长久存在。不过,PDE率高到一定程度,再提高它对于测距的收益也就比较有限。所以,这个问题也不算特别严重。
3.2 感光单元的“正方形”排列,影响了测距能力
从上面的示意图可以看出,在SiPM方案中,感光单元由很多很小的阵列“拼接”而成的,且拼接出的形状是“长条形”,而在SPAD方案中,感光单元往往就是一个比较大的阵列,且该阵列的形状呈“正方形”(不一定是正方形,也可能是“接近于正方形”)。
这意味着,在芯片面积相同的情况下,SiPM中感光面的“最长边”会比较长,而SAPD中感光面的“最长边”却很短。
激光雷达的测距能力跟感光面的“最长边”的长度呈正相关。比如,SiPM的“最长边”有30mm的话,要实现某个FOV,焦距就会很长;但SPAD的“最长边”只有10mm的话,要保持跟前者同样的FOV,焦距就会很短。 这也是为什么SPAD-SoC方案的激光雷达最远测距不如SiPM方案。
通道串扰是指,激光雷达中一个探测通道的信号错误地影响其他通道(有可能是几十个),导致点云数据失真、测距误差甚至虚假目标生成的现象。
比如,在高反射场景(如交通指示牌)中,激光脉冲本应仅触发目标物所对应的通道,但在多通道并行工作的情况下,杂散光可能同时激活数十个“无关”通道。其结果是,单个指示牌在点云中可能被误识别为“一整面墙”。
在SPAD阵列中,由于高密度集成和并行工作特性,串扰问题尤为突出。而动态范围的不足又会加剧多通道工作时的信号干扰——当强光使部分SPAD像素饱和时,雪崩电流可能通过共享电路耦合到相邻通道。
从上面几段的表述可以看出,SPAD通道串扰问题突出的最关键原因在于“多通道并行”。具体可分为如下两类:
当前SPAD芯片面临的核心挑战之一,是分区数量不足,这直接导致其并行工作的通道数过多(无法让每个通道独立开关),进而引发严重的信号串扰问题。
为什么分区数量不足会导致并行工作的通道数过多呢?
大面阵SPAD都必须要通过3D堆叠工艺来实现而,由于3D堆叠工艺的高昂成本,SPAD探测器的有效光敏面普遍较小。
IMX459为例,SPAD有效光敏面尺寸过小的后果是,在测距能力既定的设计下,焦距过短,而过小的焦距则导致镜头口径小,信噪比低,严重影响测远能力。
通道串扰(Crosstalk) 会导致信号失真和测距误差;并且,它还会通过能量扩散、动态范围抢占、时空混淆三重机制,使“高反”膨胀问题的负面后果加剧。
3.4 “高反”膨胀
有多家激光雷达整机厂商反映,在使用SPAD技术时,如果扫描的近距离目标周围存在高反射率的物体(例如镜面、车牌、金属等,简称“高反物体”),会引起“膨胀”的问题。此即“高反”膨胀。

“高反”膨胀导致的一个结果是:“明明这里是没东西的”,但激光雷雷达也能“显示”出来,这很危险。
尤其值得一提的是,前面提到的通道串扰问题往往会使“高反”膨胀问题加剧。比如,使单个“高反”目标的污染范围从1个像素扩大到多个像素。
那么,通道串扰问题为什么会使“高反”膨胀问题加剧呢?
其作用机制和后果可分为以下几个层面深入分析:
1. 无串扰时,高反射目标反射的强光应仅激活探测器的局部像素,信号能量集中在物理照射区域;而在串扰引入后,强光触发的雪崩击穿通过电学耦合(共享衬底/寄生电容) 或 光学串扰 扩散到邻近像素,导致信号能量从单点向周围“泄漏”——原本可控的高反信号饱和问题,演变为区域性信号污染(即膨胀范围扩大)。
2. 无串扰时,高反目标本身已接近接收通道的线性上限(如ADC饱和);叠加串扰后,邻近像素因串扰触发后,进一步占用系统动态范围资源,导致有效信号处理余量归零,系统彻底丧失对强弱信号的区分能力。
3. 无串扰时,高反膨胀可能仅表现为单个像素或小区域的数据异常(如测距值固定为最大值);有串扰时,异常信号扩散到周围像素,形成虚假面状结构(如将车标误识别为“一片不规则平面”)。
当然,需要注意的是,通道串扰只是“高反”污染的潜在诱因之一,但并非唯一原因——但即使没有串扰,高反射率目标本身仍可能通过饱和或光学散射导致污染。
为应对“高反”物体引发的信号膨胀问题,激光雷达厂商普遍采用"过滤除"策略,即把其他通道上的这些光收到的信号给过滤掉。
但“过滤除”算法有一个危险的地方:它其实并不能 100% 确定它其他通道上收到的光是来自于一个“高反物体”(虚假信号),还是一个“真实客观存在的东西”。
多数激光雷达系统会通过时间相关滤波或空间聚类算法剔除噪声。但若串扰信号与噪声特征相似(如随机分布),真实信号可能被视为“噪声”,进而被连带滤除,从而降低探测精度或漏检目标。
简单地说,误滤除机制源于:真实障碍物的点云因串扰扩散而产生离散异常点,后续的聚类算法/滤波算法可能将其误判为“低可信度目标”,并剔除。
在跟笔者聊起这个话题时,禾赛技术负责人说:我觉得激光雷达相比于视觉最重要的一个作用就是兜底。然而,如果为了解决“高反”膨胀的问题,就通过过滤除算法把一个“明明存在的物体”给过滤掉,那激光雷达的价值就没有发挥出来。
听到此处时,笔者的第一反应是:这就相当于“倒洗澡水的时候,连孩子一起倒掉了”,矫枉过正?
除了华为,目前尚无没有其他算法供应商真正用起来 SPAD 雷达,未来如果要用,会需要更多“兜底算法”去优化。并且,前面提到的“误滤除”风险也难以彻底避免。
SPAD方案:3D堆叠工艺使芯片成本增加约25%,但节省了ADC等外围器件
SiPM方案:虽然单颗探测器便宜20%,但需要外置FPGA+ADC模组(合计约60美元)
行业现实验证
技术迭代的悖论
关键结论
SPAD的成本优势需满足两个条件:量产规模突破50万台/年,且算法完全芯片化。在此之前,SiPM仍是成本敏感项目的理性选择。
3.7 3D堆叠架构导致bug修复困难
SPAD方案所选择的3D堆叠技术,是一把双刃剑——在产品出现缺陷后,3D堆叠方案的修复/迭代成本极高。
SiPM方案采用"乐高式"架构,如果是ADC出故障,则只需更换15美元的ADC;且其光学接收端与处理电路可分团队独立优化,缩短50%开发周期;此外,SiPM方案通过FPGA的固件升级解决70%的算法类问题。
相比之下,SPAD-SoC由于不可拆分性,如果出问题,就无法通过硬件微调来解决,而是得报废整个$200的SoC模块。这暴露出3D集成技术的一个致命弱点——"一损俱损"的耦合效应。
修复周期困境
当客户现场发现SPAD芯片存在光学串扰缺陷时,传统SiPM方案可通过更新FPGA处理逻辑在2周内解决。而SPAD需要:
重新流片(18-24周)
封装验证(8-12周)
这意味着至少6个月的迭代延迟,远超智能驾驶产品的窗口期
无论是对单一功能缺陷的修复,还是对系统级bug的修复,SPAD方案的处理成本都要比SiPM方案高好几倍。
在L4级自动驾驶要求传感器"持续进化"的背景下,过于超前的集成技术反而可能成为绊脚石。某新势力车企因此暂停了3款SPAD雷达项目,回归模块化SiPM方案。
由于大面阵SPAD芯片的研发难度较高,成熟度上不够,因此,现阶段,一些在探测端采用SPAD技术的主流激光雷达厂商便先在量产产品上采用了成熟度更高的SiPM。
具体地说,相比于SPAD, SiPM方案有如下几大优势——
激光雷达的数据采集精度,取决于每个通道里包含的微像素的数量,而在这方面,相比于SPAD,SiPM方案具有明显优势。
SiPM方案中每个微像素的尺寸比SPAD更小,因此单通道可集成更多微像素。(比如,SPAD的方案中,每个通道是由3*3的微像素组成的话,那SiPM方案的每个通道就是由10*10的微像素组成的)。
因此,可以想见,SiPM的数据采集精度肯定是高于SPAD的。
4.2 从物理层面抑制了通道串扰问题
相比于SPAD的通道串扰噪声大,SiPM方案能明显地抑制通道串扰噪声。
尤其值得注意的是, SPAD方案为实现180米以上测距能力,通常需要40多个通道并行执行多脉冲测量 ,而多通道并行,正是其无法避免串扰问题的一个根本原因;相反,以禾赛AT128为代表的SiPM激光雷达由于线数相对较少(200线以下),要实现180米+的测距能力, 单通道收发就可以,这便从架构上隔绝了通道串扰的可能性。
单通道收发设计,从物理层面当上抑制了通道串扰的问题,也抑制了在由通道串扰带来的“高反污染”问题。
4.3从物理层抑制了环境光噪声
源于其独特的物理结构和信号处理机制,SiPM对环境光噪声的抑制能力强于SPAD。在阳光直射环境下,SPAD可能因饱和丢失真实信号,而SiPM则可通过降低增益+光学滤波将环境光噪声抑制90%以上。
4.4 高动态范围表现
在激光雷达的核心性能指标中,动态范围直接决定了传感器同时捕捉强反射和弱反射目标的能力。从实际测试数据和产品表现来看,与SPAD激光雷达相比,SiPM激光雷达确实在动态范围方面具有显著优势,这主要源于其物理结构和信号处理机制的本质差异。
(2) 微单元并联的统计平均效应
(3) 无死时间限制
SPAD的死时间(Dead Time,约10-100ns)导致其在强光下会丢失后续光子事件,而SiPM的模拟输出无此限制,可连续响应。
SiPM凭借模拟信号处理、微单元平均效应和可调增益,在当前技术阶段确实提供更优的动态范围表现。而SPAD的高分辨率优势需以牺牲动态范围为代价,这一矛盾只有通过下一代光子计数技术(如单光子ToC芯片)才可能根本解决。
对于车企而言,动态范围的稳定性可能比峰值分辨率更重要——这也是越来越多厂商在量产项目中回归SiPM方案的关键原因。
历史启示:CMOS最终取代CCD并非因其初始性能优越,而是通过持续迭代解决了功耗、成本等系统性难题——这正是SPAD正在经历的进化路径。
5.2 300线:技术经济的临界点
激光雷达的线数会影响到并行通道的数量,进而决定了是“SiPM更合适,还是SPAD更合适”。
>300线需求:
在对数据的多通道并行处理方面,SPAD的能力肯定是比 SiPM 要强的。因此,在需要同时并行处理几十个/上百个通道、在线数非常多(300线以上)的时候,SPAD是更优的解决方案——不仅性能更好,而且成本也更低。
(2) 对SPAD的理性布局
头部激光雷达厂商如禾赛,尽管并不会在量产品上一味追求更新的技术,但其实,在SiPM和SPAD两个方向上,他们都有布局,并会根据客户的实际需求理性选择更适合的方案。
汽车产业里面是不是需要能用到SPAD技术的300线以上激光雷达?对这个问题,禾赛技术负责人给出的答案是:有可能,为了看见200米外地上一个微小物体,你就需要300线的。
禾赛还认为“高反膨胀是 SPAD 技术必然携带的特质”这一观点是错误的。在他们来看,SPAD如果做好芯片定义和功能设计,能够实现和 SiPM 分立器件方案类似的点云效果。
禾赛技术负责人认为,SPAD方案当前存在的问题,在经过一两轮的迭代之后,是可以被解决的。
5.4 一些激光雷达厂商陷入的认知陷阱
带着这些疑问,近日,笔者与禾赛科技技术负责人展开了一场深度对话,探讨了产品"先进性"的真正定义,以及技术创新与商业化落地之间的微妙平衡。
苏清涛:在当前的激光雷达行业,各家厂商都在标榜自己的技术先进性。不过,技术的先进性,是否等同于产品的“先进性”?禾赛是如何定义产品"先进性"的?
禾赛技术负责人:这是个很好的问题。我们理解的"先进性"可能和业内一些同行不太一样。对我们来说,真正的先进性是,能让客户的ADAS系统在全天候、各种极端场景下达到最高鲁棒性,同时将成本控制在合理范围内。
比如在暴雨、强光等复杂环境下,我们的SiPM架构就展现出了比SPAD方案更稳定的性能表现,使AEB的误报率显著降低。这种可靠性才是ADAS系统最看重的。
苏清涛:这个定义很有意思,听起来你们是从终端应用的效果来反推技术路线的选择?
禾赛技术负责人:完全正确。我们始终认为,激光雷达的终极价值在于它能为自动驾驶系统带来多少安全性的提升。如果一款激光雷达的技术指标很漂亮,但在实际使用中数据误报率高,导致客户的系统难以实现高鲁棒性,那这样的"先进性"就失去了意义。
ADAS 市场跟这两年也发生了很大的一个变化——之前,大家比较喜欢讲技术参数,现在大家都相对务实了。比如,更关注AEB的误触发率了,这样的指标,才是有意义的;否则,你如果AEB的误触发率很高的话,那你用的传感器再“先进”,也没啥用。
苏清涛:你是从什么时候开始养成这种思维方式的?因为,通常来说,技术负责人这个角色的人,他对商业化方面的问题不会特别关注,他一定会去追求技术上的“最领先”。
禾赛技术负责人:早期我也更倾向于追求技术的前沿性,但后来逐渐明白,在汽车行业,技术必须服务于产品。
毕竟,我们做的,并不是像量子计算那样面向星辰大海的东西——如果要做那样的东西,我就不应该有太强的商业化思维,追求把技术做到最简短是最好的,但激光雷达是一个已经比较成熟、高度商业化的量产产品。
就像宁德时代,他们肯定有固态电池的技术储备,但现阶段推的还是更成熟的方案,因为要考虑商业上的可行性。
我觉得,还是结果最重要、输赢最重要。
如果你的技术确实是最先进的,那你最终输了,那你的技术先进就完全没用;而如果你尽管使用的不是最尖端的技术,但你最终赢了,那这个结果就是好的。
苏清涛:一个公司采用怎样的技术路线,应该也跟产品部门跟技术部门在组织架构/权力博弈中的地位有关。
如果研发部门特强势,而产品部门没有足够的话语权,那么,公司通常倾向于选择更前瞻的技术路线,对量产可行性考虑不足;相反,如果产品部门也有足够的话语权,那么,公司会倾向于根据量产可行性来选择是否采用最前瞻的技术路线。
禾赛技术负责人:确实如此。就像微软和苹果代表两种典型模式——微软是典型的研发主导,工程师开发出技术,产品部门负责包装销售;而苹果是强势的产品部门定义需求,研发团队负责实现。
苏清涛:那禾赛属于哪种模式?
禾赛技术负责人:这是个动态演变的过程。
早期我们更像微软模式,研发团队开发出激光雷达产品后,商务团队才知道要卖什么。那时候技术团队的话语权确实更大。
而现在,更像一个圆桌会议。先是市场部门针对市场需求做一些体系化的分析工作,然后,产品、研发、商务等部门坐在一起,共同讨论什么样的产品“最有市场胜算”。简单说,就是"一半一半"的平衡状态。
苏清涛:这种转变是怎么发生的?
禾赛技术负责人:ADAS市场给我们上了深刻的一课。研发团队逐渐明白了一个残酷的现实:最先进的技术不一定能赢得市场。现在大家更像个成熟的团队——研发会考虑量产可行性,产品会尊重技术规律,商务也理解研发周期。
应该说,之前,研发会更加强势一些,但现在面对ADAS市场,研发也能综合性地看问题,意识到了最重要的并不是技术领先性,而是商业的上的输赢。所以,大家在制定技术策略的时候,就会考虑采用怎样的技术更可能带来结果的赢。
苏清涛:我发现一个有趣的现象——作为技术负责人,您的商业思维特别强。这在我接触过的技术高管中很少见。通常,技术负责人这个职位的人都会誓死捍卫"要用最先进的技术"。
禾赛技术负责人:这可能和我个人的经历有关。在科技行业待久了就会发现,技术再先进,如果不能商业化,终究只是实验室里的展品。
苏清涛:记得我们2021年第一次在微信上跟你交流时,我就注意到你对市场和商业的关注。这种特质在技术负责人中确实罕见。我感觉,你个人的商业思维强,意味着禾赛的组织内耗是比较少的。
通常,层级比较高的人之间的内耗,大都不是因为利益冲突,而是因为在理念或认知上的不一致。你作为技术负责人能够频繁地从市场的角度去看问题、更关注商业上的成功,你意味着,你首先在理念上跟业务部门拉齐了,那公司就不会存在太多内耗。
禾赛技术负责人:我们的经验是,技术负责人需要走出实验室,真正理解市场需求。这不是说要放弃技术追求,而是要让技术创新服务于商业目标。当大家都以公司整体利益为重时,内耗自然就少了。