云栈社区»论坛 › 回收站「 Recycle Bin 」 › 索尼CMOS传感器对焦技术演进详解：从反差对焦到全像素八核对焦 ...

发回帖发新帖

5688 积分	0 好友	750 主题

发消息

索尼CMOS传感器对焦技术演进详解：从反差对焦到全像素八核对焦

发表于 2026-4-11 04:14:06 | 查看: 227| 回复: 0

1，反差对焦

反差式自动对焦（AF）系统工作原理示意图

作为最早应用的自动对焦技术，反差对焦的原理最为简单，也最贴近人眼的自然对焦机制。我们的大脑正是通过判断画面中明暗区域的反差信息，来调节晶状体完成对焦的。

那么，“反差”具体是如何判断的呢？当一个物体没有在焦点上时，其影像会在传感器上形成一个大的、相互重叠的弥散圆。这种模糊状态导致画面的整体亮度和边缘对比度都很低。相反，当对焦准确时，物体的像会汇聚成一个清晰的点，画面锐利，边缘的对比度达到最高。

简单来说，对焦不准时，整个画面都糊成一片，缺乏明显的反差变化；而对焦准确时，焦点处的图像最为清晰，与周围模糊的背景形成鲜明对比，反差信息最强。

镜头对焦原理与反差式对焦示意图

理解了判断原理，具体的工作流程就很好懂了。当镜头对准拍摄物体时，对焦马达会驱动镜片组从一端开始向另一端移动。在这个过程中，传感器会对整个画面进行持续检测，并记录下实时的对比度数值。

当系统检测到对比度（即反差）达到最大值的位置时，镜片组便会回退到这个点，从而完成最终的对焦。在这个过程中，取景器中的画面会经历从模糊到清晰再到模糊的反复试探，这个现象在摄影圈里常被称为“拉风箱”。

反差对焦的优点是技术成熟、实现成本低，但缺点也非常突出——整个过程耗时太长！

2，相位对焦 / 激光对焦 / TOF 对焦

视差测距原理示意图

有趣的是，相位对焦（Phase Detection Auto Focus，简称 PDAF）技术的灵感也来源于人体，不过这次是“人眼测距”原理。我们的双眼因为位置不同，观察同一物体时会产生视差，大脑正是利用这种视差来判断物体的距离。

基于这个仿生学原理，手机图像传感器（CIS）上会专门布置一些“掩蔽式相位对焦像素”。这些像素上方的彩色滤光片被刻意遮挡住左半边或右半边，从而模拟人眼左右眼接收光线的差异。成对的左、右掩蔽像素就像一双眼睛，能够检测到光线信息的微小偏移。

传感器检测到的这些信息会被送到图像信号处理器（ISP）计算相位差。计算出结果后，系统可以直接指令镜片移动到准确的对焦位置。由于这个过程是“计算-移动”一步到位，无需来回试探，因此对焦速度比反差对焦快得多。

传感器上的掩蔽式相位对焦像素结构示意图

那么，具体的计算和判断是如何进行的呢？在理想的合焦状态下，投射在感光区域的光线距离是固定的，会精确地落在预先设计好的成对相位检测像素点上——这就是对焦的基准位置。

当被摄物体距离较近（前焦状态）时，光线会以更小的间距投射到传感器上，导致检测到的信号波峰向中心偏移。这个偏移量就是“相位差”。系统根据波峰的偏移方向和相位差的大小，就能精确知道镜片需要朝哪个方向移动、以及移动多少距离。同理，被摄物体距离较远（后焦状态）时的情况可以反向推导。

相位检测自动对焦（PDAF）在前焦、合焦、后焦状态下的工作原理图

虽然相位对焦无需来回试探，一次移动即可到位，但为了追求极致的对焦精度，实践中常会与反差对焦组合使用：先用相位对焦快速将镜片推到大致位置，再用反差对焦进行精细微调。

理论上，用于相位对焦的像素越多，对焦速度就越快。但由于掩蔽式相位对焦像素本身不参与最终成像，它们感光后留下的“空白”信息需要通过相邻像素来插值填补。如果这类像素数量过多，就会增加后期图像信息插补的难度，导致画面细节损失，画质下降。

此外，相位检测像素的数量瓶颈也限制了在暗光环境下的对焦性能。为了解决暗光对焦难题，业界首先引入了激光对焦传感器。它通过发射红外激光并计算反射时间来进行物理测距，从而辅助对焦系统。

dTOF（直接飞行时间）对焦系统原理示意图

不过，早期采用意法半导体方案的激光对焦有效距离有限（一般在2米以内）。随后，索尼带来了两种更优的解决方案。

一种是原理与上述激光对焦相似的 dTOF（直接飞行时间法）方案。索尼的 dTOF 模组功率更大，适合更远距离的对焦辅助，因此迅速取代了早期方案，成为众多旗舰手机的选择。

TOF（飞行时间）镜头工作原理及深度图生成示意图

另一种是成本更高、精度也更高的 iTOF（间接飞行时间法）镜头方案。它通过投射面光源，然后积累反射光并检测其与发射光源的相位差，从而间接计算出深度信息。iTOF 方案虽然更适合中近距离对焦，但其精度优势明显。 早年一些用于前置3D人脸识别的模组，以及部分老款顶级旗舰的后置混合对焦系统中，采用的就是这种方案。

3，全像素双核对焦 / “2×1 OCL”双核对焦

兼具相位检测与成像功能的双光电二极管像素结构示意图

虽然TOF方案能辅助解决暗光对焦问题，但掩蔽式相位对焦导致画质损失的先天缺陷依然存在。于是，基于“双光电二极管（PD）共享一个微透镜（OCL）”结构的全像素双核对焦技术登上了舞台。

它的核心原理，是让同一个微透镜下的两个光电二极管构成全新的一对“眼睛”。 通过比较这两个PD接收到的光信号差异（相位差）来实现对焦。关键在于，在最终成像时，这两个PD的电荷信息可以相加，从而消除了因相位检测造成的进光量损失，实现了画质无损的对焦。

这样一来，优势就非常明显了。以往的掩蔽式相位对焦只有少量像素参与对焦，而全像素双核对焦意味着传感器上的每一个像素都具备相位检测能力！并且每个像素都能获得完整的进光量，暗光下的对焦性能也得到了保障。

单像素双光电二极管在相位检测与成像时的工作模式详解图

可以说，全像素双核对焦一经问世，就一举解决了传统掩蔽式相位对焦的三大痛点：对焦像素少、画质有损失、暗光性能弱。它迅速成为了当年旗舰级传感器的标配对焦技术。

但全像素双核对焦也并非完美，它有一个明显的限制：由于每个像素内都要放置两个光电二极管，这导致单个像素的尺寸无法做得太小。于是，“2×1 OCL”双核对焦技术应运而生。

这种技术的思路是：让两个相邻的像素共享一个尺寸更大的微透镜，由这两个像素组成一对“眼睛”来进行相位对焦。这样，无论像素尺寸多小，只要有一个足够大的微透镜能覆盖住它们，就能实现一种新形式的“双核对焦”。

普通PDAF与全新双核对焦原理对比示意图

由于没有掩蔽结构的光线损耗，“2×1 OCL”双核对焦的进光量相比传统掩蔽式相位对焦直接翻倍！不过，这些“2×1 OCL”像素本身并不参与成像，因此它们只能像掩蔽式像素一样，以一定的密度分布在传感器上。虽然其综合性能不及全像素双核对焦，但这并不妨碍一些手机厂商在宣传时将其简称为“双核对焦”，以蹭全像素双核对焦的热度。

那么，在手机宣传中如何区分这两者呢？其实很简单：看有没有“全像素”这个前缀。带有“全像素”的，才是每个像素都具备对焦能力的真·双核。

知识插补：Quad Bayer 排列

Quad Bayer排列传感器在明暗环境下的不同工作模式示意图

为了理解后续更先进的对焦技术，我们有必要先了解一下Quad Bayer排列。如上图所示，Quad Bayer排列的每个颜色滤光片都覆盖了四个像素，看起来像是标准Bayer排列的“放大版”。

实际情况确实如此。那为什么要多此一举呢？起初，是因为像素尺寸做得太小时，滤光片的制造工艺跟不上，只能采用这种“曲线救国”的方式，顺便还能在营销时宣传高像素。后来，随着“大底”传感器的潮流兴起，大像素受到重视，但Quad Bayer技术并未被淘汰——因为它确实有“真本事”。下面我们详细看看它切换到高像素模式的工作原理。

Bayer排列与Quad-Bayer排列的滤色片布局对比图

首先，Quad Bayer排列需要进行光电二极管（PD）补偿和坏点补偿。其次，由于所覆盖的四个子像素在感光片上的位置存在微小差异，导致它们的感光能力不完全一致，这就需要引入“串扰校准”。

具体来说，系统会将整幅图像划分为多个感兴趣区域，计算各像素通道的感光能量，并确定补偿数据。最终利用这些校准数据，使原本不均匀的能量分布变得均衡。落到实处的效果就是，串扰校准可以消除因信号差异造成的网格状、锯齿状等色块干扰——这种干扰在拍摄纯色物体时尤为明显。

Quad Bayer排列像素差异计算与串扰校准示意图

完成这些补偿和校准后，就正式进入“Remosaic”（像素重排）环节，这个过程主要分为三步：

第一步：利用特定的插值算法，将Quad Bayer排列的原始数据转换为三组独立的RGB图像数据。

第二步：再利用将RGB图像转换回Bayer格式的算法，把上一步得到的三组数据分解为三组Bayer排列的原始数据。

第三步：将这三组数据合并成一张标准的Bayer排列图像，然后送给ISP进行常规的“去马赛克”处理。

Quad Bayer CFA排列转换为标准Bayer CFA的流程示意图

熟悉图像处理算法的朋友可能会发现，这个Remosaic环节的某些步骤与传统的“去马赛克”算法有相似之处。当然，这只是最基础的一套转换算法。随着Quad Bayer技术的发展，索尼等厂商还研发出了更先进的转换算法。

于是，“低光照下像素四合一提升感光度，高光照下转换回高分辨率模式”就成了Quad Bayer技术的主要宣传点。然而，有利必有弊，这项技术天生存在一个缺点：采样空间精度下降。毕竟，Bayer阵列本身就需要靠猜色和插值来生成彩色图像，Quad Bayer在此基础上又增加了一层像素合并与拆分的操作。

4，全像素全向对焦

全像素全向对焦（2x2 OCL）结构剖面示意图

伴随着Quad Bayer技术的发展，索尼还拓展出了一种全新的对焦思路：直接用Quad Bayer排列下的四个像素来进行对焦。

前面提到，“2×1 OCL”双核对焦虽然能适应小像素尺寸的传感器，但综合性能弱于全像素双核对焦。有没有两全其美的方案呢？如果能让一片微透镜覆盖四个像素，在Quad Bayer排列的架构下，这不就相当于实现了“全像素四核对焦”吗？

传统方案与全像素全向对焦方案在动态场景下的效果对比动画

而且，全像素双核对焦本身也有短板：它对缺乏图案变化的横向纹理不太敏感，横向对焦能力偏弱。这就像传统单反相机上的“一字型”对焦点，只能检测竖向线条。

如何加强呢？最直接的想法就是增加横向纹理的检测能力，从而组成“十字型”对焦点。那么，如果一个微透镜能覆盖四个像素，我们是不是可以将其分割成左-右、上-下、甚至斜向的配对，来检测各个方向的相位差呢？这就是所谓的“米字型”对焦。

十字对焦解决横向纹理检测缺失的原理示意图

同时，在暗光环境下，还可以利用“像素四合一”模式，结合全像素对焦的特性，最大限度地提升进光量，因此其暗光对焦性能极其强悍。

不过，这项技术也有一个很大的缺点：在微透镜数量大幅减少（四个像素共享一个）的情况下，切换到高像素模式时，其解析力与默认的像素四合一下的解析力几乎没有明显提升。这就是为什么采用局部“2×2 OCL”结构的豪威OV64B传感器（下图左侧），能在长焦端发挥重要作用的原因——它在特定区域保证了高分辨率特性。

2x2 MLPD与QPD传感器相位检测覆盖率对比图

为什么全像素“2×2 OCL”结构会让高像素模式形同虚设呢？简单想想：全像素双核对焦有没有因为一个像素里放了两个光电二极管而提高了解析力？显然没有。

具体来说，这又回到了Quad Bayer排列固有的“采样空间精度下降”问题：滤光片这么玩已经影响了解析力，现在连微透镜也跟着这么玩！归根结底，算法无法凭空创造细节。尽管如今在AI的加持下，高像素合成算法已经非常强大，那么在像素结构层面，能否有更好的解决方案呢？这引出了我们对深度学习和计算机视觉算法进步的思考。

5，全像素八核对焦

业界首款全像素八核对焦技术原理对比图

最终的答案，就是结合了Quad Bayer排列和单像素双PD结构的全像素八核对焦。如今，索尼的顶级旗舰传感器普遍采用了这项技术。

按照索尼官方的说法，这项技术最大的特点是：在进行HDR（高动态范围）拍摄时，无论是长曝光、中曝光还是短曝光的帧，所有像素都能同步获取相位差信息。这就是QBC-HDR技术带来的奇效，使得对焦过程几乎不受拍摄目标亮度差异的影响。在面对明暗对比强烈的“大光比”场景时，其对焦性能能够得到淋漓尽致的发挥。

Quad Bayer、Dual PD与RYYB技术结合形成IMX 700 Octa PD的示意图

同时，全像素八核对焦向下兼容了全像素双核对焦的所有优点！此外，在高像素模式的解析力表现上，它相较于全像素全向对焦（2×2 OCL）也具有先天的结构优势。

不过，在“全向”（各个方向纹理）对焦能力方面，它仍然不如专门的“2×2 OCL”结构，尽管其综合表现已经非常极致。

为了追求极致的视频录制追焦性能，苹果向索尼定制了手机领域独一无二的超级复合对焦技术：在全像素八核对焦的基础上，额外加入了高密度的掩蔽式相位对焦像素。

iPhone 13 Pro与iPhone 14 Pro主摄像头传感器规格与结构对比图

但苹果这么做就没有副作用吗？答案是否定的。因为掩蔽式相位对焦像素的密度很高，这些不参与成像的像素点会对拍照时的画面解析力产生不利影响。当然，众所周知苹果更看重视频性能，因此这个对焦方案对拍照解析力的微小影响在其权衡范围内是可以接受的。这世上本就没有完美的技术方案。

同样在视频对焦上出奇招的，还有昙花一现的华为定制传感器IMX608。它用于对焦的像素结构非常特别，如下图所示。

IMX608传感器上4x4掩蔽式相位对焦像素布局示意图

具体来说，在像素十六合一的工作模式下，斜向相连的八个掩蔽式像素会两两配对，组成四组相位对焦结构。IMX608的原生像素尺寸为1.12微米，十六合一后等效像素尺寸高达4.48微米！这种级别的掩蔽式相位对焦结构，无论是在暗光环境还是视频追焦方面，理论上都会有非常出色的表现。

其实三星的传感器也有全像素八核对焦技术，不过它发展出了另一种特色方案：让绿色子像素通过斜向分割的光电二极管来获得全向对焦能力。

Dual Pixel Pro与Pixel 4 in 1传感器像素排列对比图

总结

① 反差对焦（CDAF） —— 功能机时代就已存在的古老技术。通过寻找画面中对比度最高的点来完成对焦，技术简单、成本低廉，但耗时过长。

② 掩蔽式相位对焦（PDAF） —— 由三星Galaxy S5首发。能够根据相位差信息快速计算出对焦位置，实现快速对焦。缺点是对焦性能受限于专用像素数量、暗光对焦能力弱，且掩蔽结构会损失画质。

③ 全像素双核对焦（Dual PD） —— 由三星Galaxy S7系列首发。通过全像素双PD结构，一举解决了传统PDAF的所有主要缺点，但对横向纹理的检测能力较弱。

不同对焦技术与传感器尺寸、像素数的关系示意图

④ “2×1 OCL”双核对焦（Dual PDAF） —— 由OPPO R9s系列首发。通过部分不参与成像的、共享微透镜的双像素获得相位对焦能力。其暗光对焦性能优于传统PDAF，但其他缺点（如非全像素、损失分辨率）二者相似。

⑤ 全像素全向对焦（2×2 OCL） —— 由OPPO Find X2 Pro首发。通过Quad Bayer排列下四像素共享一个大微透镜的结构，获得了极致的暗光对焦性能和全方向对焦能力。缺点是切换到高像素模式时，解析力提升有限。

⑥ 全像素八核对焦（Octa PD） —— 由华为P40系列首发。通过结合Quad Bayer排列与单像素双PD结构，在保证高像素模式解析力的同时，还额外拥有了强大的HDR场景对焦能力。其横向纹理检测能力相对较弱。

传统PDAF与Octa PD HDR+AF技术的自动对焦亮度区间对比图

从这些技术的演进可以看出，图像传感器领域的发展日新月异，每一次革新都是为了在速度、精度、画质和适用性之间寻找更佳的平衡点。对于开发者和技术爱好者而言，理解这些底层原理，有助于我们更好地洞悉未来计算摄影和视觉系统的可能性。如果你想深入了解更多关于传感器架构的细节，欢迎在云栈社区的相关板块进行探讨和交流。