RoRD 毕业设计总结:面向 IC 版图的结构感知局部特征匹配

2026 年 4 月 29 日

3007 字

15 分钟

RoRD

RoRD 毕业设计总结:面向 IC 版图的结构感知局部特征匹配

这篇文章整理自我的毕业设计,主题仍然围绕 RoRD 在 IC 版图模式匹配中的落地。相比前几篇阶段性报告,这一次更像一个收束版本:问题定义、方法设计、实验协议、baseline 对比和工程边界都已经放到同一个框架里重新梳理。

一句话总结

目标是在不显式枚举模板旋转与镜像版本的前提下,从大尺寸 IC 版图中检索出所有与模板结构等价的目标实例。最终方案把版图结构先验编码进输入表示与局部特征学习,再用大图滑窗、RANSAC 和迭代屏蔽完成多实例搜索。

为什么这个问题值得做

IC 版图模式匹配的任务,是在大尺寸 layout 中定位与给定 template 相同或结构等价的局部单元。它可以服务于设计复用验证、相似结构检索、异常结构排查、IP 保护、版图审查等流程。

传统流程中一个很直接的问题是:目标实例经常以旋转、镜像和平移形式重复出现。如果把 0、90、180、270 度旋转和镜像都考虑进去,系统往往要对同一模板构造近似 8 种状态并分别搜索。这样做可以覆盖问题,但也会带来更高计算开销和更脆弱的工程流程。

从视觉建模角度看,IC 版图又不同于自然图像。它通常是二值化、弱纹理、强几何约束、高重复密度的数据,语义更多来自线段、折线、拐角、端点、重复单元和拓扑关系。因此,直接迁移自然图像中的局部特征方法并不理想。

本文真正想回答的问题是:

能否让模型直接学习旋转与镜像条件下稳定的版图结构表示,并把这种表示用于大图、多实例检索?

方法总览

整体流程可以分成两部分:模型学习“什么位置值得匹配、如何描述这些位置”,检索流程负责“如何在超大 layout 中高覆盖率地找到所有实例”。

整体匹配流程图

系统输入为模板图像 TT 和大版图图像 LL,输出匹配框集合:

R={(bi,ci,gi)}i=1N\mathcal{R} = \{(b_i, c_i, g_i)\}_{i=1}^{N}

其中,bib_i 表示第 ii 个匹配框,cic_i 表示置信度,gig_i 表示几何解释信息,例如尺度、旋转或镜像属性。

四通道结构表示

为了让模型更直接看到版图里的结构语义,最终方案没有只使用单通道二值图,而是构造四通道输入:

通道作用
原始二值通道保留整体轮廓
骨架通道保留主干结构与连通关系
角点通道强化局部转折信息
端点通道强化结构起止位置

四通道输入示意图

这个设计的核心动机很简单:版图里最有判别力的东西不是纹理,而是拐角、端点、骨架和它们之间的组合关系。四通道表示相当于把这些结构先验显式交给网络。

联合检测与描述子学习

模型采用共享骨干网络,并在其上构建两个分支:

  1. 检测分支输出关键点响应图,用来判断哪些位置值得参与匹配。
  2. 描述子分支输出局部特征向量,用来描述这些位置的结构语义。

训练阶段使用自监督几何一致性:从版图中裁剪 patch,对其施加旋转、镜像、尺度和光度扰动,同时保留已知变换关系。这样不需要人工关键点标注,也能构造变换前后的正负样本关系。

总损失可以写成:

L=Ldet+λLdesc\mathcal{L} = \mathcal{L}_{det} + \lambda \mathcal{L}_{desc}

检测损失进一步强调两件事:

Ldet=Lconsistency+αLstructure\mathcal{L}_{det} = \mathcal{L}_{consistency} + \alpha \mathcal{L}_{structure}
子项解决的问题
Lconsistency\mathcal{L}_{consistency}同一个结构在旋转、镜像或平移后是否仍能在对应位置被检测到
Lstructure\mathcal{L}_{structure}检测响应是否集中在拐角、端点、交汇点等真正有匹配价值的位置

描述子损失则把同源结构拉近、异源结构拉远:

Ldesc=(p,p+)pos(D(p),D(p+))+(p,p)neg(D(p),D(p))\mathcal{L}_{desc} = \sum_{(p,p^+)} \ell_{pos}(D(p), D'(p^+)) + \sum_{(p,p^-)} \ell_{neg}(D(p), D'(p^-))

版图里的负样本并不总是“看起来完全不同”的区域,很多时候是局部结构很像但几何上不对应的重复单元。因此,描述子学习必须承担区分重复结构、压制伪对应的任务。

模型与推理配置

主实验采用 VGG16 + FPN 结构:

配置项设置
输入4 通道结构图
BackboneVGG16,首层改为 4 通道输入
FPN 层级P2 / P3 / P4
FPN 输出通道256
描述子维度128
注意力模块当前实验关闭

训练配置如下:

项目设置
Patch 尺寸256×256256 \times 256
Batch size8
学习率5×1055\times10^{-5}
Epoch50
尺度扰动[0.8,1.2][0.8, 1.2]
数据增强亮度/对比度扰动、高斯噪声
训练数据ICCAD2019 真实样本

推理阶段对大图采用滑动窗口特征提取,再统一映射回全局坐标:

项目设置
窗口大小1024
步长768
匹配尺度{0.75,1.0,1.5}\{0.75, 1.0, 1.5\}
关键点响应阈值0.5
RANSAC 重投影误差阈值5.0 像素
最小内点数阈值15

大图多实例检索流程

检索流程并不追求一次性找到全局最优解,而是采用“验证一个实例、屏蔽一个实例、继续搜索剩余实例”的迭代方式:

1. 提取模板特征
2. 通过滑动窗口提取整张 layout 的关键点与描述子
3. 在未屏蔽区域中选择候选关键点
4. 与模板描述子建立初始匹配
5. 使用 RANSAC 做几何验证
6. 若内点数超过阈值,则投影模板框并记录结果
7. 屏蔽已匹配区域,继续搜索下一个实例

这种设计比较适合高重复密度的版图场景。候选点保留得更充分,真正的筛选压力后移到几何验证阶段,从而降低早期阈值误杀目标实例的风险。

实验数据与评价方式

测试集由一张 18×1818 \times 18 阵列规模的大尺寸版图构成,内部包含给定模板的原始状态、离散旋转状态及其镜像状态,共 9 个真值目标。

测试集大尺寸复用版图示例 测试集中的模板图片

评价指标包括:

指标含义
Center-hit Precision预测框中心落入真实框的比例
Center-hit Recall被成功命中的真实目标比例
IoU Recall@0.1IoU 大于 0.1 的真实目标覆盖率
Layout Feature Time大图特征提取耗时
Match Pipeline Time匹配与几何验证耗时
实验边界

这个测试集适合验证“无需模板状态枚举也能覆盖旋转、镜像和多实例目标”这一核心假设,但它仍然是规模有限、分布相对可控的构造场景,不能直接等价为对所有工业版图的充分泛化证明。

主方法结果

在当前测试集上,主方法覆盖全部 9 个目标:

方法预测数量Center PrecisionCenter RecallIoU Recall@0.1
本文方法91.01.01.0

关键点响应也符合预期:模型倾向于在拐角、端点和复杂结构交汇处产生响应,而不是平均铺满背景区域。

关键点响应分布可视化对比图 大图关键点分布可视化图

匹配流程中的几个阶段如下:

初始匹配示意图 RANSAC 几何验证结果示意图 屏蔽已匹配区域后迭代匹配示意图 最终匹配结果示意图

从 profile 看,当前系统的主要耗时集中在大图特征提取:

阶段耗时
Layout 特征提取25563.531 ms
匹配阶段1256.519 ms

这说明最值得继续优化的地方不是 RANSAC 或匹配循环,而是首次大图前向特征提取。

Baseline 对比

为了比较不同特征表示对版图任务的适应性,实验加入了 ORB、SIFT、SuperPoint 和 SuperPoint + LightGlue。为了让它们能参与同一个任务,baseline 也补充了滑动窗口、区域屏蔽和迭代搜索外壳。

方法预测数量Center PrecisionCenter RecallIoU Recall@0.1
本文方法91.01.01.0
ORB51.00.55560.5556
SIFT60.83330.55560.5556
SuperPoint00.00.00.0
SuperPoint + LightGlue120.00.00.0
ORB 匹配结果图 SIFT 匹配结果图 SuperPoint 匹配结果图 LightGlue 匹配结果图

耗时对比如下:

方法主要流程耗时
本文方法:Layout 特征提取25563.531 ms
本文方法:Match Pipeline1256.519 ms
ORB:Sliding Window + Iteration9185.479 ms
SIFT:Sliding Window + Iteration56827.718 ms
SuperPoint:Sliding Window + Iteration2440.836 ms

这组结果可以读出几个现象:

  1. ORB 在规则角点较多的二值版图上仍有一定有效性,但对镜像目标与重复结构的全局区分能力不足。
  2. SIFT 能命中部分目标,但在弱纹理版图中没有体现出经典自然图像场景下的优势,并且耗时更高。
  3. SuperPoint 的自然图像预训练分布与 IC 版图差异较大,在当前设置下没有形成有效候选。
  4. LightGlue 依赖前端特征质量;如果输入匹配对本身不适合版图结构,更强的匹配器也难以恢复正确几何定位。
  5. 主方法的优势不在于所有阶段都最快,而在于任务完成度、目标覆盖率、旋转镜像适应性和减少显式枚举依赖上的综合表现更稳。

方法边界

当前方案并不是已经解决了所有版图检索问题。它更适合局部结构清晰、拓扑关系明确、复用单元明显的场景。以下情况仍需要继续验证:

  1. 跨工艺节点、跨设计风格、跨分辨率的真实工业版图。
  2. 极小模板,因为可供建模的局部结构太少。
  3. 超高重复结构,因为相似候选之间竞争会更强。
  4. 超出当前多尺度范围的尺度差异。
  5. 更严格的旋转、镜像不变性消融实验。

从工程定位看,这个版本更适合作为离线版图分析、批量结构检索或辅助审查模块,而不是强实时交互工具。大图滑动窗口特征提取仍然是当前最大的时间瓶颈。

下一步

毕业设计给这个方向建立了一个可运行的闭环:结构表示、局部特征学习、大图搜索、几何验证、多实例迭代和 baseline 比较都已经串起来了。后续最值得继续推进的方向包括:

  1. 加速大图滑动窗口特征提取,减少重叠窗口的重复前向计算。
  2. 扩充真实测试集,覆盖更多工艺节点、设计风格和版图密度。
  3. 做更系统的消融实验,验证四通道输入、结构损失、FPN 和迭代屏蔽各自的贡献。
  4. 引入更贴近工业使用习惯的传统版图检索方法作为 baseline。
  5. 探索从光栅化输入走向矢量版图输入,在保留结构容错能力的同时降低大图卷积成本。

总体而言,这篇毕业设计证明了一件对我很重要的事情:RoRD 这条线不只是“把自然图像匹配方法搬到版图上”,而是需要把版图的结构先验、几何约束和大图检索流程放在一起重新设计。也正是在这个意义上,它仍然是一个值得继续往下挖的方向。

RoRD 毕业设计总结:面向 IC 版图的结构感知局部特征匹配
https://www.jiao77.com/blog/report/rord-graduation-thesis-2026-04-29/
作者
Jiao77
发布时间
2026 年 4 月 29 日
许可协议
CC BY-NC-SA 4.0

正在加载评论...

输入关键词开始搜索