本报告整理 RoRD 项目的论文投稿计划与后续优化工作安排。核心目标是围绕 2026 年 4 月完稿这一时间点,制定多轮投稿策略,并同步规划数据、模型、训练、推理和评估方面的技术优化路线。
报告日期:2025 年 9 月 28 日
报告类型:项目规划报告
主题:论文投稿计划与后续优化工作安排。
以下是 EDA 领域主要会议的投稿时间节点,可用于制定投稿策略。
| 会议名称 | 投稿截止 | 结果通知 | 会议召开 |
|---|---|---|---|
| ICCAD | 5 月中下旬 | 8 月上旬 | 10 月底到 11 月初 |
| DAC | 11 月中下旬 | 次年 2 月底到 3 月初 | 次年 6 月到 7 月 |
| ASP-DAC | 7 月中旬 | 10 月中下旬 | 次年 1 月下旬 |
| DATE | 9 月中旬 | 12 月中旬 | 次年 3 月到 4 月 |
基于论文预计在 2026 年 4 月完稿的时间点,本项目采用一个多轮次、有后备的投稿策略。每次投稿后获得的评审意见都将用于下一轮改进,形成正向反馈循环。
| 阶段 | 时间 | 目标会议 | 策略 |
|---|---|---|---|
| 第一次尝试 | 2026 年春季 | ICCAD 2026 | 4 月完稿,5 月投稿,8 月获得评审结果。 |
| 第二次尝试(Plan A) | 2026 年秋季 | DATE 2027 | 9 月投稿,时间紧迫,适用于 5 到 8 月有明显改进的情况。 |
| 第二次尝试(Plan B) | 2026 年秋季 | DAC 2027 | 11 月投稿,3 个月修改时间更充裕,可补充关键实验。 |
| 第三次尝试 | 2027 年春季到夏季 | ASP-DAC 2028 | 3 到 7 月修改,7 月投稿,论文质量进一步提升。 |
| 后续计划 | 2027 年后 | IEEE TCAD | 转投期刊,整理成更扎实全面的版本。 |
第一次尝试:ICCAD 2026
时间节点为 4 月完稿、5 月中下旬投稿、8 月上旬得到结果。策略定位是首要目标,争取一次性命中顶级会议。
第二次尝试:双轨并行
Plan A 是 DATE 2027,9 月中旬截止,修改时间较紧,适合前期已有明显改进的情况。Plan B 是 DAC 2027,11 月中下旬截止,修改窗口更长,更适合补充实验和提升竞争力。
第三次尝试:ASP-DAC 2028
经过两轮顶级会议反馈后,论文质量会显著提升。3 月到 7 月有更充裕的修改窗口,适合进一步打磨。
后续计划:转投期刊
如果多轮会议投稿后仍未发表,可以将论文整理成更完整的版本,投稿到 IEEE TCAD 等期刊。
为了提升 RoRD 模型的性能和实用性,后续优化任务按模块、优先级和完成状态组织如下。
| 模块 | 任务 | 优先级 | 状态 | 价值 |
|---|---|---|---|---|
| 数据策略与增强 | 引入弹性变形 | 高 | 待处理 | 模拟芯片制造中的微小物理形变。 |
| 数据策略与增强 | 创建合成版图数据生成器 | 高 | 待处理 | 解决真实数据稀缺问题。 |
| 模型架构 | 实验现代骨干网络 | 中 | 待处理 | 用 ResNet 或 EfficientNet 替代 VGG-16。 |
| 模型架构 | 集成注意力机制 | 中 | 待处理 | 关注关键几何结构,提升特征质量。 |
| 训练与损失函数 | 实现损失函数自动加权 | 高 | 待处理 | 自动平衡多任务优化难度。 |
| 训练与损失函数 | 困难样本采样 | 中 | 待处理 | 提升描述子学习效率。 |
| 推理与匹配 | 特征金字塔网络(FPN) | 高 | 已完成 | 一次推理获得所有尺度特征。 |
| 推理与匹配 | 关键点去重(NMS) | 中 | 已完成 | 去除滑动窗口重复关键点。 |
| 代码与项目结构 | 迁移配置到 YAML | 低 | 已完成 | 便于管理多组实验配置。 |
| 代码与项目结构 | 代码模块解耦 | 低 | 已完成 | 提升可维护性。 |
| 实验跟踪与评估 | 集成 TensorBoard / W&B | 中 | 已完成 | 实时监控实验结果。 |
| 实验跟踪与评估 | 增加 mAP 评估指标 | 中 | 已完成 | 提供更全面的性能度量。 |
提升模型的鲁棒性和泛化能力,减少对大量真实数据的依赖。
优先级:高。
价值:模拟芯片制造中可能出现的微小物理形变,使模型对非刚性变化更鲁棒。
执行方案:
albumentations 库作为项目依赖。train.py 的 ICLayoutTrainingDataset 类中集成数据增强。A.ElasticTransform 配置到数据增强管道。优先级:高。
价值:解决真实版图数据获取困难、数量不足的问题,通过程序化生成大量多样化训练样本。
执行方案:
tools/generate_synthetic_layouts.py。gdstk 库程序化生成 GDSII 文件。tools/layout2png.py 批量转换为 PNG 图像。提升模型的特征提取效率和精度,降低计算资源消耗。
优先级:中。
价值:VGG-16 经典但效率偏低。ResNet、EfficientNet 等新架构可能用更少的参数量和计算量达到更好的性能。
执行方案:
models/rord.py 中修改 RoRD 类的 __init__ 方法。torchvision.models 替换 vgg16。resnet34 或 efficientnet_b0。优先级:中。
价值:引导模型自动关注版图中的关键几何结构,如边角和交点,忽略大面积空白或重复区域,提升特征质量。
执行方案:
models/rord.py 中插入注意力模块。self.backbone 和两个 head 之间。| 资源类型 | 需求规格 | 说明 |
|---|---|---|
| 数据集(启动阶段) | 100 到 200 张 | 高分辨率版图,用于功能验证。 |
| 数据集(初步可用) | 1,000 到 2,000 张 | 用于学习鲁棒几何特征。 |
| 数据集(生产级) | 5,000 到 10,000+ 张 | 覆盖各种工艺和设计风格。 |
| GPU(入门级) | RTX 3060 / 4060 | 满足基础训练需求。 |
| GPU(主流级) | RTX 3080 / 4070 | 推荐配置。 |
| GPU(专业级) | RTX 3090 / 4090 / A6000 | 提供最佳性能。 |
| 显存需求 | >= 12GB | Batch Size = 8,Patch = 256x256。 |
| CPU / 内存 | 8 核 / 32GB | 避免数据预处理成为瓶颈。 |
| 训练阶段 | 时间估算 | 说明 |
|---|---|---|
| 单个 Epoch | 15 到 25 分钟 | RTX 3080,2000 张图像。 |
| 总训练时间 | 约 16.7 小时 | 50 epochs,20 分钟 / epoch。 |
| 实际收敛时间 | 10 到 20 小时 | 使用早停机制,patience = 10。 |
| 数据增强调优 | 1 到 2 周 | 调整尺度、亮度、噪声参数。 |
| 损失函数权重 | 1 到 2 周 | 平衡 BCE、Triplet、Manhattan 等损失。 |
| 超参数搜索 | 2 到 4 周 | 调整学习率、批次大小和优化器。 |
| 模型架构微调 | 2 到 4 周 | 尝试不同骨干网络。 |
| 总调优时间 | 1.5 到 3 个月 | 达到生产级模型。 |
至少需要 12GB 显存。如果显存不足,需要将 Batch Size 降到 4 或 2,但会牺牲训练速度和稳定性。启动阶段 100 到 200 张数据即可验证流程,生产级模型需要 5,000 到 10,000+ 张图像来保证泛化能力。
这份规划将论文发表和工程优化拆成两条并行路线:投稿方面采用多轮会议加期刊后备的策略;技术方面优先补齐数据生成、增强、自动权重、困难样本和更现代的特征提取能力。这样既保证阶段性产出,也为长期模型质量提升保留空间。
正在加载评论...