Skip to content

【Hackathon 10th Spring No.10】ECDFormer模型复现任务#245

Open
PlumBlossomMaid wants to merge 12 commits intoPaddlePaddle:developfrom
PlumBlossomMaid:ECFormer-Model
Open

【Hackathon 10th Spring No.10】ECDFormer模型复现任务#245
PlumBlossomMaid wants to merge 12 commits intoPaddlePaddle:developfrom
PlumBlossomMaid:ECFormer-Model

Conversation

@PlumBlossomMaid
Copy link

@PlumBlossomMaid PlumBlossomMaid commented Feb 24, 2026

📌 项目介绍

本PR是ECDFormer模型复现任务的核心代码合入申请。ECDFormer(Nature Computational Science 2025)通过“解耦峰属性学习”实现高效、可解释的ECD/IR光谱预测。

目前已根据第一次Review意见完成PR合并版权声明添加,现根据第二次Review意见整理待办清单如下。

✅ 工作进展

已完成

  • 将PR-245与PR-246合并,关闭PR-246
  • 为所有新增文件添加Paddle版权声明

进行中

  • loss/metrics迁移:将utils/loss/下的损失函数移至ppmat/models/losses/公共模块
  • utils工具迁移:将通用工具函数提取到ppmat/utils/公共目录
  • 补充材料提供
    • 提供ECD/IR数据集下载链接
    • 上传预训练模型权重及训练日志文件(如果有)
  • 数据集工厂函数改造:参考build_spectrum的实现方式,重构数据集加载逻辑
  • 补完训练脚本与推理脚本: 根据上述已经固定的API,仿照DiffNMR训练脚本的风格,在spectrum_elucidation\ECFormer目录下补充适用于ECFormer的训练与推理脚本
  • 代码注释英文化:将所有.py文件的注释、docstring修改为英文
  • README文档完善
    • spectrum_elucidation/README.md添加ECFormer系列模型说明
    • 新建spectrum_elucidation/ECFormer/README.md,包含模型说明、复现精度
    • 参考其他任务(如DiffNMR)完善文档格式
  • RFC文档同步更新:根据最终代码实现,更新之前提交的RFC设计文档

🔗 相关链接


感谢Reviewer的耐心指导,所有待办将按清单顺序依次推进。

@paddle-bot
Copy link

paddle-bot bot commented Feb 24, 2026

Thanks for your contribution!

@paddle-bot paddle-bot bot added the contributor External developers label Feb 24, 2026
Removed duplicate import of OMol25Dataset.
@leeleolay
Copy link
Collaborator

leeleolay commented Feb 26, 2026

@PlumBlossomMaid 感谢您的代码贡献,有如下合入规范的建议辛苦参考:辛苦将本PR和PR-246合并为一个,代码注释修改为英文,并在每个文件前添加Paddle权利声明,数据集的加载辛苦使用build的工厂函数方式,utils里面的内容可以提取到model外ppmat里相应的部分,在spectrunm elucidation里面的readme添加模型说明,并且添加模型readme页面并且声明模型复现效果,辛苦提供数据集链接和预训练模型权重log文件

@PlumBlossomMaid PlumBlossomMaid changed the title 【Hackathon 10th Spring No.10】ECDFormer模型复现任务Models部分 【Hackathon 10th Spring No.10】ECDFormer模型复现任务 Feb 27, 2026
Copy link
Collaborator

@leeleolay leeleolay left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

添加模型复现精度说明,并且补充readme文档,可以参考其他任务里的模型的情况。loss和metric的部分可以移动到ppmat下的公共模块部分

# limitations under the License.

"""
ECDFormer数据集加载模块
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

注释请修改为英文

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

好的好的~近几天较忙,所有review中的要求我会依次进行~

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

请参考其他dataset的实现逻辑和方式,目前已经构建了一套数据集的初始化和加载逻辑,请按照套件已有的逻辑

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

可以参考build_spectrum

@PlumBlossomMaid
Copy link
Author

IR数据集我发天翼云网盘了,请通过这里获取,访问码:7sax。
如果不方便注册账号,可以通过文件直链的形式进行下载,点击这里,文件直链有效期为30天。

@leeleolay
Copy link
Collaborator

IR数据集我发天翼云网盘了,请通过这里获取,访问码:7sax。 如果不方便注册账号,可以通过文件直链的形式进行下载,点击这里,文件直链有效期为30天。

https://paddle-org.bj.bcebos.com/paddlematerials/datasets/IR/IR.tar.gz 请参考这个链接 @PlumBlossomMaid

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

contributor External developers

Projects

None yet

Development

Successfully merging this pull request may close these issues.

3 participants