颜料老化预测算法管理平台

ΔE*(dietaE)预测对比与得分

正式文案以仓库内 doc/AI算法比赛说明.docx 为准(第六届长三角青少年人工智能奥林匹克挑战赛 · AI 算法)。以下内容为该文档中与数据含义、提交格式相关的摘要。

赛题介绍:构建颜料样品老化预测模型,利用颜料短期的紫外老化表现,预测长期老化下的色差。色差为 Lab 空间中老化前后两点的欧氏距离(ΔE,本平台 CSV 字段名为 dietaE)。

色差量级:一般认为 ΔE < 1 时人眼较难察觉差异,ΔE > 2 时通常已能明显看出色差。

数据说明:训练集为实验测量的 181 条记录(含 sampleaging_condition(UV / humid-_heat)、aging_time_day、初始 Lab、老化后 Lab、dietaE 等);同一样品的 L0、a0、b0 应一致。测试集共 37 条,一部分为训练集中样品在更长老化时间下的数据,一部分为全新样品;选手需据给定字段预测对应色差(与本平台 paint_aging_trainset.csv / paint_aging_testset.csv 一致)。

提交说明:须按测试集文件原有行顺序提交单列 CSV,列名为 dietaE;文件名应为 predict_out,格式 CSV,不超过 100MB。每日限提交 2 次预测结果文件。

复赛材料(节选):晋级复赛需提交训练代码、模型权重、推理代码;README 中说明策略、训练与推理启动方式;说明所用 Python 包或提供 environment.yml;若使用数据增强须在 README 写明增强方法及数据来源

本页用途:在队内并排对比多份预测输出与已在 result_meta_registry 登记的平台得分/排名;评测以官方系统为准,得分越高表示与隐藏真值越接近。

黑盒得分一览(result_meta_registry)

横轴为结果文件;绿色柱为有分数的记录,灰色为尚未录入。可多选下方结果后在右侧表格查看选中项。

选中结果:得分速览

勾选预测 CSV 后在此对照得分与排名。

选择要比对的预测结果(最多 6 份)

同一测试集行顺序应与 CSV 行一致;热力图与柱状图按测试集行对齐,可直接看出模型间偏差。

已选 0 / 6

① 测试集全行:模型间差异热力图

每行对应 paint_aging_testset.csv 的一条记录;颜色越深表示 dietaE 越大。便于一眼看出不同模型在同一待测样品上的推算高低。

② 测试集全行:分组柱状对比(可横向缩放)

同一测试行上并列展示各模型 dietaE,差异最直接。请用底部滑块缩放横轴,浏览全部测试集行。

③ 模型离散度(逐行最大−最小)

若多条曲线在某一行相差很大,说明模型对该样品判断分歧大,可重点复盘特征与算法。

④ 数值明细表(含行间极差)

「极差」为当前所选模型在该行的 max−min,便于筛出分歧最大的样品。

⑤ 训练集锚点对照 + 线性外推预判带

深蓝折线为训练 dietaE(同日多点均值)。浅绿带状区域为基于末段斜率线性外推得到的参考区间(训练区间内略窄、外推区间随天数加宽),不是官方真值,仅辅助判断是否「离谱」。勾选结果后,为每个模型额外绘制同色外推折线(对离散测试日做轻微平滑插值):自训练末点连向「测试 aging_time_day ≥ 训练最大天」的预测(同日多点取均值);若某工况仅有一个外推测试日,则只能显示一段线段,不代表模型在时间上必为线性。圆点为各模型在测试天数上的预测:填充色对应所选模型图例色;落在带外时点大小与带内一致,仅以红色描边提示,避免大红点遮盖训练点或其它模型点。中国画类等训练未出现的样品无上。

⑥ 与训练曲线插值的参考误差(非官方分数)

将预测与「训练集同样品、按天数线性插值」的 dietaE 对照,仅适用于训练里出现过该样品且天数落在训练区间附近的情形;不能替代黑盒得分

⑦ 得分序上的逐行预测轨迹(对照验证)

横轴将当前勾选的各结果 CSV 按 result_meta_registry 中的黑盒得分从低到高排列(无分时排在有分之后、按文件名)。左图:得分柱;右图:每条测试行在该顺序下的 dietaE 折线(沿横轴走向表示「从低分模型切到高分模型」时预测如何变化)。注意:这只能做队内一致性/分歧观察,不能从「某行随得分单调」反推官方真值;若高分模型在某行普遍抬高预测,说明该题点可能更依赖偏大或偏小的整体标度。