数据可视化 · 颜料老化 ΔE* 预测对比

ΔE*（dietaE）预测对比与得分

正式文案以仓库内 doc/AI算法比赛说明.docx 为准（第六届长三角青少年人工智能奥林匹克挑战赛 · AI 算法）。以下内容为该文档中与数据含义、提交格式相关的摘要。

赛题介绍：构建颜料样品老化预测模型，利用颜料短期的紫外老化表现，预测长期老化下的色差。色差为 Lab 空间中老化前后两点的欧氏距离（ΔE，本平台 CSV 字段名为 dietaE）。

色差量级：一般认为 ΔE < 1 时人眼较难察觉差异，ΔE > 2 时通常已能明显看出色差。

数据说明：训练集为实验测量的 181 条记录（含 sample、aging_condition（UV / humid-_heat）、aging_time_day、初始 Lab、老化后 Lab、dietaE 等）；同一样品的 L0、a0、b0 应一致。测试集共 37 条，一部分为训练集中样品在更长老化时间下的数据，一部分为全新样品；选手需据给定字段预测对应色差（与本平台 paint_aging_trainset.csv / paint_aging_testset.csv 一致）。

提交说明：须按测试集文件原有行顺序提交单列 CSV，列名为 dietaE；文件名应为 predict_out，格式 CSV，不超过 100MB。每日限提交 2 次预测结果文件。

复赛材料（节选）：晋级复赛需提交训练代码、模型权重、推理代码；README 中说明策略、训练与推理启动方式；说明所用 Python 包或提供 environment.yml；若使用数据增强须在 README 写明增强方法及数据来源。

本页用途：在队内并排对比多份预测输出与已在 result_meta_registry 登记的平台得分/排名；评测以官方系统为准，得分越高表示与隐藏真值越接近。

黑盒得分一览（result_meta_registry）

横轴为结果文件；绿色柱为有分数的记录，灰色为尚未录入。可多选下方结果后在右侧表格查看选中项。

选中结果：得分速览

勾选预测 CSV 后在此对照得分与排名。

选择要比对的预测结果（最多 6 份）

同一测试集行顺序应与 CSV 行一致；热力图与柱状图按测试集行对齐，可直接看出模型间偏差。

① 测试集全行：模型间差异热力图

每行对应 paint_aging_testset.csv 的一条记录；颜色越深表示 dietaE 越大。便于一眼看出不同模型在同一待测样品上的推算高低。

② 测试集全行：分组柱状对比（可横向缩放）

同一测试行上并列展示各模型 dietaE，差异最直接。请用底部滑块缩放横轴，浏览全部测试集行。

③ 模型离散度（逐行最大−最小）

若多条曲线在某一行相差很大，说明模型对该样品判断分歧大，可重点复盘特征与算法。

④ 数值明细表（含行间极差）

「极差」为当前所选模型在该行的 max−min，便于筛出分歧最大的样品。

⑤ 训练集锚点对照 + 线性外推预判带

深蓝折线为训练 dietaE（同日多点均值）。浅绿带状区域为基于末段斜率线性外推得到的参考区间（训练区间内略窄、外推区间随天数加宽），不是官方真值，仅辅助判断是否「离谱」。勾选结果后，为每个模型额外绘制同色外推折线（对离散测试日做轻微平滑插值）：自训练末点连向「测试 aging_time_day ≥ 训练最大天」的预测（同日多点取均值）；若某工况仅有一个外推测试日，则只能显示一段线段，不代表模型在时间上必为线性。圆点为各模型在测试天数上的预测：填充色对应所选模型图例色；落在带外时点大小与带内一致，仅以红色描边提示，避免大红点遮盖训练点或其它模型点。中国画类等训练未出现的样品无上。

⑥ 与训练曲线插值的参考误差（非官方分数）

将预测与「训练集同样品、按天数线性插值」的 dietaE 对照，仅适用于训练里出现过该样品且天数落在训练区间附近的情形；不能替代黑盒得分。

⑦ 得分序上的逐行预测轨迹（对照验证）

横轴将当前勾选的各结果 CSV 按 result_meta_registry 中的黑盒得分从低到高排列（无分时排在有分之后、按文件名）。左图：得分柱；右图：每条测试行在该顺序下的 dietaE 折线（沿横轴走向表示「从低分模型切到高分模型」时预测如何变化）。注意：这只能做队内一致性/分歧观察，不能从「某行随得分单调」反推官方真值；若高分模型在某行普遍抬高预测，说明该题点可能更依赖偏大或偏小的整体标度。