评分算法使用 Wasserstein 距离(wasserstein metric)算得的 loss 函数作为评分结果。

背景知识介绍

KL 散度和 JS 散度经常被用来定义两个分布之间的距离,其定义如下:

KL 散度

KL 散度:

KL 散度又称为相对熵(relative entropy),与 fisher 信息矩阵有关,衡量的是用分布函数 来近似分布函数 ,所损失的信息。

JS 散度

JS 散度(Jensen–Shannon divergence):

JS 散度又称为信息半径(information radius),在 KL 散度的基础上有所修正,解决了不对称的问题,并且更加平滑。

JS 散度是有界的(以 2 为底数的话值域为 )

Wasserstein 距离的数学定义

Wasserstein 距离(又叫 Earth-Mover 距离)是衡量两个分布之间距离的一个函数,数学定义如下:

Wasserstein 距离相比 KL 散度和 JS 散度的优势在于,即使两个分布的支撑集没有重叠或者重叠非常少,仍然能反映两个分布的远近。而 JS 散度在此情况下是常量,KL 散度可能无意义。

直观理解

Wasserstein 距离的直观解释:

wdistance

Wasserstein 距离实际上是最优传输问题(optimal transport)中的概念,指的是把概率分布 转换为 的最小传输质量(概率密度在离散情况下,叫做概率质量),也叫做最优传输距离或者推土机距离。

比赛中使用的评分算法

比赛中给出的数据为计算机模拟的 PMT 波形数据,参赛者要求从这些波形数据中找出中微子信号出现的时间戳。

我们用参赛者提交的时间戳(看作一个离散分布),与真实的事件发生时间(看作一个离散分布)之间的 Wasserstein 距离作为评分标准。