上海交大招生办揭秘高招新规单看分布偏移远不足真实数据背后隐藏的外部有效性关键解锁

数据分布偏移远不够！真实世界的复杂性中，外部有效性是不可或缺的关键

在探讨人工智能系统时，研究人员常常将注意力集中于数据分布偏移这一问题上。然而，单纯关注这个方面可能不足以全面理解模型在真实世界中的表现。Deborah Raji，一个技术研究员，在一篇发表在UC伯克利助理教授Benjamin Recht个人博客argmin上的文章中提出了对此话题的看法。

Raji对于学界过度关注数据分布偏移感到担忧，她认为更应该考虑统计上一个相关概念——外部有效性（external validity）。她警告说，对于这一术语的痴迷会限制ML社区的发展，使得社区更加专注于回顾性的研究，而不是前瞻性的研究。

Raji希望研究能够更多地转向“有效性”（validity）这一概念，它衡量了系统的可信赖性。她指出，即使有时候模型表现良好，但当它们被应用到新的场景时，也可能出现显著差异。这是因为现实世界中的数据往往是动态变化和不可预测的，而这些变化可能导致模型失效。

她用了一篇关于败血症预测模型外部有效性的分析作为例子来说明这个问题。在这篇文章中，作者描述了使用败血症模型的情况，并发现该工具未能识别出67% 的败血症患者，这导致了大量虚假报警。这些问题超出了简单的数据分布偏移，而是涉及到了医生与模型交互以及其他影响结果的事项。

Raji强调说，更需要关注的是如何确保AI系统能够在不同环境和条件下保持其性能，从而实现真正的人工智能。这意味着我们需要从仅仅关注内部测试性能转变为考虑外部实际应用场景，以及所有潜在因素如何影响最终结果。通过这种方式，我们才能更好地理解并解决现有的挑战，并推动人工智能技术朝着更加可靠和广泛适用的方向发展。

标签：数码电器行业动态

猜你喜欢

数码电器行业动态水泥砂浆配合比...: 水泥砂浆配合比精确配制：保证混凝土强度与美观水泥砂浆配合比的重要性配合比是指在水泥砂浆中，水泥、细骨料（如粉煤灰）、粗骨料（如石子或碎石）以及添加剂等...

数码电器行业动态夜幕下的音符创...: 夜幕下的音符：创意ktv空间装饰设计在繁华的都市中，ktv（Karaoke TV）不仅是人们放松娱乐的一处场所，更是时尚与艺术的殿堂。如何将这种传统娱乐...

数码电器行业动态实验室气流粉碎...: 产品介绍：SJM-50型与SJM-100型气流粉碎机是为实验室而精心设计的设备，满足了制药科研单位和企业研发部门对高品质药品研发的需求。SJM-50型主要...

数码电器行业动态数字的歌谣探索...: 在这个世界上，有些数字似乎拥有着超越其本身意义的力量。它们不仅是我们日常生活中不可或缺的一部分，更是人类智慧和创造力的产物。今天，我们要探讨的一个数字就是...

强力推荐