分散化如何减轻人工智能中的数据偏差

Covid-19疫情使全世界的卫生系统不堪重负。当时，用于患者的床位和通风机以及用于医务人员的防护装备不足以使人四处走动。这意味着特别是在发达国家，卫生系统必须采用某些技术来有效地分配资源。人工智能就是其中之一，它在对抗方面的重要性不断提高。

由纽约大学研究人员开发的一款应用程序，利用人工智能和大数据预测Covid-19病例的严重性，至少从理论上讲就是该技术如何帮助资源分配的一个很好的例子。研究人员使用了来自中国武汉160家医院的患者数据，确定了四种生物标志物，这些生物标志物在死于病毒的患者中明显高于在康复中的患者。该应用程序基于输入到AI模型中的数据，为患者分配严重性评分，临床医生可以使用该评分做出明智的护理和资源分配决策。

公平，性别与平等研究中心的Genevieve Smith和Ishita Rustagi写道，尽管AI可以给战场带来积极影响，但所使用的基础数据中的缺陷可能会加深性别和种族群体之间已经存在的不平等现象。加州大学伯克利分校哈斯商学院的领导力，发表在《斯坦福大学社会创新评论》上。

有趣的是，这些数据可靠性问题并非时代所固有。实际上，AI及其机器学习和深度学习的子集(仅举几例)受到数据偏差和数据质量难题的困扰。

这里的主要讨论是关于区块链如何帮助解决这些数据可靠性问题。但是，首先了解数据偏差的来源很有价值。

另外，在数据收集阶段，由于收集的数据不能代表现实或反映了现有的偏见，因此偏差可能会漏进去。例如，如果您向深度学习模型提供了更多特定皮肤颜色的照片，则后续的面部识别系统将更好地识别训练数据中的主要皮肤颜色。

关于收集反映现有偏见的数据，亚马逊亚马逊据报道，在发现基于AI的招聘系统偏向女性后，该系统放弃了该系统。一组研究人员在2019年发现，将其带回到医疗保健中，该算法被许多美国医院用来预测风险并随后分配资源，使白人患者胜于黑人而不是黑人。

两种基于区块链的方法来提高数据质量

挖掘得越深，就会发现更多的偏见。考虑到这些问题的复杂性，没有唯一的解决方案。但是，专家们同意的一件事是对数据多样性的需求。为了实现这种数据多样性，提高数据的透明度以及强大的协作可以改善这种情况。在这里进入区块链技术。通过设计，该技术只能通过多方协作来维护网络。这可能为机器学习模型及其所提供的数据带来透明度，去中心化和可验证性。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢