打造全球通用“疫苗护照”及“健康数字证书”
传统上来看,企业依靠商业智能系统从不断增长的数据池中获得见解。但是,BI系统部分依靠人类来发现电子表格、仪表板、图表或图形中的趋势。他们也受到大数据4个属性的挑战:数量、速度、多样性和准确性。随着企业存储越来越多的数据,以更快的速度从各种各样的数据源中收集数据,以不同的格式和不同的数据质量级别,BI的常规数据仓库和业务分析方法已经不够用。 相比之下,亚马逊、谷歌、Netflix和Spotify等领先公司的经验表明,应用数据科学的基本方面可以帮助发现更深刻的见解,从而提供比商业竞争对手更大的竞争优势。他们和其他组织(银行和保险公司、零售商、制造商等)都在利用数据科学来发现数据集的模式、识别潜在的异常交易、发现错失客户的机会,并创建未来行为和事件的预测模型。 同样,医疗保健提供者依靠数据科学来帮助诊断医疗状况,并改善患者护理,而政府机构则将其用于提早通知可能危及生命的情况,以及确保关键系统和基础设施的安全性等。 数据科学工作主要由数据科学家完成。尽管对其工作描述尚未达成共识,但下面是有效的数据科学家必须具备的最低技能:
作为数据科学团队的一部分,数据科学家经常与数据工程师合作,以从多个源系统中收集和整理数据;数据科学家还需要与业务分析师合作,以了解不断发展的业务需求,以及数据分析师,以了解不断变化的数据集特性,还有开发人员–他们可以帮助将由数据科学应用程序生成的分析模型投入生产环境。 现在企业越来越多地要求这些模型做更多的事情,而不仅仅是提供对当前数据状态的见解的快照。数据科学家可以训练算法来学习样本数据的模式、相关性和其他特征,然后分析他们从未见过的完整数据集。通过这种方式,数据科学推动人工智能的发展,特别是通过使用机器学习来支持AI的目标。 机器学习 智能的标志之一是从经验中学习的能力。如果机器可以识别数据中的模式,则它们可以使用这些模式来对新数据生成见解或预测。这是机器学习背后的基本概念。 机器学习依赖于算法,这些算法可以将从良好数据示例中学习编码为模型。这些模型可用于广泛的应用程序,例如将数据分类(“此图像是猫吗?”),根据给定的先前识别模式预测某些数据的值(“此交易是欺诈的概率是多少? ?”),以及标识数据集中的组(“我还可以向购买该产品的人推荐其他哪些产品?”)。 机器学习的核心概念体现在分类、回归和聚类中。现在已经创建各种各样的机器学习算法,可跨不同的数据集执行任务。可用的算法包括决策树、支持向量机、K均值聚类、K最近邻、朴素贝叶斯分类器、随机森林、高斯混合模型、线性回归、逻辑回归、主成分分析等。数据科学家通常会构建和运行算法;现在,有些数据科学团队还包括机器学习工程师,他们可以帮助编码和部署结果模型。 机器学习过程涉及不同类型的学习,其中数据科学家和分析师的指导水平各不相同。主要的替代方法是:
现在没有哪种算法方法能像人工神经网络那样让人感到兴奋和充满希望。就像生物系统一样,神经网络包含神经元,这些神经元可以获取输入数据,对输入施加权重和偏差调整,然后将结果输出馈送到其他神经元。通过这些神经元之间一系列复杂的互连和相互作用,随着时间的推移,神经网络可以学习如何调整权重和偏差,以提供所需结果。 在1950年代还是感知器算法中的单层神经元,现在已经发展成为一种更为复杂的方法,称为深度学习,该方法使用多层来产生细微而复杂的结果。这些多层神经网络已经显示出强大功能,可从大型数据集中学习并支持面部识别、多语言对话系统、自动驾驶汽车和高级预测分析等。 在数据密集型公司(例如Google、Netflix、亚马逊、微软和IBM)的大力推动下,曾经看起来像是一种假设的研究迅速成为可能现实,并在2000年代初开始发展。大数据的可用性、数据科学的能力和机器学习的力量,不仅为面临挑战的当今企业提供了答案,而且还可以帮助克服长期挑战,使AI照进现实。 人工智能
人工智能是比计算本身更古老的想法:是否有可能创造出具有人类认知能力的机器?人工智能的想法最早出现在在20世纪中叶,长期以来,这个想法激励着学者、研究人员和科幻小说作家。在1950年,计算机先驱和著名的代码破解者Alan Turing提出机器智能的基本测试,该测试被称为图灵测试。人工智能一词是在1956年在达特茅斯举行的AI会议上提出。 (编辑:淮南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |