加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 数据的完整性及其规范
    • 什么是数据科学
    • 企业如何依赖数据科学?
    • 数据挖掘和KDD
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

工程师说 | 智能物联网的数据科学和集成

2022/06/10
572
阅读需 6 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者:Suad Jusuf

Senior Manager

数据的完整性及其规范

数据可以指单独的事实,或者统计后的数据,还可以是各种信息的汇总,通常以数字表示。数据管理的重要性始于计算机科学本身的诞生。数据处理最初的重点是转换,存储,然后传输。然而,近年来,随着手机、智能传感器、联网汽车和我们周围许多其他数字设备的兴起,出现了前所未有的信息大爆炸。

不断增长的海量数据,需要人们采取合适的方式来管理它,通过减少数据冗余,保证准确和及时的获取,来确保数据的质量。为分析而访问和存储大量信息,人们已经有很多年的经验了。但大数据的概念在21世纪初获得了新的发展动力,它基于三个要素:数量、速度和多样性。对大数据进行分析以获得更好的洞察力来指导决策,是大数据的真正意义。这意味着收集的数据只有在最终用于解决问题并进而实现新的收入流和财务增长时才具有意义。这就是“数据科学”领域发挥关键作用的地方,因为它采用现代工具和技术来发现数据背后隐藏的有价值的信息,并据此做出成功的商业决策。

什么是数据科学

数据科学是一个术语,指的是使用各种科学手段、算法和步骤从不断增长的海量数据中提取背后含义的综合方法。使用软件科学识别出原始数据背后的规律和含义。这些有价值的见解有助于支持业务决策,分析解决业务困境,并将其转化为可行的解决方案。

企业如何依赖数据科学?

传统的商业数据分析(BI)工具不是为处理大量非结构化数据而构建的。数据科学利用更先进的工具来帮助分析、分类和筛选来自多个相关领域的大量数据,可在处理非结构化数据方面发挥重要作用。例如,在营销领域,基本的人口统计因素,如客户年龄、性别、地点和购买行为,有助于制定具有针对性的活动。这些活动,因为它们通过客户的浏览和购买历史来评估客户对商品的倾向,因此更能达到精准营销的目的。同样,在银行业务中,监控异常的客户交易可以帮助识别金融欺诈行为。在医疗保健行业,仔细检查和评估患者的病历可以揭示患病的可能性等等。

通过预测性维护,机器中的智能传感器收集数据,帮助工厂减少停机时间及相关的收入损失。预测和提前处理潜在的可能造成停产的问题,工厂就可以一直保持最高效率运行。

数据挖掘和KDD

数据挖掘”通常与KDD(Knowledge Discovery in Database,数据库中的知识发现)互换使用。如今,几乎每个行业都越来越受数据所驱动。但是,只有当你分析数据并找出它背后的价值时,数据才有意义。

大多数行业积累了海量数据,但在缺乏展示数据趋势的图形、图表和相关分析机制的情况下,纯数据本身没有多大意义。从现在数据积累的速度和规模上看,使用传统数据管理机制很难应对这样的挑战。因此,从经济和科学的角度来看,利用数据科学提升我们的分析能力,以便我们能够更好地处理我们的大数据,变得非常有必要。

下图显示了管理数据的各种工具之间的关系。

模式识别

模式识别通过识别数据模式来研究数据内涵。根据数据的类型和配置,可以使用不同的模式识别方法。模式按照描述性模式识别进行分类。对目标进行特征识别,并将这些特征与已知模式进行比较以判断它们是否匹配,或者存在差异。

统计学

在解决复杂且需要方法论的问题方面,统计学发挥着重要作用。这在有很多不确定性因素背景下需要做出高风险决定时尤其如此。统计学可以为分析师提供有把握的答案。

分析

分析是指检查数据,解决问题、获得洞察力并识别趋势的过程和行为。这是通过使用各种工具、技术和体系来完成的,根据所执行的分析类型而有所不同,主要有以下四种类型:

机器学习

机器学习是人工智能的一个分支,它依赖模型来执行自主任务。它依赖统计学和算法,根据历史数据帮助用户做出预测或决策。数据科学家使用机器学习和人工智能等技术来管理公司的数据。这使公司能够对即将发生的事情进行精确分析,从而对企业的未来产生积极的影响。

数据科学流程

CRISP-DM代表“数据挖掘的跨行业标准流程”,提供一个总览模型,描述数据科学的生命周期,帮助规划、组织和实施数据科学项目。它由以下步骤组成:

当辩证性思维遇到机器学习算法时,数据科学可以帮助获得对业务更佳的见解,提高工作效率,并提供业务决策的预判。最终目标是使公司能够从数据科学中受益,做出积极决策,以提供更多创新的产品和服务。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
NCV7344D10R2G 1 onsemi CAN FD Transceiver, High Speed, Low Power with NC, long filter time, 3000-REEL
$0.82 查看
TJA1042T/3,118 1 NXP Semiconductors TJA1042 - High-speed CAN transceiver with Standby mode SOIC 8-Pin

ECAD模型

下载ECAD模型
$1.51 查看
KSZ8081RNAIA-TR 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER, QCC24

ECAD模型

下载ECAD模型
$1.39 查看
瑞萨电子

瑞萨电子

(RENESAS)于2003年4月1日—由日立制作所半导体部门和三菱电机半导体部门合并成立。RENESAS结合了日立与三菱在半导体领域方面的先进技术和丰富经验,是无线网络、汽车、消费与工业市场设计制造嵌入式半导体的全球领先供应商。创立日期2003年4月1日公司法人董事长&CEO伊藤达业务范围单片机逻辑模拟等的系统LSI、分立半导体元件、SRAM等的存储器开发、设计、制造、销售、服务的提供。集团成员44家公司(日本20家,日本以外24家)年度销售额2006财年(截止至2007年3月):9526亿日元(约83亿美元)从业人员:26000人(全世界20个国家、43家公司)瑞萨科技是世界十大半导体芯片供应商之一,在很多诸如移动通信、汽车电子和PC/AV 等领域获得了全球最高市场份额。瑞萨集成电路设计(北京)有限公司苏州分公司(RDB-SU)是瑞萨科技全资子公司,2004年1月成立以来,现已拥有150多名优秀工程师,承担着家电和汽车电子领域MCU的一系列设计工作,并在2006年4月开始开发面向中国市场的MCU。

(RENESAS)于2003年4月1日—由日立制作所半导体部门和三菱电机半导体部门合并成立。RENESAS结合了日立与三菱在半导体领域方面的先进技术和丰富经验,是无线网络、汽车、消费与工业市场设计制造嵌入式半导体的全球领先供应商。创立日期2003年4月1日公司法人董事长&CEO伊藤达业务范围单片机逻辑模拟等的系统LSI、分立半导体元件、SRAM等的存储器开发、设计、制造、销售、服务的提供。集团成员44家公司(日本20家,日本以外24家)年度销售额2006财年(截止至2007年3月):9526亿日元(约83亿美元)从业人员:26000人(全世界20个国家、43家公司)瑞萨科技是世界十大半导体芯片供应商之一,在很多诸如移动通信、汽车电子和PC/AV 等领域获得了全球最高市场份额。瑞萨集成电路设计(北京)有限公司苏州分公司(RDB-SU)是瑞萨科技全资子公司,2004年1月成立以来,现已拥有150多名优秀工程师,承担着家电和汽车电子领域MCU的一系列设计工作,并在2006年4月开始开发面向中国市场的MCU。收起

查看更多

相关推荐

电子产业图谱

瑞萨电子提供创新嵌入式设计和完整半导体解决方案。作为专业微控制器供应商、模拟功率器件和SoC产品领导者,瑞萨电子为汽车、工业、家居、办公自动化、信息通信等应用提供综合解决方案。详见瑞萨官网。我们将与您分享近期产品技术资讯和新闻动态。