边缘计算有可能解决响应时间要求、电池寿命限制、带宽成本节约以及数据安全和隐私等问题。本文首先介绍了边缘计算的定义,然后介绍了从云卸载到智能家居和城市,以及协同边缘到实现边缘计算概念的几个案例研究。最后,我们提出了边缘计算领域的一些挑战和机遇,希望本文能引起社会的关注,并对这一方向的研究有所启发。
为什么要研究边缘计算
到2019年,由人、机器和事物产生的数据将达到500 zettabytes,正如思科全球云指数所估计的那样,但是到那时全球数据中心IP流量将仅达到10.4 zettabytes。到2019年,45%的物联网创建数据将存储、处理、分析,并在网络附近或边缘采取行动。思科互联网业务解决方案集团(Cisco Internet Business Solutions Group)预测,到2020年,将有500亿台设备连接到互联网上。有些物联网应用可能需要很短的响应时间,有些可能涉及到私有数据,有些可能产生大量的数据,这对网络来说可能是一个沉重的负担。云计算的效率不足以支持这些应用程序。
什么是边缘计算
数据在网络边缘的生成越来越多,因此,在网络边缘处理数据也会更有效。以前的工作,如微型数据中心、Cloudlet和雾计算,已经引入到社区,因为当数据在网络边缘生成时,云计算并不总是有效的数据处理。在这一部分中,我们列出了一些原因,为什么对于某些计算服务,边缘计算比云计算更有效,然后我们给出了我们对边缘计算的定义和理解。
为什么需要边缘计算
来自云计算的推动
随着边缘数据生成量的不断增加,数据传输速度正成为云计算范式的瓶颈。例如,波音787每秒将生成大约5千兆字节的数据,但飞机与地面卫星或基站之间的带宽不足以传输数据。
来自物联网的拉动
可以肯定的是,网络边缘的事物数量在几年内将发展到数十亿以上。因此,它们产生的原始数据将是巨大的,使得传统的云计算效率不足以处理所有这些数据。这意味着物联网产生的大部分数据将永远不会传输到云,而是将在网络边缘消耗。
从数据消费者到生产者的改变
从数据消费者到数据生产者/消费者的变化需要在边缘放置更多的函数。例如,今天人们拍照或录像,然后通过云服务(如YouTube、Facebook、Twitter或Instagram)共享数据,这是很正常的。
此外,每一分钟内,YouTube用户上传72小时的新视频内容;Facebook用户分享近250万条内容;Twitter用户推特推特推特推特推特推特近30万次;Instagram用户发布近22万张新照片。
边缘计算是什么
边缘计算是指允许在网络边缘、代表云服务的下游数据和代表物联网服务的上游数据进行计算的启用技术。在这里,我们将“边缘”定义为数据源和云数据中心之间的任何计算和网络资源。
边缘计算可以与雾计算互换,但是边缘计算更多地集中在事物方面,而雾计算更多地集中在基础设施方面。
边缘计算的优势
在边缘计算中,我们希望将计算放在数据源附近。与传统的基于云的计算模式相比,这有几个好处。在这里,我们使用社区的一些早期结果来展示潜在的好处。研究人员建立了一个概念验证平台,用于运行人脸识别应用程序,通过将计算从云端移动到边缘,将响应时间从900 ms缩短到169ms。Ha等人使用Cloudlet卸载可穿戴认知辅助的计算任务,结果表明,响应时间在80-200ms之间,而且Cloudlet卸载还可以减少30%-40%的能耗。clonecloud在移动与云的结合分区、迁移与合并、按需实例化分区等方面,其原型可以为测试应用减少20倍的运行时间和能源。
案例研究
云卸载
在传统的内容交付网络中,只有数据缓存在边缘服务器上。这是基于内容提供商在互联网上提供数据的事实,这在过去几十年中是正确的。在物联网中,数据在边缘产生和消耗。因此,在边缘计算范式中,不仅应该在边缘缓存数据,还应该缓存应用于数据上的操作。
应用:
- 导航应用程序可以将导航或搜索服务移动到局部区域的边缘,在这种情况下,只涉及几个地图块。
- 可以在边缘节点上进行内容过滤/聚合,以减少要传输的数据量。
- 视觉辅助娱乐游戏、增强现实、互联健康等实时应用可以通过边缘节点快速响应。
视频分析
由于数据传输延迟和隐私问题,云计算不再适用于需要视频分析的应用程序。
与单独的云计算相比,可以在每台边缘设备上利用数据和计算能力,并更快地获得结果。
智能家居
下图显示了智能家居环境中Edgeos的一个变体的结构。Edgeos需要通过Wi-Fi、蓝牙、ZigBee或蜂窝网络等多种通信方式从移动设备和各种事物收集数据。来自不同来源的数据需要在数据抽象层中进行融合和按摩。
智慧城市
- 大数据分析:到2019年,拥有100万人口的城市每天将产生180 PB的数据。
- 低延迟
- 位置感知
边缘协作
协作边缘将地理上分布的多个利益相关者的边缘连接起来,尽管这些利益相关者的物理位置和网络结构不同。这些特殊的连接边缘为利益相关者提供了共享和合作数据的机会。
例如医院会总结并分享某次流感爆发的信息,如平均成本、症状和人口等。理论上,患者会按照处方从药房获得药片。一种可能是病人没有接受治疗。然后医院必须承担再入院的责任,因为它不能得到病人没有服用药物的证据。现在,通过协作边缘,药房可以向医院提供患者的购买记录,这大大简化了医疗保健责任。
挑战和机遇
可编程性
通常,程序是用一种编程语言编写的,并为特定的目标平台编译,因为程序只在云中运行。然而,在边缘计算中,计算是从云上卸载的,边缘节点很可能是异构平台。在这种情况下,这些节点的运行时是不同的,程序员编写一个可能部署在边缘计算范式中的应用程序面临着巨大的困难。
命名
在边缘计算中,一个重要的假设是事物的数量是巨大的。在边缘节点的顶部,有许多应用程序在运行,每个应用程序都有其自己的结构,说明如何提供服务。与所有计算机系统一样,边缘计算中的命名方案对于编程、寻址、事物识别和数据通信都非常重要。然而,边缘计算范式的有效命名机制尚未建立和标准化。边缘从业者通常需要学习各种通信和网络协议,以便与系统中的异构事物进行通信。边缘计算的命名方案需要处理事物的移动性、高度动态的网络拓扑、隐私和安全保护,以及针对大量不可靠事物的可扩展性。
数据抽象
通过服务管理层的空气位置指示器,各种应用程序可以运行在消耗数据或提供服务的EDGEOS上。在无线传感器网络和云计算范式中,数据抽象已经得到了很好的讨论和研究。然而,在边缘计算中,这个问题变得更具挑战性。有了物联网,网络中会有大量的数据生成器,这里我们以一个智能家庭环境为例。在智能家居中,几乎所有的东西都会向Edgeos报告数据,更不用说在家里部署了大量的东西。然而,网络边缘的大多数东西,只定期向网关报告感应到的数据。
- 来自不同事物的报告数据具有不同的格式
- 有时很难确定数据抽象的程度
- 数据抽象的另一个问题是对事物的适用操作
服务管理
- 差异化:随着物联网部署的快速增长,我们预计将在网络边缘部署多种服务,如智能家居。
- 可扩展性:可扩展性在网络边缘可能是一个巨大的挑战,与移动系统不同,物联网中的东西可能是非常动态的。
- 隔离:隔离是网络边缘的另一个问题。
- 可靠性:最后但不是最不重要的,可靠性也是网络边缘的一个关键挑战。我们可以从服务、系统和数据的不同角度来识别可靠性方面的挑战。
隐私和安全
- 社区的隐私和安全意识。
- 从Edge上收集的数据的所有权。
- 缺少有效的工具来保护网络边缘的数据隐私和安全。
优化指标
- 延迟:延迟是评估性能的最重要指标之一,特别是在交互应用程序/服务中。
- 带宽:从延迟的角度来看,高带宽可以减少传输时间,特别是对于大数据(如视频等)。
- 能源:能源是网络边缘最宝贵的资源。
- 成本:从服务提供商的角度,如YouTube、Amazon等,边缘计算为他们提供了更少的延迟和能源消耗,潜在的增加投入和改进的用户体验。
结论
现在,越来越多的服务被从云推到网络的边缘,因为在边缘处理数据可以确保更短的响应时间和更好的可靠性。此外,如果可以在边缘处理更大的数据部分,而不是上传到云端,那么也可以节省带宽。物联网和通用移动设备的迅速发展改变了EDGE在计算范式中的角色,从数据消费者转变为数据生产者/消费者。在网络边缘处理或按摩数据会更有效。