《乐享科研》第2期回顾&资料分享:《从新型QoS/QoE视角漫谈云与边缘的“进化”》

openlab_4276841a 更新于 1月前

8月26日,第二期【乐享科研】直播活动如期举行,来自华中科技大学的刘方明教授给大家带来了《从新型QoS/QoE视角漫谈云与边缘的“进化”》主题分享,刘教授跳出了传统的边缘和云计算研究关注的性能指标,站在更加广阔的视角,从质量、开放、智能、绿色这几个角度分析了当前云计算研究的最新进展。这些热点的技术研究启发了新的研究机会,让观众也有满满的收获。下面我们节选本次直播的部分内容做一个简单的回顾,想要了解更多精彩内容,可以在文末观看视频回看。

NO.1 [精彩回顾]


刘教授首先介绍了第一个案例Postman系统,该系统主要针对瞬时小流量引起的高突发的场景,这种模式在当前的高性能分布式系统中广泛存在,而当前的系统在面对这样的大量突发流量时会出现性能的严重下降。而Postman系统采用了经典的batch思想,灵活地根据当前系统的可用资源和到达流量的模式,将小流量打包汇聚进行集中处理。这样的方法可以在软件层减少大量的中断等开销,有效减小了处理的时延,提升系统的性能。

同时,刘教授还列举了一些相关的文章供大家参考,涉及数据中心网络、网络虚拟化、带宽公平分配、负载迁移,以及软硬结合的一些方面的研究。

接下来,刘教授介绍了第二个案例DHL系统,该系统针对的是当前软件实现的网络功能(Network Function, NF)虽然提供了灵活性却难以保证高性能的问题。DHL系统通过构造一套基于FPGA的通用硬件卸载模块和软件库,方便开发者将大量消耗CPU的功能卸载到FPGA中,同时通过接口的标准化封装保证了程序编写的简洁性。通过这样软硬件融合的方法,在提升系统性能的同时,保证了灵活性。

同时,刘教授也推荐了一些与NFC和5G相结合、负载均衡、网络虚拟化等相关的文章供大家参考。

下面刘教授从全局的角度介绍了Tricircle系统,该系统包括了之前介绍的Postman和DHL子系统,涵盖了云内管理(intra cloud)到云间管理(inter cloud)。同时,刘教授分享了他们团队在开源系统开发和生态构建方面的经验。


NO.2 [问答环节]

1、接下去在NFV有什么研究的热点问题和方向?
NFV实际在5G的时代大有可为,因为5G要做虚拟网络的功能切片,而且面向大量的新兴场景,如工业互联网、自动驾驶、园区等等。NFV就是作为网络切片里面其中一项技术,因此NFV在5G里面的应用显然是热点之一。还有NFV在边缘环境下怎么轻量化地部署,也是可能在边缘计算领域网络层面必备的技术之一。还有像网络NFV服务链的放置与调度、负载均衡,甚至是NFV的能耗方面,是有很多的研究可以去做的。

2、NFV现在还有什么关键的问题没有得到好的解决?

第一个关键的问题就是在新的像5G边缘这样的架构或场景下,怎么去把NFV进一步的落地,做出新的应用。第二个就是网络功能虚拟化,它存在着性能和灵活性之间的权衡,一方面它用通用硬件,上面是纯软的,但是它的性能比专用网元下降了,那么要想提高性能,就需要一些性价比比较高的体系结构上的软硬结合的东西,这里就有很多想象的空间,所以怎么把体系结构中软硬结合的东西在NFV中去加速和使能NFV,是现在仍然开放的问题。

3、对于公有云VPC的性能隔离,您觉得当前公有云网络性能隔离没有达到很好的性能的原因是什么?
目前所有的云厂商,比如说亚马逊、阿里或者华为云,都有一个共同点,在网络上面的计费仍然是以外部出口的带宽去计费的,它不像计算资源计费的细粒度化和按需化,计算资源计费虽然也没做到quality of service的SLA保证的那种收费,但是相对来说比较细粒度了。但是网络的计费无法做到,比如说你花钱租了一套虚拟的集群,虚拟一堆虚拟机,虚拟机之间都是虚拟的网络,可能是VPC的,但是他无法计费虚拟网络到底耗了多少钱,其中一个原因就是网络和CPU这样的计算资源是很不同的,CPU是用核切分的,但是网络仿佛就是一个共用的管道,所以这种共享的管道里面很难做到很精确的隔离,它就是你影响我,我影响你。包括TCP这种传统的协议,其实也是比较君子的,如果哪一方比较贪婪了,那么就会导致别的被挤占,所以这是现有的网络协议仍然没有办法去根治的问题。VPC我本身也不是行家,但是我感觉可能得找一种新的方式,基于软件上的协议也好,或者硬件上的一些辅助的东西,是不是能够去做到这样的隔离,但是我感觉做到绝对的隔离是比较困难的,可能它那种共享的不太像核,确实是可以不共享。

4、在DPU这样的硬件不断被引入到公有云之后,对网络性能隔离会有怎样的影响?对网络管理会有新的机遇么?

像DPU、NPU这类的XPU有一个共性,就是把一些不擅长CPU去做的网络上的处理和操作尽量地去让专用的硬件去做了,那么 CPU这类的计算资源就可以发挥自身的价值,所以这一块引入到公有云显然是一个空间非常大的、非常好的趋势,它也会对刚才提到的网络性能隔离有很好的帮助,这种东西是天然为它设计的,所以它一定会在硬件上有一些很好的机制保障。就好像虚拟机,其实计算领域的虚拟化为什么比较成熟,也是因为Intel它在硬件上也对虚拟化做了支持,比如说vmware这种虚拟机的,还有一些驱动上或者接口上的支持,所以DPU这样的NPU甚至是**art NIC智能网卡之类的多样化的硬件,会针对网络性能的隔离,也会做硬件的独特设计、定制、优化,使得上面的软件能够更好地做网络性能的隔离。

还有更多问题可以观看回看视频!


NO.3 [资料分享]

√ 扫码:

0个评论