特邀报告

  (排名不分先后,具体时间安排待定)

大会特邀报告1:阻变存储器性能优化方法研究

报告摘要:

阻变存储器RRAM具有单元尺寸小、良好的CMOS工艺兼容性、以及3D集成潜力,被认为是未来大容量非易失存储器的主要技术之一。使用Crossbar构建的RRAM具有极高的存储密度,但是,在Crossbar结构中电压降问题和潜行路径问题会导致写性能下降。针对阻变存储器写性能问题,将介绍我们最新研究进展,包括,通过适当的区域划分以缩小区域内单元间的写延迟差异,通过设计电压偏置方案增大写电压窗口,以及通过新型的对角写入方式将写‘0’和写‘1’过程重叠,达到提高写性能、降低写干扰的目的。另外,针对TLC RRAM的写延迟和写能耗问题更加严重的挑战,我们提出了一种压缩与编码结合,即压缩率感知的数据编码方法,充分利用压缩节省出来的空间来提升TLC RRAM的写性能。

报告人简介:

冯丹,女,教授,博士生导师,长江学者特聘教授,国家杰出青年基金获得者。华中科技大学计算机学院院长,武汉光电国家实验室(筹)信息存储与光显示功能实验室主任,数据存储系统与技术教育部工程研究中心主任。先后担任973项目“面向复杂应用环境的数据存储系统理论与技术基础研究”和“下一代互联网信息存储的组织模式与核心技术研究”首席科学家,863重大项目“海量存储系统关键技术”总体专家组组长,担任教育部“长江学者和创新团队发展计划”“信息存储系统与技术”创新团队学术带头人。从事计算机系统结构、固态存储技术、大规模网络存储系统、云存储、容错理论、磁盘阵列体系结构等方面的研究工作。承担了包括973、863、国家自然科学基金、全国百篇优秀博士论文专项基金、CNGI项目、预研项目等多个项目的研究工作,取得多项成果。在国内外重要学术刊物及学术会议上发表有关学术论文100余篇,著作2部。申报70项国家发明专利,已有50项获得授权。获得10余项软件著作版权。研究成果获省部一等奖3项,国家技术发明二等奖2项,国家自然科学四等奖1项,国际存储竞赛决赛奖1项。

大会特邀报告2:半层次化的语义存储体系结构

报告摘要:

随着各种新型存储器件的不断涌现,传统的多级层次化存储体系架构在管理复杂性、性能差异性和系统可扩展性等方面面临技术挑战,而从多级层次的管理路径转化为部分扁平化的寻址方式为解决相关问题提供了一种可行的解决思路。报告将着重分析基于层次化体系架构的存储系统所面临的技术难题,提出通过半层次化的语义存储体系进行系统优化,并全面介绍相关的层次架构、命名空间和操作方法等。

报告人简介:

华宇,华中科技大学教授,博士生导师,CCF、ACM和IEEE高级会员,CCF和ACM杰出演讲者。研究方向是新型存储器件和网络存储系统。主持和参与国家重点研发计划、973、863重大专项、国家自然科学基金项目和教育部创新团队等,在USENIX ATC、FAST、SC、INFOCOM、SoCC、HPDC、DATE等学术会议和IEEE TC/TPDS/TII,ACM TACO,PIEEE等期刊上发表多篇论文。在ASPLOS (ERC)、USENIX ATC、SOSP (SRC)、INFOCOM、RTSS、ICDCS、IPDPS、DATE、MSST、LCTES等会议上担任程序委员,是国际期刊FCS和JCN的编委,研究成果获得TST期刊年度最佳论文奖,电子学会信息科学技术二等奖。

大会特邀报告3:Design and Implementation of Key-Value Systems Driven by Data Centers’ Workloads

报告摘要:

Data management systems in a data center have been built for high performance, reliability, and scalability. They play important roles in supporting Internet-wide data-centric computing. An important design principle critical to their success is to understand the workloads and make design choices based on the understanding. A one-size-fits-all approach once used in the design of general-purpose and small-scale systems may not work cost-effectively any longer. Examples include Google’s GFS file system, Facebook’s Haystack photo storage, and Baidu’s Atlas cloud storage system. In this talk, the speaker will describe how he and his team follow the principle to build key-value (KV) systems for data-center applications. In collaboration with Facebook, they collected one-week-long KV access traces from its production Memcached system and extensively studied the workload characteristics. The study shows some distinct access patterns that have significant implications on KV systems’ designs. Example patterns include (1) (very) small KV items are widespread; (2) accesses are highly skewed towards a small set of hot keys in a KV cache; and (3) access traffic can be highly dynamic with a variation on the order of two times. Leveraging knowledge on insights of the real-world workloads, he and his team designed and implemented a KV cache (zExpander) and a KV store system (LSM-trie) that are both of high performance and cost-efficient. The talk will detail how the two systems are built with the understanding of its targeted workloads.

报告人简介:

Dr. Song Jiang is currently an associate professor of the CSE department at University of Texas at Arlington. His research interests include system infrastructure for big data processing, such as file and storage systems and data management systems, as well as I/O systems for high-performance computing. He was a recipient of a 2009 US National Science Foundation (NSF) CAREER award and his research activities have been continuously supported by the NSF. He has served on numerous conference program committees and proposal review panels. He has been involved in projects at Facebook and Baidu as a collaborator for providing high-quality Internet-wide services based on big data, resulting in many significant publications at top-tier conferences. Dr. Jiang’s research has generated substantial impact in industry where several of his proposed algorithms for memory and storage management have been officially adopted into mainstream systems, including the Linux kernel, the NetBSD kernel, and the storage engine of MySQL. More information about his research can be found at http://ranger.uta.edu/~sjiang/.

大会特邀报告4:Memory Centric Optimization: Keep the memory hierarchy but nothing else

报告摘要:

Computing has changed from compute-centric to data-centric. Many new architectures, such as GPU, FPGA, ASIC, are introduced to match computer systems with the applications’ data requirement, and therefore, improve the overall performance. In this talk we introduce a series of fundamental results and their associated mechanisms to conduct this matching automatically, and through both hardware and software optimizations. We first present the Concurrent-AMAT (C-AMAT) data access model to unify the impact of data locality, concurrency and overlapping. Then, we introduce the pace matching data-transfer design methodology to optimize memory system performance. Based on the pace matching design, a memory hierarchy is built to mask the performance gap between CPU and memory devices. C-AMAT is used to calculate the data transfer request/supply ratio at each memory layer, and a global control algorithm, named layered performance matching (LPM), is developed to match the data transfer at each memory layer and thus match the overall performance between the CPU and the underlying memory system. The holistic pace-matching optimization is very different from the conventional locality-based system optimization. Analytic results show the pace-matching approach can minimize memory-wall effects. Experimental testing confirms the theoretical findings, with a 150x reduction of memory stall time. We will present the concept of the pace matching data transfer, the design of C-AMAT and LPM, and some experimental case studies. We will also discuss optimization and research issues related to pace matching data transfer and of memory systems in general.

报告人简介:

Dr. Xian-He Sun is a University Distinguished Professor of Computer Science of the Department of Computer Science at the Illinois Institute of Technology (IIT). He is the director of the Scalable Computing Software laboratory at IIT and a guest faculty in the Mathematics and Computer Science Division at the Argonne National Laboratory. Before joining IIT, he worked at DoE Ames National Laboratory, at ICASE, NASA Langley Research Center, at Louisiana State University, Baton Rouge, and was an ASEE fellow at Navy Research Laboratories. Dr. Sun is an IEEE fellow and is known for his memory-bounded speedup model, also called Sun-Ni’s Law, for scalable computing. His research interests include data-intensive high performance computing, memory and I/O systems, software system for big data applications, and performance evaluation and optimization. He has over 250 publications and 5 patents in these areas. He is a former IEEE CS distinguished speaker, a former vice chair of the IEEE Technical Committee on Scalable Computing, the past chair of the Computer Science Department at IIT, and is serving and served on the editorial board of leading professional journals in the field of parallel processing. More information about Dr. Sun can be found at his web site www.cs.iit.edu/~sun/.

大会特邀报告5:Erasure Coding for Data Center Storage

报告摘要:

Data center storage systems increasingly adopt erasure coding to reduce the storage overhead of traditional 3-way replication. However, maintaining high performance in erasure-coded data center storage systems remains challenging. In this talk, I will present new results on how to seamlessly adapt erasure codes appropriately in a data-center architecture.

报告人简介:

Patrick P. C. Lee received the B.Eng. degree (first-class honors) in Information Engineering from the Chinese University of Hong Kong in 2001, the M.Phil. degree in Computer Science and Engineering from the Chinese University of Hong Kong in 2003, and the Ph.D. degree in Computer Science from Columbia University in 2008. He was a postdoctoral researcher at University of Massachusetts, Amherst in 2008-2009. He is now an Associate Professor of the Department of Computer Science and Engineering at the Chinese University of Hong Kong. He currently heads the Applied Distributed Systems Lab and is working very closely with a group of graduate students on different projects in networks and systems. He was a collaborator with Alcatel-Lucent in developing network management solutions for 3G wireless networks in 2007-2011. His research interests are in various applied/systems topics including storage systems, distributed systems and networks, operating systems, dependability, and security.

大会特邀报告6:标签化体系结构:应对计算机系统中的性能不确定性

报告摘要:

由于多应用并发场景的涌现,多核计算机系统中出现严重的性能不确定性现象,这已成为云计算、航空航天等领域亟需解决的一个难题。例如云计算为数亿用户服务已成为主流模式,但由于性能不确定,导致当前云计算数据中心只能以牺牲资源利用率(CPU利用率小于30%甚至更低)来保障用户体验(响应时间)。报告人将介绍首先分析当前计算机中性能不确定性的主要来源,认为体系结构层次弱化控制是根本原因。报告将介绍标签化冯诺依曼体系结构(Labeled von Neumann Architecture),使用“标签 + 控制”提供体系结构的细粒度控制能力,降低计算机系统内的竞争干扰。最后报告将介绍基于RISC-V开源指令集的FPGA原型系统(Labeled RISC-V),演示基于标签化体系结构实现的硬件分区、Cache容量划分、访存带宽动态分配等功能。

报告人简介:

包云岗,2003年本科毕业于南京大学,2008年获中科院计算所博士学位,2010-2012年普林斯顿大学博士后。现为中科院计算所研究员,博士生导师,先进计算机系统研究中心常务副主任,华为-计算所联合实验室技术委员会主任。研究方向主要是计算机系统结构,在ASPLOS、HPCA、ISCA、SIGMETRICS等国际会议期刊发表了30余篇论文,多次担任ASPLOS、SC等国际顶级会议程序委员会委员。发布的多核基准程序集PARSEC 3.0下载已逾10000次,被国际体系结构界广泛采用;研究成果已在华为、Intel等企业应用,入选华为全球合作五个代表性成果写入华为2015年报。获首届2013年“CCF-Intel青年学者”奖,入选2016年度中国计算机大会(CNCC)特邀主旨讲者。担任中国计算机学会理事、普及工委主任,中科院青年创新促进会理事。

青年学者论坛报告

  (排名不分先后,具体时间安排待定)

青年论坛报告1:Octopus: an RDMA-enabled Distributed Persistent Memory File System

报告摘要:

Non-volatile memory (NVM) and remote direct memory access (RDMA) provide extremely high performance in storage and network hardware. However, existing distributed file systems strictly isolate file system and network layers, and the heavy layered software designs leave high-speed hardware under-exploited. In this paper, we propose an RDMA-enabled distributed persistent memory file system, Octopus, to redesign file system internal mechanisms by closely coupling NVM and RDMA features. For data operations, Octopus directly accesses a shared persistent memory pool to reduce memory copying overhead, and actively fetches and pushes data all in clients to re-balance the load between the server and network. For metadata operations, Octopus introduces self-identified RPC for immediate notification between file systems and networking, and an efficient distributed transaction mechanism for consistency. Evaluations show that Octopus achieves nearly the raw bandwidth for large I/Os and orders of magnitude better performance than existing distributed file systems.

报告人简介:

陆游游,博士,清华大学计算机系博士后/助理研究员。2015年于清华大学获工学博士学位,其间于2013年赴卡内基梅隆大学进行访学研究。主要研究方向是文件系统及非易失性存储等,承担国家自然科学基金青年项目、中国博士后基金一等资助项目及特别资助项目、以及中兴、日本三菱等国内外公司课题。在FAST、USENIX ATC、EuroSys、SC等国际顶级会议以及ACM ToS、IEEE TC、TPDS等国际顶级期刊上发表论文十余篇。其中,以第一作者在FAST 2013和FAST 2014上连续发表论文,并获得IEEE NVMSA 2014大会唯一最佳论文奖和MSST 2015最佳论文提名奖。受邀担任FAST、MSST等国际会议及ACM ToS、IEEE TC、TPDS、IEEE Computer等国际期刊杂志审稿人。2015年入选首届中国科协青年人才托举工程,2016年获得中国计算机学会优秀博士学位论文奖,2017年获得清华大学优秀博士后。

青年论坛报告2:基于溯源存储的网络安全研究

报告摘要:

如今,全世界每天都在爆炸性的产生各种新的信息量。对于存储系统的容量需求,也从 PB、EB 到如今能容纳“Big Data”的海量存储系统在发展。尽管有各种新的存储器件在不断产生,新的存储体系架构也在不断提出,但对于海量数据本身的分析和理解却停滞不前。比如,当我们在云端获取某些重要数据时,我们可能会问,这些数据从哪里来,之前有人用过么,可靠性和安全性如何? 溯源(Provenance),作为一种包含了数据对象历史信息的元数据,正好可以用来解答这样的问题。比如,一个数据对象是如何被创建的,经过了哪些修改,两个数据对象的祖先有什么不同。在系统领域,一个数据的溯源是所有影响这个数据最终状态的进程信息和相关数据。正因为溯源揭示了数据对象的过去或产生过程,使得溯源具有了更广泛的使用价值。现在,溯源己经被科学家用来验证重要的实验数据集,提高桌面搜索的效率,审计重要的财务账目等,还有一些研究正在将它用于重复性数据删除,分布式安全等领域。本报告探讨了溯源在入侵检测、取证分析及数据重建等网络安全领域研究进展,以及如何优化溯源存储来提高网络安全应用性能。

报告人简介:

谢雨来,博士、华中科技大学计算机学院讲师,2013年12月毕业于华中科技大学计算机系统结构专业,获工学博士学位。2014年至2015年武汉光电国家实验室做博士后研究。曾在2010年至2011年国家公派至美国加州大学圣克鲁兹分校存储系统研究中心进行博士联合培养,2015年赴香港中文大学作学术访问研究。主要研究方向为溯源存储系统、入侵检测、分布式系统、大数据和云存储等。目前在ToS、ToM、MSST、CIKM等知名期刊和会议上发表论文十余篇。获得2016 CCF-启明星辰鸿雁计划资助,主持国家自然科学基金青年基金、博士后面上项目、武汉市科技局应用基础研究计划等,并作为骨干参与多项国家973、863、国家自然科学基金重点基金、国防预研项目等。向国际存储标准组织提出国际存储标准建议一项,起草20万字的国内信息存储技术标准一项。担任 ToS、FGCS、JCN、MSST 等国际知名期刊及会议的审稿人。现为IEEE会员、ACM会员、中国计算机学会会员,中国计算机学会信息存储专业委员会委员。

青年论坛报告3:HiKV: 面向DRAM-NVM混合内存的键值存储系统

报告摘要:

DRAM和NVM组成的混合内存可以在内存总线上快速持久化数据,可以用于存储系统的底层存储介质。持久化键值存储系统在互联网应用、大数据应用、文件系统和数据库领域都有广泛应用,但是现有的持久化键值存储系统针对HDD或SSD进行设计,简单地将其移植到混合内存上无法充分利用混合内存特性。该报告将介绍基于混合内存并针对键值存储系统需求设计的HybridIndex,以及基于HybridIndex构建的键值存储系统HiKV。与现有基于NVM的键值存储系统相比,HiKV最高可以降低延迟86.6%,多线程运行时最高可以提升OPS 6.4倍。

报告人简介:

蒋德钧,博士,中科院计算所副研究员,主要研究兴趣包括存储系统,操作系统,分布式系统,存储体系结构等。在ATC,PACT,ICS,WWW,TACO等国际会议/期刊上发表论文十余篇,累计引用次数百余次。承担或参与科技部重点研发计划项目,国家自然科学基金项目,人社部留学人员科技活动优秀项目、973、863项目子课题。在北京航空航天大学获得学士学位,在清华大学获得硕士学位,在荷兰Vrije Universiteit获得计算机科学博士学位。蒋德钧博士是CCF,IEEE和ACM会员。

青年论坛报告4:基于纠删码的高可靠存储阵列性能优化

报告摘要:

在当前云计算和大数据的时代,用户对数据的性能和可靠性都有着很高的要求。传统的副本虽然能够大幅提高系统的性能和可靠性,但其存储成本太高。为了兼顾成本和性能,高可靠存储阵列已广泛运用云存储和大数据存储系统中,其核心技术为纠删码。在本报告主要总结近几年高可靠存储阵列的研究现状,针对基于异或的多盘容错存储阵列,从纠删码设计、阵列扩展、缓存与I/O调度等几个方面分别介绍课题组最新的研究工作。

报告人简介:

吴晨涛,上海交通大学副研究员、博士生导师,2012年博士毕业于美国弗吉尼亚联邦(州立)大学,2010年博士毕业于华中科技大学,分别师从何绪斌和谢长生教授。研究方向主要为高可靠存储系统。发表国际知名会议和期刊论文30余篇,其中包括TPDS、JCST、DSN、IPDPS、SRDS、ICPP等,主持和参与多项国家973、863、自然科学基金、美国自然科学基金(NSF)项目。现为中国计算机学会体系结构、信息存储专委会委员,中国计算机学会中小学教育专委会常委,上海市计算机学会存储专委会副主任,上海市计算机学会体系结构专委会委员。

青年论坛报告5:大数据驱动的应用感知重复数据删除技术研究

报告摘要:

随着大数据时代的到来,数据中心需要存储和管理的数据量呈爆炸式增长,数据构成也越来越复杂。研究发现,不论是在备份、归档存储层,还是在常规的主存储层,日趋复杂的海量数据集中都有大量的重复数据。为了抑制这些海量复杂数据的过快增长,重复数据删除技术能够提升数据中心的IT资源利用率,降低存储系统能耗以及管理成本;但在优化大数据存储管理时,传统的重复数据删除技术在有效平衡数据缩减率和系统扩展能力方面存在严峻挑战。应用感知重复数据删除技术主要基于应用与存储协同重删设计的思想,同时开发数据相似性和局部性来进行应用感知的重复数据删除处理,能够在具备紧耦合、高开销分布重删机制的高数据缩减率的同时,获得接近松耦合、低开销分布重删机制的高可扩展能力。

报告人简介:

付印金,博士,现为陆军工程大学(原解放军理工大学)网络技术重点实验室,讲师。2006年本科毕业于南京大学数学系后被保送到国防科学技术大学计算机学院攻读研究生,分别于2008年和2013年获计算机科学与技术专业硕士和博士学位。读博期间,公派赴美国内布拉斯加大学林肯分校进行联合培养两年。研究方向为网络存储、云计算和大数据管理。先后承担国家自然科学基金项目1项,主要参与国家自然科学基金、国家“863”、国防预研、美国NSF等项目近10项。先后在ACM ToS、IEEE TPDS、TCC、COMMUN LETT、JCST、Middleware、MSST、Cluster、ICA3PP、《计算机研究与发展》等国内外重要期刊和会议上发表学术论文30余篇,申请国家发明专利6项,授权3项。现担任CCF第十一届会员代表、CCF信息存储技术专委委员、CCF计算机应用专委委员、南京YOCSEF委员、CCF高级会员、IEEE和ACM会员,也担任IEEE TPDS、TCC、MSST、IEEE Access、Wireless Networks、JCST、《计算机学报》等国内外重要期刊和会议的审稿人以及多个学术会议的程序委员会委员。

青年论坛报告6:并行IO系统性能优化

报告摘要:

并行I/O系统是解决数据密集型应用性能瓶颈的一种方案,在高性能计算领域得到广泛的应用。然而,在大数据环境下,并行I/O系统面临 “异构存储设备”和“复杂I/O访问模式”等挑战,使得传统I/O体系结构和数据管理方法不再有效。为解决这个这个问题,报告人对并行I/O系统的相关理论和方法展开了深入研究。本报告介绍报告人在并行I/O系统性能优化方面的一些研究工作。

报告人简介:

何水兵, 男,博士,武汉大学计算机学院,副教授。2009年12月于华中科技大学获计算机系统结构方向博士学位。2010年2月进入武汉大学计算机学院任教。2011年12月至2015年2月在美国伊利诺伊理工学院从事博士后研究。目前主要从事文件和存储系统、操作系统、并行和分布式计算、大数据处理等方面研究工作。 现为中国计算机学会会员,中国计算机学会信息存储技术专业委员会委员。在国际期刊和会议上发表论文40多篇,包括IEEE TPDS、IEEE TC、ACM TAAS、ACM TECS、IEEE ICDCS、IEEE IPDPS、IEEE ICPP、IEEE CLUSTER、IEEE ICPADS、IEEE HiPC等,获SPEED'08 workshop最佳论文。已申请了4项发明专利。 担任国际期刊IEEE TPDS、IEEE TC、IEEE TMC、JPDC、PARCO、PPL、JCN、SoCo等审稿人,担任国际会议DAAC2017、NVMSA2017、IPDPS2016、AINA2016、NVMSA2016、PDSW-DISCS2016、NAS2015、NVMSA2015、DISCS2015、IPCCC2014等程序委员会委员或者审稿人。 主持国家自然科学基金面上项目、湖北省自然科学基金面上项目、北京大学开放基金项目、国防科技大学开放基金项目、武汉大学自主科研项目等。参与多项973、863、中国自然科学基金和美国自然科学基金项目。

优秀论文交流论坛

  

论坛报告1:SmartCuckoo: A Fast and Cost-Efficient Hashing Index Scheme for Cloud Storage Systems点此下载论文

报告摘要:

Fast query services are important to improve overall performance of large-scale storage systems when handling a large number of files. Open-addressing cuckoo hash schemes have been widely used to support query services due to the salient features of simplicity and ease of use. Conventional schemes are unfortunately inadequate to address the potential problem of having endless loops during item insertion, which degrades the query performance. To address the problem, we propose a cost-efficient cuckoo hashing scheme, named SmartCuckoo. The idea behind SmartCuckoo is to represent the hashing relationship as a directed pseudoforest and use it to track item placements for accurately predetermining the occurrence of endless loop. SmartCuckoo can efficiently predetermine insertion failures without paying a high cost of carrying out step-by-step probing. We have implemented SmartCuckoo in a large-scale cloud storage system. Extensive evaluations using three real-world traces and the YCSB benchmark demonstrate the efficiency and efficacy of SmartCuckoo.

报告人简介:

孙园园,2014年本科毕业于华中科技大学,华中科技大学武汉光电国家实验室14级博士生。研究方向包括存储系统中查询优化,语义哈希和元数据管理。目前在USENIX ATC、ACM SoCC、MSST、ICDCS、IWQoS等国际会议以及TPDS等国际期刊上发表多篇论文。现为CCF学生会员,ACM学生会员。








论坛报告2:A Write-friendly Hashing Scheme for Non-volatile Memory Systems点此下载论文

报告摘要:

Non-volatile memory technologies (NVMs) have been considered as promising candidates for replacing DRAM and SRAM, due to their advantages of high density, high scalability, and requiring near-zero standby power, while suffering from the limited endurance and asymmetric properties of reads and writes. The significant changes of low-level memory devices cause nontrivial challenges to high-level in-memory and in-cache data structure design due to overlooking the NVM device properties. In this paper, we study an important and common data structure, hash table, which is ubiquitous and widely used to construct the index and lookup table in main memory and caches. Based on the observations that existing hashing schemes cause many extra writes to NVMs, we propose a cost-efficient write-friendly hashing scheme, called path hashing, which incurs no extra writes to NVMs while delivers high performance. The basic idea of path hashing is to leverage a novel hash-collision resolution method, i.e., position sharing, which meets the needs of insertion and deletion requests without extra writes to NVMs. By further exploiting double-path hashing and path shortening techniques, path hashing delivers high performance of hash tables in terms of space utilization and request latency. We have implemented path hashing and used a gem5 full system simulator with NVMain to evaluate its performance in the context of NVMs. Extensive experimental results demonstrate that path hashing incurs no extra writes to NVMs, and achieves up to $95\%$ space utilization ratio as well as low request latency, compared with existing state-of-the-art hashing schemes.

报告人简介:

左鹏飞,2014年本科毕业于华中科技大学,现为华中科技大学博士生。主要研究方向为非易失内存、数据重删和键值存储技术。在USENIX ATC、MSST、ICDCS、SoCC、TPDS等学术会议和期刊上发表多篇论文。








论坛报告3:Soft Updates Made Simple and Fast on Non-volatile Memory点此下载论文

报告摘要:

快速、可字节寻址的非易失性内存(NVM)为文件系统提供了接近缓存的延迟以及接近内存总线的带宽。然而由于无法控制缓存行的刷除,现有的非易失性内存文件系统需要使用同步缓存行刷除指令来保证文件系统的一致性。这增大的文件系统操作的延迟。 在本文中,我们在NVM上回顾soft updates技术。Soft updates技术通过依赖跟踪和推迟写操作来消除操作系统中元数据的同步更新。一方面,NVM的可字节寻址特性,可以符合soft updates中依赖追踪的细粒度需求,从而简化文件系统中的依赖关系以及依赖的跟踪和满足。另一方面,soft updates的正确性依赖于磁盘的块写入的原子性,然而NVM只提供了缓存行的原子性写入。为了在没有页缓存(page cache)以及不使用同步缓存行刷除的情况下,保证正确性和一致性,我们提出基于指针的双视图(dual views)。双视图由一个最新视图和一个一致视图组成,使得元数据的持久化可以被推迟,同时也消除了宕机后的文件系统恢复。基于以上方法,我们实现了文件系统SoupFS。SoupFS通过推迟关键路径中几乎所有的同步缓存行刷除,大大减少了操作的延迟。我们在Linux上实现了SoupFS并与最新的NVM文件系统进行比较。数据结果表明,与现有系统相比,SoupFS可以极大的减少文件系统的延迟,提高文件系统性能。

报告人简介:

董明凯,博士三年级,上海交通大学并行与分布式系统研究所。在陈海波教授的指导下,主要研究方向为操作系统、非易失性内存和文件系统。










论坛报告4:Log-Structured Non-Volatile Main Memory点此下载论文

报告摘要:

新型非易失内存不仅提供了接近传统内存的访问性能,而且还提供了持久性保证和字节寻址的特性。如何充分利用非易失内存远优于传统持久性存储的访问性能,并且保证非易失内存上的数据的一致性,成了目前学术界的热点研究问题。为了解决上述问题,研究人员往往利用轻量级的持久性事务内存系统,因为它不仅提供了系统崩溃时的数据恢复功能,而且消除了大部分传统数据持久化路径上的软件延迟。然而,现有的持久性事务内存系统所利用的内存管理策略,往往带来大量的内存碎片,严重降低了内存利用率。此外,现有的持久性事务内存系统依赖redo/undo的策略保证数据的一致性,导致数据的两次写操作,严重增加了带宽的消耗和内存的磨损。 本文提出了一个日志结构的非易失内存系统。对于所有的内存分配和更新操作,它将新数据添加到日志的结尾,而不去修改原有的数据,从而避免了数据的两次写操作,并且在系统崩溃时可以恢复到一致性的状态。对于所有的旧数据,它利用后台线程进行数据的迁移和整理,从而回收空闲的数据区域,并解决了传统内存管理方法遗留的碎片问题。此外,由于最新更新的数据不一定在原来的数据位置,针对这个问题,本文设计了一个高性能的支持任意粒度的索引结构。

报告人简介:

胡庆达,清华大学计算机系高性能所博士生。导师:舒继武教授。研究方向:内存及文件系统,内存体系结构优化,GPU及多核编程。研究工作发表在ATC, ICPP, DSN, IPDPS, GLSVLSI, APSYS等会议和TC等期刊上










论坛报告5: LocoFS: A Loosely-Coupled Metadata Service for Distributed File Systems点此下载论文

报告摘要:

键值存储已经被广泛的用于存储分布式文件系统的元数据,但是文件系统目录树的组织结构本身并不适合键值存储,从而限制了键值存储性能的发挥。为了解决这个问题,我们提出了一种松耦合的分布式文件系统元数据存储服务——LocoFS。LocoFS通过解耦和文件系统的元数据从而降低其中的依赖关系。其主要有两种技术,首先是通过将目录内容解耦和,使其成为一个不依赖于树形结构,同时建立对目录条目的反向索引。其次,将文件的元数据进行解耦和,进一步提高键值访问的性能。实验结果显示,LocoFS在八个节点下,元数据吞吐量相对于最新的IndexFS提高了5倍,能够达到93%单节点键值存储的吞吐量。

报告人简介:

李思阳,清华大学客座博士研究生和解放军信息工程大学博士研究生。研究方向为分布式文件系统。在国防科学技术大学取得学士学位和硕士学位。











论坛报告6:Time and Space-efficient Write Parallelism in PCM by Exploiting Data Patterns点此下载论文

报告摘要:

相对DRAM,PCM具有非易失性、读能耗低、无需刷新等诸多优势,但是其较差的耐久性与较高的写延迟极大地限制了PCM在主存系统中的应用,因此提升PCM性能、特别是写性能是PCM研究中的一个关键问题。PCM的写入需要较大的瞬时电流,由于电源线的噪声会限制电荷泵为PCM 存储单元持续提供大的瞬时电流,因此一个PCM 芯片可以并行写入的位数是受限制的,通常称并行写入大小为一个PCM写单元的大小。当把PCM作为主存时,写单元的存在限制了同时可以并行写入PCM存储体中的数据量,由于最后一级缓存同主存数据交换大小为一个缓存行的大小,远大于芯片写单元大小,因此通常需要若干个写单元来完成一个缓存行的写入。值得注意的是,由于这些写单元几乎都是串行执行的,因此极大的限制了系统性能并且提升了系统能耗。针对这个问题,本章提出了一种基于写入数据类型的PCM写性能优化技术Min-WU。通过对多线程应用负载的分析,发现多线程应用的内存访问呈现明显的访问局部性,即一小部分的数据类型占据了大量的数据访问。Min-WU的主要设计思想是减少写单元的数量来提升性能。Min-WU的核心设计包括两大部分:首先,根据写入的数据类型进行数据压缩来减少整体数据量。其次,Min-WU尝试把更多的数据放入一个写单元中来减少其数目从而提升性能。多线程PARSEC 2.0测试集的实验评估表明,与常规PCM写方案相比,Min-WU减少了44%的读延迟,28%的写延迟,32.5%的程序执行时间减少和48%的能耗减少以及32%的IPC提升。实验评估表明Min-WU具有极小的时间开销和小于3%的存储空间开销。

报告人简介:

李铮,华中科技大学武汉光电国家实验室博士生在读,导师王芳教授。2013年毕业于华中科技大学获得学士学位并保送至武汉光电国家实验 室攻读博士学位。目前的研究方向是计算机系统结构,包括固态存储系统以及非易失存储技术等,其中针对相变存储器(Phase Change Memory, PCM)性能优化的工作发表在DATE 2016, ICPP 2016, IEEE TC, ACM TACO等一系列国际高水平会议以及期刊上。同时作为骨干参与实验室973课题、863课题等多个国家级科研项目。2016年获得国家奖学金,2013-2014, 2015-2016获得华中科技大学三好研究生称号。