文件格式和压缩算法,一听就是无聊的东西,不是吗?那“瞬间将高清卫星地图发送到你的桌面”听起来是不是就酷多了?
美国航空航天局(NASA)和知名地理信息系统(GIS)技术与服务提供商Esri就结合他们在前者方面的技术专长,共同实现了后者的应用图景。更赞的是,他们已经将这项新技术免费贡献给全社会。2015年12月下旬,NASA和Esri这各自领域的两大巨头宣布,他们已经联合开发出一种新的栅格数据格式,采用独特的压缩格式以实现海量任务关系型影像数据批量处理,并将与公众共享。
据Esri影像产品经理彼得﹒贝克尔介绍,这项研发成果所带来的直接好处是影像可以快速地在云端传输“与JPEG2000这样的格式相比,速度大概能快10到15倍。”
这一格式叫做MRF(Meta Raster Format的缩写,元栅格格式),它最初是在NASA内部开发出来的。
在存储区域网络和网络附加存储不能很好地扩展的现实情况下,贝克尔指出,“我们一直十分关注如何快速访问海量的影像数据,特别是在云存储的环境下。我们意识到,我们必须充分利用云存储的弹性和可用性,但是我们不能将我们的服务器直接连接到云存储上,因为这些服务器需要文件共享。因此,我们一直在试图解决这一难题。”
贝克尔谈到,幸运的是,一位曾在NASA主要研究MRF的程序员最近加盟了Esri,他建议,MRF的架构可能正是Esri团队正在寻找的解决之道。
“当我们进行越来越多的研究时发现, MRF的工作原理其实很简单。”据贝克尔介绍,MRF的独特之处在于它可将文件转化成可单独缓存的三部分,使得它特别适合于云存储。“由于这些文件被拆分开来,我们就可以将这些元数据文件下载并存储在本地。”用户可以在文件内容中对数据进行检查,并只在需要时下载其中的核心数据。“我们将服务器端和存储端之间的请求降到了最低。”
此前,贝克尔所在团队面临的另一个挑战是找出一个适当的对关键地理位置数据进行压缩的策略。虽然大多数影像的“有损”压缩算法所得出的数据人眼难以分辨出其中瑕疵,然而用这种“有损”压缩所标记的高程数据却是有问题的。“有损压缩的最大问题是你并不知道你最终结果的准确性。如果你在山区飞行,而你的高程数据却偏离了20米,这是相当严重的。”
解决这一难题的答案是Esri所研发的LERC——有限错误栅格压缩。LERC可以让分析师对压缩文件定义一个偏差值。例如,人们可以通过LERC来压缩高程文件,同时保证精确度在10厘米之内。
更令人欣喜的是,贝克尔所在团队发现,已在去年申请了专利的LERC,不仅可以很好地处理高程文件,而且在压缩高位深的卫星影像方面也表现卓越。
在MRF文件格式中使用LERC压缩法,用户不仅可以获得更快的性能支持,而且存储要求也大幅降低。贝克尔估计,使用这项技术,再结合云存储,成本大概会是传统的基于文件的存储方式的三分之一。“这对于需要处理海量影像数据的组织机构来说,将会非常显著地降低成本。”
除了向公众发布这项技术,Esri还在努力开发更好的应用程序编程接口来对这项技术继续进行改进。贝克尔的团队也正在考虑在MRF格式中融入更多的新特性,包括影像的版本控制和时间跟踪标记等。
关键词: