研究人员对数据流处理的研究不断深入,我们认为出现了以下新的动向:
未来略图
引入更多多的的统计
计技技术来构造略图
G. Cormode等主要处理对频繁项的计算。它以前人的主项(majority item )算法([116, 117])为基础,使用了error-correcting codes来处理问题。如数据的每一位设立一个计数器,再根据这些计数器的计数结果来推断频繁项集合。
Y. Tao等[118]实质上是对Probabilistic counting (已经广泛地用于数据库领域的distinct counting)在数据流处理的一种应用。
扩展略图
对略图进行扩展,以处理更更复复杂的查询询需需求
Lin等在文献[93]中构造了一个复杂的略图体系,可用于滑动窗口模型(sliding window model )和n-of-N模型的分位数估计,这是简单略图难以做到的。
在滑动窗口模型下,文献[93]将数据按时间顺序分为多个桶,在每个桶中建立略图(精度比要求的高),然后查询时再将这些略图合并(merge),其中对最后一个桶可能需要进行提升(lift )操作。维护时只删除过期的桶,增加新的桶。
在n-of-N model中,文献[93]将数据按EH Partitioning技术分为多个大小不同的桶,在每个桶中建立略图(精度比要求的高),然后查询时再将其中一部分略图合并,可以保证要求的精度,其中对最后一个同可能需要进行提升。
结合时空数据
与时空数据处理的进一步结合:
J. Sun等在文献[120]中虽然主要针对时空数据的历史查询和预测处理。然而,文章却强调时空数据是以数据流的形式出现的,处理中也更着重于时空数据的更新性能。
Y. Tao等[118]使用数据流的方法处理时空数据,通过对动态的时空数据构造略图,用于分辨物体是否在多个区域间运动或静止的状态,并估算其数量。而这种问题在原先的时空处理中是很难解决的。
湖北汇智桥数据信息服务有限公司专注于项目股权价值报告,项目数据分析,股权投资价值分析及风险评定报告等