重庆师范大学 计算机与信息科学学院,重庆 401331;南京理工大学 计算机技术与工程学院,南京 210094
【目的】在大数据环境下,寻找最佳的输入数据分片数量,以便改进统计算法的运行效率。【方法】以车牌统计为例,调整相关多个参数以改变算法中输入数据的分片数量,并分析不同参数下算法运行时间的差异。【结果】最佳的分片数量下的运行效率近似于最差的分片数量下运行效率的2倍。【结论】大数据处理中,合理的输入数据的分片数量有助于提高算法的运行效率。同时也分析了分片数量与算法运行时间的函数关系,以期找到最佳的分片数量区间。
汤星,范永胜,冯骥,钟贞,孔亚迪.大数据环境下的车牌统计算法的数据分片研究[J].重庆师范大学学报自然科学版,2019,(6):98-