当前位置: 首页 > IT认证 > 软件水平

问题:

[单选题] 搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假设目前有一千万个查询记录(重复度比较高,其实互异的查询串不超过三百万个;显然,一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。现要统计最热门的10个查询串,且要求使用的内存不能超过1GB。以下各方法中,可行且效率最高的方法是(41)

A、将一千万个查询串存入数组并进行快速排序,再统计其中每个查询串重复的次数

B、将一千万个查询串存入数组并进行堆排序,再统计其中每个查询串重复的次数

C、利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用小根堆选出重复次数最多的10个查询串

D、利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用大根堆选出重复次数最多的10个查询串

参考答案:

C、利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用小根堆选出重复次数最多的10个查询串

  参考解析

试题来源参考:

公众号搜题更便捷

    扫码关注题大师公众号

    文字、语音、截图都可搜题

    亿级题库 秒出结果

相关题库