海量数据处理之BloomFilter 一提到元素查找,我们会很自然的想到HashMap。通过将哈希函数作用于key上,我们得到了哈希值,基于哈希值我们可以去表里的相应位置获取对应的数据。除了存在哈希冲突问题之外,HashMap一个很大的问题就是空间效率低。引入Bloom Filter则可以很好的解决空间效率的问题。 掌握本文内容前,建议先熟练掌握前面一篇文章 原理
Redis热点Key发现及常见解决方案 健身之乐,其乐无穷。终于一小时体能训练,加十公里了。 热点Key问题产生的原因大致有以下两种: 1、用户消费的数据远大于生产的数据(热卖商品、热点新闻、热点评论、明星直播)。 在日常工作生活中一些突发的的事件,
为什么程序员对旧代码深恶痛绝? 最近有人问我,为什么软件开发者非常痛恨维护别人的代码?我思考了很久怎样回答这个问题,最后决定做一个简单的比喻。 有人请求你在一个岛上建一座实验室,而这是一个其他工程师遗留下来的烂尾工程。你去看了看工地,发现除了烂尾楼之外,还有许多意外的东西: * 一个巨大的风扇(有楼那么大); * 大号的热气球;
用户画像:使用Antlr构建用户筛选的DSL 随着业务的发展,我们会积攒越来越多的用户,为了能够对用户更精准的进行营销,挖掘,或者统计,我们会对用户进行打标,打标可以包含诸多维度,例如: * 基础信息:包括年龄段,性别等 * 订单信息: