回复 第5楼 的 roqeho0423:
我认为没有说过换成关系型数据库,也没有说换成hadoop家族。
我以为或者能写个树形结构解决这个查询的需求。或者写一改进型 bloom-filter 算法能够解决这种查询。
具体还要看你这个数据是连续增加量还是批量增加,是否需要实时查询,是否需要精确0误差,即查询不能容忍错误,计算资源是否有限制、开发工作是否有时限等等。
=============================================================
说错梗了,这个问题适用倒排索引,(反向索引) Inverse Index.[s:12]
前提是: ●不在乎牺牲存储空间。
或者,●经常变动查询的fields={"A1":1,"A2":1}, 下次可能是 A3,A4,A9,A100
或者● fields 中比较稀疏
符合以上三者任何其一就可以建立倒排索引完成快速的查询。
如果fields数量有限,也可以把这些数据导入到SQL的库里,一样能解决。