我们的一个核心系统中,所有文档的元数据和部分非结构化内容都存储在 HBase 集群里。数据量已经达到百亿行级别,HBase 的横向扩展能力和对稀疏数据的支持一直表现良好。最近,业务方提出了一个新需求:实现基于文档内容的语义相似度搜索,而不仅
2023-10-27