在Lucene中存储结构化数据-Java 学习之路

我看过许多引用指向使用Lucene或Solr作为NoSQL数据存储，而不仅仅是索引引擎：NoSQL (MongoDB) vs Lucene (or Solr) as your database http://searchhub.org/2010/04/29/for-the-guardian-solr-is-the-new-database/

但是，由于Lucene只提供“平面”文档结构，其中每个字段可以是多值（标量），我似乎无法完全理解人们如何将复杂的结构化数据映射到Lucene中以用于索引和存储 . 例如：

{
"firstName": "Joe",
"lastName": "Smith",
"addresses" ： [
    {
        "type" : "home", 
        "line1" : "1 Main Street",
        "city" : "New York",
    },
    {
        "type" : "office",
        "line1" : "P.O. Box 1234",
        "zip：“10000”
    }
]
}

事情显然会变得更加复杂 . 即如果对象有两个集合：地址和电话号码怎么办？如果地址本身有一个集合怎么办？

我可以想出两种方法来映射这两个lucene“文档”：

创建存储但未编入索引的字段以存储对象的JSON / BSON版本，然后创建其他索引但不存储用于索引/搜索的字段 .
找到一种智能方法，以某种方式使对象适合Lucene存储数据的方式 . 即使用点表示法来平整字段，使用多值字段存储单个集合值，然后以某种方式在返回的路上重新创建对象...

我想知道人们之前是否处理过类似的问题，你使用了什么解决方案？

2 回答

0

看一下我的Stupid Lucene Tricks: Hierarchies一种方法 .

回复于 2024-04-23T17:47:52+08:00
0
这取决于用途 . 如果只需要它们进行显示，可以将复数值（地址）作为JSON字符串并将其存储为多个值字段，如果需要将它们用作索引，可以选择以下结构：
```
"addresses_type"： [
    "home",
    "office"
    ],
    "addresses_line1"： [
    "1 Main Street",
    "P.O. Box 1234"
    ],
    "addresses_city"： [
    "New York",
    ""
    ],
    "addresses_zip"： [
    "",
    "10000"
    ]
```
回复于 2024-04-23T17:47:52+08:00

在Lucene中存储结构化数据

2 回答

相关问题