用于创建自己的令牌和字符过滤器的Solr文档说明如下 .
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#Specifying_an_Analyzer_in_the_schema
如果你想使用自定义CharFilters,Tokenizers或TokenFilters,你需要编写一个非常简单的工厂,它将BaseTokenizerFactory或BaseTokenFilterFactory子类化,就像这样......
public class MyCustomFilterFactory extends BaseTokenFilterFactory {
public TokenStream create(TokenStream input) {
return new MyCustomFilter(input);
}
}
我在Solr 4的源代码中找不到BaseTokenFilterFactory .
这是Solr 3.6.1中的org.apache.solr.analysis包
这是Solr 4.0.0的相同包
文档似乎适用于Solr 3.6,但我需要知道如何使用4.0创建自定义过滤器 .
1 回答
使用solr 4.0,
BaseTokenFilterFactory
现在是org.apache.lucene.analysis.util.TokenFilterFactory
,因此您可以检查this .