We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
現行では、Solr検索インデックスの文字列処理には特に手を加えておらず、個別の異体字のあいまい検索などは追加設定をマニュアルに記載している: https://next-l.github.io/manual/1.3/enju_install_vm_6.html
しかし、多言語における異体字処理の一部は、Unicode正規化 (Unicode normalization) として標準化されており、これらの処理を標準的に行うように考えておくとよいと思う。
また、NACSIS-CATなどでの目録での文字の正規化処理も公開されており、これらも参考にするとよい: https://catdoc.nii.ac.jp/MAN2/catmanual/cat_normalization.html
The text was updated successfully, but these errors were encountered:
関連: #1111 統合漢字インデックスの取り込み
Sorry, something went wrong.
参考: https://solr.apache.org/guide/6_6/charfilterfactories.html#CharFilterFactories-solr.ICUNormalizer2CharFilterFactory ICU4Jを使ったUnicode正規化の設定
No branches or pull requests
現行では、Solr検索インデックスの文字列処理には特に手を加えておらず、個別の異体字のあいまい検索などは追加設定をマニュアルに記載している: https://next-l.github.io/manual/1.3/enju_install_vm_6.html
しかし、多言語における異体字処理の一部は、Unicode正規化 (Unicode normalization) として標準化されており、これらの処理を標準的に行うように考えておくとよいと思う。
また、NACSIS-CATなどでの目録での文字の正規化処理も公開されており、これらも参考にするとよい:
https://catdoc.nii.ac.jp/MAN2/catmanual/cat_normalization.html
The text was updated successfully, but these errors were encountered: