Ovid Discoveryユーザーガイド

関連性ランキング

Created by: [email protected]
July 2, 2024


メインインデックスからの検索結果は、基本検索ボックスの下にリストで表示されます。検索結果のランキングは、デフォルトで関連性ランキングを使用します。Ovid Discoveryの関連度ランキングアルゴリズムは、用語頻度-逆文書頻度モデルに基づいています。

 

以下の要素は、検索結果におけるレコードの関連性のスコアリングと優先順位付けに寄与します。

 

  • 用語の出現頻度:ある用語が文書に出現する頻度です。検索クエリがある場合、用語頻度が高いほど文書スコアが高くなります。

  • 逆文書頻度:ある用語がインデックス内の全文書において稀であればあるほど、スコアへの寄与度は高くなります。

  • 協調係数:文書に含まれるクエリ語の数が多いほど、スコアが高くなります 。

  • フィールドの長さ:フィールドに含まれる単語数が多ければ多いほど、スコアは低くなる。この要素はフィールドの値が長い文書にペナルティを与えます。

  • フィールドの「ブースティング」:特定のフィールドが昇格または減点される。たとえば、発行日をブーストすると、古い文書にペナルティが課せられます。

 

このモデルを使用すると、出版社やプロバイダーに関係なく、最も関連性の高い最新の結果が最優先でユーザーに配信されます。

 

結果のランキングを最新のものから古いものへと出版日順に並べ替えるオプシ ョンも用意されています。


Related Articles