公開日 2022年08月09日
サーバーについて
Joruri Searchは、下記のサーバー構成で稼働しています。
- クローラーサーバ―
WebサイトのHTMLファイル、添付ファイル、画像ファイルをクローリングします。
クロールしたファイルはサーバ―内に保存されます。 - インデキシングサーバ―
インデキシング(検索インデックスの作成・更新・削除処理)や機械学習処理(関連キーワード、類似記事)といったバッチ処理を実行します。 - 検索サーバ―
全文検索を実行し、検索結果を返します。
インデキシングなどのバッチ処理が検索処理に影響を与えないように、検索サーバ―とインデキシングサーバ―に分離しています。
検索結果が表示されるまでの流れ
- Webサイトをクローリングします。
- クローリングされたHTMLファイル、添付ファイル、画像ファイルを用いて、インデキシングや機械学習処理を実行します。
- 検索インデックス、DBレコード、サムネイルを検索サーバ―と同期(レプリケーション)します。
- 検索結果を表示するページにJavaScriptのコードを埋め込みます。
利用者が検索結果を表示するページをブラウザでアクセスすると、検索サーバ―が検索結果を返します。 - サイト管理者様が管理画面へアクセスして、検索ログなどを確認いただけます。