概要
Ver.3との比較
QZS Full-text Search Engine Ver.4は、
Ver.3までのすべての機能に加え、以下の新機能が搭載されています。
「タギング分析」機能 |
Ver.4で追加された「タギング分析」機能では、類似検索や自動分類、重要キーワード抽出が実現できます。
タギングとは写真や動画、その他のデータなどを検索する際に、内容や特徴を表すキーワードを入力、
または文章からの抽出により属性付与することをいいます。
QZSは、こうして得られたデータ×タギング・キーワードのマトリクスを分析することで、
類似のキーワードを持ったデータ検索や、キーワードの類似性による自動分類、関連性の高い重要キーワードの抽出を行います。
テキストの部分文字列のマッチングに基づく全文検索とは異なり、概念的な分析が可能で、互いに相補的な役割を担います。
さらに、当社のシソーラスやあいまい検索技術を組み合わせることにより、より適合率の高い検索、分類ができます。 |
▶ タギング分析適用例 |
検索が簡単になります
インターネットでショッピング
インターネットでショッピングをしているとき、すぐによい検索キーワードが思いつかないことがあります。
それでも、タグ分析機能を利用すれば、簡単に目的の情報にたどり着くことができます。
ピンとこないキーワードで検索しても、関連キーワードが提示されので、
その中から最適なキーワードを選んで、再検索すれば、目的の情報を得ることができます。
また、気に入った商品がみつかったら、類似検索ボタンをOne Clickして、類似商品を見ることができます。
検索が簡単ですから、ショッピングを楽しむのに集中できます。 |
「検索結果スコアリング」機能 |
Ver.4で追加された「検索結果スコアリング」機能により、数値、テキスト、および、タギング・キーワードなど、
各種データに関する検索結果のスコアを計算することができます。
適合度が高いものほどハイスコアになるように、検索結果をスコアリングするため、
ユーザーにとって有用な順に表示することができます。
今回、新規に追加したタギング分析機能では、類似度をベクトル計算により算出しますので、
必然的に検索結果のランキングスコアが得られます。
タギング・キーワードだけでなく、既存のフィールド型(数値、文字列、および、テキスト型)にも
検索結果のスコアリングができるように拡張しました。
さらに、数値データ、テキスト全文検索、タギング・キーワードによる検索などを組み合わせて、
複合検索し、総合スコアを得ることもできます。 |
▶ QZS Full-text Search Engine Ver.4 検索結果スコアリング適用例 |
スピーディーに検索できます
価格による検索
ショッピングサイトでは、価格帯を指定して検索することがよくあります。
QZSでは、そのような範囲検索も簡単にできます。
しかし、範囲検索では2つの値を選択しなければならないので、やや手間です。
お客様は商品が見たいのであって、リストボックスの設定をするのが目的ではありません。
QZSでは、多様な数値検索方式を取り揃えています。
QZS数値検索では、「10万円くらい」という指定ができます。これなら、スライダーなり、
リストボックスなりで、さっと指定するだけで、すぐさま商品が見られます。 |
QZS Full-text Search Engine FAQ
仕様
データベース定義関連
複数のDB定義、オープン可能DBに対して同時に異なる複数のテーブルを定義、オープン可能
下記のフィールド型を複数使用したテーブル定義可能
Boolean型(0/1の論理型) ※1
Number型(LONGタイプの整数) ※1
RealNumber型(FLOATタイプ小数点以下桁数指定) ※1
AutoNumber型(LONGタイプの自動採番整数) ※1
String型(2048バイト以下の文字列) ※1
Text(File)型(512Kバイト以下の全文テキスト)
HTML(File)型(HTMLやSGMLのタグを無視した登録の全文テキスト)
SubText型(TEXT型のインデックスなし版)
StringSet型(String型の集合ビットマップ)
NumberSet(Number型の集合ビットマップ)
※1 Sort,Distinct指定可能
DB、テーブル、フィールド名は日本語で定義可能
フィールド名やフィールド属性は、APIでの参照、追加定義可能
|
検索系
完全一致、前方一致、中間一致、以上、以下、範囲、否定、その他各種検索方式をサポート
同義語・類義語展開検索モード設定
全文検索用に最適化した同義語・類義語辞書QZSシソーラスを標準バンドル
(日本語/英語/英数略語、複数ユーザー辞書サポート)
全角/半角、大文字/小文字、スペース無視、中黒無視、カタカナ語尾長音無視、
カタカナ異表記などの日本語あいまい検索モード設定
複数語(AND,OR,NOT,XOR)同時検索をサポート
複数フィールドに対する同一検索語での同時検索をサポート
無限回の絞り込み検索(AND,OR,NOT)
|
検索結果
各種検索結果集合は最大54個を同時にメモリー生成可能各種検索結果集合どうしの演算(AND,OR,NOT,XOR)して別結果集合への論演算マージ機能
各種検索結果集合のシステムファイルへのSave/Load可能
検索結果から任意のフィールド単位でのヒット数(Count(*))読み出し機能
検索結果から任意の複数のフィールドの同時読み出し(Fetch)、ソート条件設定機能
検索結果から任意の複数のフィールドでの重複行に対するDistinct条件読み出し設定機能
同上条件での重複行カウント読み出し機能
各フィールド(全文元テキスト含む)は登録時の状態に完全に復元して読み出し(Fetch)機能
全文型フィールド、STRING型フィールドの検索語レベルでの
検索ヒットポイント詳細(検索語No.、Offset、length)取得機能(シソーラス、あいまいに
完全対応)
検索結果と読み出し条件に対応したシーク読み出し機能
|
更新系
APIによるリアルタイム登録/削除/更新CSV形式データファイルからの一括学習
AutoNumber型でユニークな番号をインクリメントして採番可能
ユーティリティーからの簡単メンテナンス
|
動作環境
対応OS
Windows Server 2008
Windows Server 2012
Windows Server 2016
CentOS 7
|
|
|
デモンストレーション