QZS Dictionary Serverの特徴
日本語あいまい索引
入力した検索語が「ネットワークコンピューター」でも「ネットワーク・コンピュータ」と「NC」等を辞書から検索できます。
しかし、辞書の中には、「ネットワーク・コンピュータ」と「NC」しか登録されていません。辞書から検索する際に異表記を吸収しています。
辞書の収録語数をむやみに大きくせずに漏れの検索を可能としています。もちろんQZSシソーラスの一般語辞書の語数カウントもこれらあいまい表記は除いてカウントしています。
辞書展開時のみならず、QZS日本語全文検索エンジンにも同様に日本語あいまい検索を実装していますので、文中の類語に加え、異表記などもカバーします。
主なあいまい索引オプション |
例 |
全角・半角の同一視 |
NBAとNBA |
大文字・小文字の同一視 |
FAXとFax |
ひらがな・カタカナの同一視 |
みかんとミカン |
区切り文字の無視 |
ヘアサロンとヘア・サロン |
空白文字の無視 |
ヘアサロンとヘア サロン |
末尾長音の無視 |
ユーザーとユーザ |
ユーザー辞書が作成できます(100万語×31種類)
QZSシソーラスは、主に一般語を集録した汎用辞書です。ですから、お客様が必要だと思う単語が集録されていないかもしれません。
そのようなお客様が自分用に、10万グループずつ31種類まで目的別ユーザー辞書が作成できるようになっています。使用する際に一般語+31種類のユーザー辞書から任意の辞書を選択して検索することができます。
日本語展開、英語展開が可能
QZSシソーラスには、日本語および英語が集録されていますが、日本語のみの使用に限定することも可能です。
不要な語をオフにして検索
QZSシソーラスの一般語辞書は汎用辞書ですので、その中の語を実際に削除したり、変更することはできません。しかし、自分が検索に不要だと思う語をオフにして検索することは可能です。
ユーザー辞書は自由にメンテナンスできます。
定期的なバージョンアップ
言葉は日々変化するものです。新しい言葉もどんどん出てきます。
QZSシソーラスは、お客様のご要望にお答えするため、定期的なバージョンアップを行っています。
また、このような単語を標準的に一般語に入れて欲しいというようなユーザのニーズにも一般語として適合する場合やノイズを発生させる恐れが無いかを調査の上、収録しております。
QZS シソーラス展開例
- 1989年=1989=昭和64年=昭和六十四年=平成元年=平成1年=平成一年
- リサイクル=リサイクリング=再利用=再生利用=廃物利用=recycling
- ユニセフ=国連児童基金=UNICEF=United Nations Security C
QZS シソーラスの価格
QZSシソーラスは、QZS FUll-text Search Engineに標準で付いています。つまり、QZS Full-text Search Engineをお買い上げいただいた方は無償でご利用になれます。
尚、QZS Dictionary Server(C標準インタフェース)のみの提供については相談に応じますが、コンテンツ(辞書内容)のみの提供の予定はございません。
同義語すべてが集録されていないワケ
QZSシソーラスは純粋に検索用ですので、ノイズ(意図しなかったヒット)が出やすい語を意図的に除外しています。
上の図のように、検索用専門でない類語辞書を使用すると、書籍で検索した場合に、「本日」や「ほんと」などがヒットしてしまうという不具合が生じてしまうため、あえてノイズの出やすい語は集録されていません。一般的な類語辞書には当然集録されている「本」という語が「書籍」の同義語として集録されていないというのはこういう理由です。
