2024-03-28T22:01:15Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000487812023-04-27T10:00:04Z01164:04179:04243:04249
goo/InfoBeeが目指す自然言語処理Natural language processing for the search engine goo/InfoBeejpnhttp://id.nii.ac.jp/1001/00048781/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=48781&item_no=1&attribute_id=1&file_no=1Copyright (c) 1999 by the Information Processing Society of JapanNTTヒューマンインタフェース研究所NTTヒューマンインタフェース研究所NTTヒューマンインタフェース研究所NTTヒューマンインタフェース研究所稲垣, 博人大久保雅且杉崎, 正之田中, 一男インターネットの普及により個人が自由に情報を発信できる世界となった.このような情報流通社会において,goo/InfoBeeは水先案内人として絶えず革新を続けている.米国のインターネットの普及に伴い日本でもインターネットが普及し始めたころ,米国では既にインターネットを検索する種々のサイトが立ち上がっていた.NTTは,このようなインターネットサーチエンジンの必要性を予見し,97年3月gooサービスを立ち上げた.このインターネットサーチエンジンは,米国Inktomi社のエンジン部分を利用し,InfoBee自然言語処理技術を用い,日本語向け・日本人向けにしたインターネットサーチエンジンである.インターネットから情報を集める機能としてクローラがあり,さらに検索に必要なインデックスを作成するインデクサ,そしてそのインデクサが作成したインデックスをもとに検索を行うテキストリトリーバからなる.これらの機能は,自然言語処理が高度に融合したソフトウェアコンポーネントである.もちろん,インターネットサーチエンジンも単にインターネットの検索ができるだけでなく,種々のサービス,たとえば,フリーメイル,ディレクトリ情報サービス,各種データ提供サービスなど種々のサービスが必須機能となってきている.これらのサービスを統合的に提供するために,goo/InfoBeeは,種々の自然言語処理技術を用いた種々のサービスを実現してゆく.本稿では,goo/InfoBeeの基本的機能である,サーチエンジンにおける自然言語処理技術について述べ,さらに将来的に目指す自然言語処理について概観してゆく.Not only mass-media but also personal media can easily be published in the Internet world, so many people began to think this is a huge network and we need navigator to traverse the Internet world. First, the States began to create several Internet search engines to navigate Internet. Corresponding such trends, NTT launched "goo" Internet search engine utilizing Inktomi's search engine technologies and InfoBee natural language processing technologies. Inktomi had been a small venture company that integrated the HotBot Internet search engine, but their scalable search engine technologies and Internet technology were better matching to InfoBee Japanese natural language processing technology. There are three parts in the Internet search engine. One is the crawler that gathers HTML texts from the Internet world. Second is the indexer that makes index from gathered HTML texts. Third is the text retriever that yields answer from a user query using index. The crawler, indexer, and text retriever utilize Japanese natural language processing. Of course, not only Internet search service but also several services such as mail services, information directory services, and information providing services are important as a portal service. In this paper, we review the basic characteristics of goo/InfoBee search engine and several services that utilize Japanese natural language processing as a portal service.AN10115061情報処理学会研究報告自然言語処理(NL)19992(1998-NL-129)19261999-01-202009-06-30