辞書メンテナンス不要で高精度な形態素解析を実現。あらゆる新語に対応。
ムーター株式会社(本社:東京都渋谷区、代表取締役社長:稲村尚志)は、最新のアイデアと技術に基づき開発された日本語解析エンジン(開発コード「マリモ」)の提供を開始します。
昨今のインターネットは掲載されている内容に連動した広告を提供するなど、日本語の解析とそれに基づくサービスの提供が普通に行われるようになりました。「マリモ」は一般的な辞書を必要とせず、そのために従来とかく人手に頼っていた辞書のメインテナンスを不要にする画期的な日本語解析技術です。
近年、商品の購入やサービスの提供を受けた後で、その感想をブログ・SNSや掲示板に書き込むという行動が、消費者の日常的な行動パターンとなってきています。消費者は商品のカタログ以上にそれらの書き込みを参考にする傾向が有ります。また、携帯コンテンツ・掲示板・電子メールなどで使われている言葉は、口語をそのまま書き込むという傾向があり、新聞や国語教科書などの日本語からからかけ離れた文法も多く見受けられます。そのような独自の文章・語句を解析するのに従来の辞書に依存する形態素解析では正確を期することができませんでした。そこで、ムーターは未知語登録の必要が無く、新しい文法の構文解析ができるムーター形態素解析エンジン「マリモ」を開発いたしました。
日本語解析はインターネット検索サービスを始めとして日本語の自動認識が必要な様々な分野に利用されています。従来の日本語解析はまず形態素(品詞)ごとに文章を区切り、それぞれの区切りを辞書と比較することで名詞や動詞などの品詞を確定して日本語を解析しています。この方法では辞書に出てこない新しい言葉をコンピュータが理解することは不可能で、そのため人手による辞書のメインテナンスが常に求められていました。
マリモはインターネット上の様々なカテゴリのテキスト文書を収集して単語候補を選別し、さらに選別された単語候補から不適切なものを排除して必要な単語だけを抽出し新造語を含む一億語以上の単語を学習しています。また、マリモ最大の特徴である、単語の前後関係から品詞を判断する品詞予測アルゴリズムは流行し始めた新語の品詞を特定することができます。これにより日々進化し続ける新しいテクノロジーやサービスに伴って生まれてくる言葉に的確に対応できる唯一の日本語解析として「マリモ」が登場しました。
「マリモ」は製品開発者向けのデベロッパライセンスとユーザー向けのサーバライセンスとして販売され、日本語を活用する様々な環境で利用されることを想定しています。何れのライセンスも従来のレベルより使いやすい価格設定となっており、サーバライセンスが1CPUあたり100万円以上を予定しています。客先としては、インターネットで検索サービスを提供しているポータルサイト各社を始め、構文解析が重要な割合を占めるコンテンツマッチ広告提供先やバイラルリサーチ(口コミ情報の解析)、トレンド調査、スパム対策、新造語の波及度合い調査などに容易に応用が可能であり、日本語処理が必要な企業内検索システムを提供する各社その他に初年度1億円の売上を見込んでいます。製品は移植性が高く、Windowsサーバ、Linuxサーバが標準でサポートされます。
Mooterはインターネット検索エンジン Mooter (http://www.mooter.co.jp)やモバイル検索エンジン Mooter (http://mooter.jp)のサービスを提供しています。検索結果を全て一覧表示する従来の検索エンジンとは異なり、検索結果のリストとともに、ソフトウェアが自動的に分類したクラスター(情報の分類)が表示され、膨大な情報から瞬時に検索の応用知識がなくても自分が求めている情報分野を把握できて、すばやく、正確に欲しい情報までたどり着くことができる世界最速級のクラスタリングサーチエンジンです。
Mooter とは、Moot(討論する)に由来しており、ヒトとソフトウェアとの価値観を近づけることを開発理念として、デジタルライフサイクルにおける IT コンシェルジュを目指しています。
以上
■ 本リリースに関するお問い合わせ先
製品に関わるお問い合わせ
E-Mail: info@mooter.co.jp
Tel: 03-5464-9699
製品担当: 田中
報道に関するお問い合わせ
E-Mail: pr@mooter.co.jp
Tel: 03-5464-9699
広報担当: 鈴木
関連URL:http://enterprise.mooter.co.jp/marimo/
- ウェブがもう少し便利になるかも?形態素解析エンジン「マリモ」
-
ウェブには、文章があふれかえっています。そのために、良い情報が埋没することもあります。そこで、検索サイト(Yahooや、Google)が出てきています。
もう一つ良い情報を埋没させいない方法は、文章を解析(形態素解析)して関連する文章を探し出す方法です。そんな技術にて、リリースが出ていました。 ...
(ネットPR.JP - netpr.jp -:2007年08月20日 09時51分)
http://www.news2u.net/___tb.php/NRR200720495
- トラックバック一覧ページに掲載されているウェブサイトは、第三者が管理・運営をしているため、その内容等に関して、当社及びニュースリリース発信企業は一切責任を負いません。
- このサイトへの第三者からのトラックバックは原則自由です。トラックバックする際の事前連絡は必要ありません。しかしながら、spam、無差別の宣伝、内容が全く関係ない、悪意のある誹 謗中傷など、このサイトやニュースリリース内容、及びその発信企業の不利益になると判断した場合や、重複送信の場合、このサイトが受けたトラックバックを当社の判断により削除することがあります。
- 広告目的のみと考えられるトラックバックの増加に伴い、トラックバックデータ内にNews2u.net 内の URL (言及リンク)が含まれないものを拒否する仕様になっております。トラックバックされる際はNews2u.netへのリンクを含んだデータをお送りください。
- 内容に問題があるトラックバックを発見された場合は、support@news2u.co.jp 宛に該当リリースページの URL を添えてご報告いただければ幸いです。トラックバックが正常に機能しないなど、技術的な不具合を発見された場合も、support@news2u.co.jp 宛にご連絡ください。
















del.icio.us に追加する
はてなブックマークに追加する
livedoor クリップに追加する
newsing it!