技術解説

このページは、WordMinerをはじめ、テキスト・マイニングおよびその周辺の理論、方法論、研究成果、セミナー資料などについてご紹介します。テキスト・マイニングを利用した研究や実務におけるデータ解析などの参考として供するものです。有効にご活用いただければ幸いです。

PDFファイルを開く為にはAdobe Reader(旧Adobe Acrobat Reader)が必要です。Adobe Readerは無料でダウンロードできます。

◆「WordMiner入門編」の公開(フリーペーパー)◆

WordMinerを利用していただくための、基本操作を記した「入門編」の解説を用意しました。

マニュアルとは異なり、データセットのインポート、簡単な編集、そして多次元データ解析の基本操作(対応分析法、クラスター化法、有意性テストほかの分析探査の諸機能)までの全体の操作を、実際にデータセットを例として、わかりやすく説明した解説です。

ぜひともご覧いただき、ご活用ください。

WordMiner入門編_基本操作とデータの探査

(*)WordMinerユーザの方は上にアクセスし、必要情報を入力いただくと、「印刷可」バージョンがダウンロードできます。

◆「テキスト型データのマイニングとその応用」WordMiner資料◆

以下に、過去に開催のセミナー時の用意・配布の資料や、その後あらたに作成された資料をまとめて、アップロードします。いずれも、WordMinerをご利用いただくうえで、お役に立つ情報ですので、pdfファイルとしてダウンロード可能としてあります。ぜひともご利用ください。
 とくに、WordMinerのコア手法である、「対応分析法」と「クラスター化法」については、書き替えたり新たに作成した情報を用意しました。

(注1)一部に「レシピ」掲載の資料と重複するものがあります。
(注2)いずれの資料も無断の転用、転載を禁じます。

資料1:

(*)WordMinerユーザの方はこちらのページにアクセスし、必要情報を入力いただくと、以下のファイルがダウンロード可能です。ダウンロード・ファイルを解凍後、以下の2種のファイルがあります。

◆ファイル名:質的データのマイニングのための対応分析[テキスト資料].pdf (約9.6 MB)
  1. 第Ⅰ部_対応分析法とは(概要)[配布版]
  2. 第Ⅱ部_対応分析法の基本(数理の基本)[配布版]
  3. 第Ⅲ部 対応分析法とクラスター化法[配布版]
◆ファイル名:質的データのマイニングのための対応分析[スライド資料].pdf (約12.9 MB)

この中には、JMRA講座「質的データのマイニングのための対応分析法」のトーク用のスライドが入っております。
本年度のJMRAセミナーについてはこちら: http://www.jmra-net.or.jp/seminar/detail.php?document_id=2953

(*)WordMinerのコア技法である「対応分析法」と「クラスター化法」の説明があります。
数値例を交えてかなり丁寧に書いてあります。ぜひ、ご利用ください。

資料2:
  1. 0_第6回活用セミナー_2006_Sept_最終目次+奥付.pdf (PDF: 116KB)
  2. 1_テキスト型データのマイニング.pdf (PDF: 1MB)
  3. 2_調査におけるテキスト型データの解析.pdf (PDF: 684KB)
  4. 3_形態素解析と分かち書き処理.pdf (PDF: 480KB)
  5. 4-1_構成要素変数の生成と編集.pdf (PDF: 316KB)
  6. 4-2_構成要素変数の生成と編集.pdf (PDF: 596KB)
  7. 4-3_構成要素変数の生成と編集.pdf (PDF: 492KB)
  8. 補足資料1_よくある質問へのヒント.pdf (PDF: 796KB)
  9. 補足資料2_よくある質問とそれへの回答.pdf (PDF: 292KB)
資料3:WordMiner事例集(導入編)(添付ファイルなし)

(*)ここにはファイルはありませんが、必要な方には提供いたしますので、お問い合わせください。
また、2013年に行う予定のWordMinerバージョンアップ時には、これに類似の「入門ガイド」の冊子を用意いたします。

資料4:WordMinerにおける多次元データ解析-設計指針と主な特徴の紹介- (スライド)

◆WordMiner無料セミナ-2006_September版.pdf(PDF: 396KB)

資料5:WordMinerにおける多次元データ解析-ミニチュアデータによる対応 分析法の仕組みの解読-(スライド)

◆WordMiner無料セミナ-2006_September版_レストラン事例.pdf(PDF: 740KB)

資料6:テキスト・マイニング研究会 活用セミナー(スライド)

◆メモ+文献_無料セミナ-2006_September版.pdf(PDF: 152KB)

資料 7:質問への回答とコメント

◆WordMiner質問_FAQ_Sept-07,2006.pdf (PDF: 496KB)
(*)セミナー当日にいただいたご質問、ご意見への回答・コメントを要約しました。ご利用ください。


◆「テキスト型データのマイニングとその応用」WordMiner活用セミナー資料◆

セミナーの内容

2006年6月30日(金)に、日本電子計算株式会社セミナールームにて開催されましたテキスト・マイニング研究会主催「WordMiner第5回活用セミナー(無料セミナー)」において配布された資料の一部をここに掲載します。

(注)これより以前に開催されたセミナーで配付の資料と重複する資料は既に公開されておりますので,このセミナーで新たに加わった資料のみを掲載します。

1. WordMiner™における多次元データ解析─ 設計指針と主な特徴の紹介 -(発表時スライド、グレイレベル版)(PDF: 782KB)

大隅 昇(統計数理研究所・名誉教授、テキスト・マイニング研究会代表)

概要:WordMiner™の設計指針と主な特徴の紹介,「多次元データ解析」機能の中核をなす方法論である対応分析法・数量化法III類の概要を紹介する内容となってます。対応分析法で扱うデータ表の構成、数量化の意味と目的、基本数理などの入門的な内容について記述されております。
WordMiner™における多次元データ解析─設計指針と主な特徴の紹介─(発表時スライド、グレイレベル版)(PDF: 782KB)

2. WordMiner™における多次元データ解析─ミニチュアデータによる対応分析法の仕組みの解読─の概要

大隅 昇(統計数理研究所・名誉教授、テキスト・マイニング研究会代表)

概要:概要:WordMiner™における対応分析法(数量化法III類)の利用方法と仕組みを,ミニチュアデータを用いて解読・説明した資料です.対応分析の仕組み,固有値,寄与率の意味,成分スコアの布置図の見方などがミニチュアデータを使って説明されてます。
WordMiner™における多次元データ解析 ─ ミニチュアデータによる対応分析法の仕組みの解読(発表時スライド、カラー版)(PDF: 396KB)
WordMiner™における多次元データ解析 ─ミニチュアデータによる対応分析法の仕組みの解読(発表時スライド、グレイレベル版)(PDF: 392KB)


◆「テキスト型データのマイニングとその応用」WordMiner活用セミナー資料◆
セミナーの内容

2005年5月19日(木)〜20日(金)に、統計数理研究所(大学共同利用機関法人 情報・システム研究機構)を会場として開催されましたテキスト・マイニング研究会主催「WordMiner第3回活用セミナー」において配布された資料をここに掲載します。

1. 対応分析法・数量化法III類の考え方

大隅 昇(統計数理研究所・名誉教授、テキスト・マイニング研究会代表)
概要:WordMinerの「多次元データ解析」機能の中核をなす方法論である対応分析法・数量化法III類について紹介したペーパーとなっております。対応分析法で扱うデータ表の構成、数量化の意味と目的、基本数理などの入門的な内容について記述されております。
対応分析法・数量化法III類の考え方(テキスト原稿)(PDF: 660K)
対応分析法・数量化法III類の考え方(発表時スライド、カラー版)(PDF: 620K)
対応分析法・数量化法III類の考え方(発表時スライド、モノクロ版)(PDF: 580K)

2. 構成要素変数の生成と編集-WordMiner辞書関連機能の紹介

保田明夫(富士通エフ・アイ・ピー・システムズ株式会社、テキスト・マイニング研究会事務局長)
概要:WordMinerの機能の特徴の一つに、独自の辞書編集機能があります。分かち書き処理後に得られる構成要素(分かち書き、キーワード)を解析に適した形に編集するための諸機能、構成要素と構成要素変数、分かち書き処理と構成要素変数の生成、構成要素変数の編集と編集辞書の役割などについての要約解説となっております。
構成要素変数の生成と編集(本文)(PDF: 376K)
構成要素変数の生成と編集(付録)(PDF: 384K)

3. 事例紹介

セミナー当日に発表された4件の事例をここに掲載します。

1)エリア別のコミュニケーションを考える

国生理枝子(株式会社オリコム、企画制作本部 R&Dルーム、部長)
概要:コミュニケーションに関するエリア差を消費者の生の声から探索するため、広告の自由連想や好きなテレビ広告に関する自由回答を収集し、テキスト・マイニング技術で分析を試みた結果を報告する。
エリア別のコミュニケーションを考える(PDF: 384K)

2)WordMinerと他の応用ソフトとの連携─内容分析の観点から─

樋口耕一(大阪大学大学院情報科学研究科、日本学術振興会・主任研究員)
概要:WordMinerによる探索を行う際、分析をよりいっそう掘り下げるためには、ある種の質的な処理(KH Coder)が有効な場合がある。この処理内容と事例、およびその背景にある「内容分析(content analysis)」の考え方を紹介する。
WordMinerと他の応用ソフトとの連携(PDF: 236K)

3)WordMinerで明らかにする日本の観光地イメージ─首都圏在住者編─

小内 隆(株式会社流通情報センター、営業局企画調査1部、ディレクター)
概要:WordMiner活用の一例として、「好きな観光地とその理由」という自由回答設問から、回答者自体の旅行志向クラスターと、人気観光地クラスターを同時に導き出した事例を紹介する。
WordMinerで明らかにする日本の観光地イメージ(PDF: 752K)

4)出会い系サイトに対する大学生の意見分析─WordMinerによる賛成・反対意見の分析─

柳原良造(マーケッティング・サービス株式会社、顧問)
概要:ここでは、自由回答質問によって、回答者に自身の発想と文体による回答を求め、埋没意見や態度、ならびに構造化した質問形式で得たデータとの分布の異なりの有無を検証する。分析内容の報告とともにWordMinerの分析力を検証・評価する。
出会い系サイトに対する大学生の意見分析(PDF: 620K)

◆テキスト型データのマイニングとその応用◆
内容:
「テキスト型データ・マイニング」に関連する基礎知識、調査(意識調査、意見調査、インターネット調査等)における自由回答設問の設計、テキスト型データの基本処理(分かち書き処理、基礎的な統計分析手法)、多次元データ解析手法(対応分析、クラスター化)、市場調査における分析事例等について、体系的かつ平易に紹介した記事となっております。
第I部
テキスト型データのマイニング
 ─最近の動向とそれが目指すもの─
本文(25ページ/PDF:220K)
図表(7ページ/PDF:176K)
第III部
▼市場調査における分析事例
第V部
新聞記事データによる社会・経済、産業・技術、市場環境等の分析・把握