テキスト・マイニング研究会マクロ配付

○ フリーウェア,シェアウェアの配付

マクロ・プログラムをフリーウェアあるいはシェアウェアとしてご提供しております。なお、シェアウェアのダウンロードにはユーザー登録時に発行された「登録ID」が必要です。登録は「こちら」から行ってください。




フリーウェア

WordMinerの分かち書き処理機能には,品詞特定などを行う形態素解析の機能は含まれておりません。しかし利用者によっては,別の分かち書き処理を行って比較をしたい,品詞情報を利用してみたいこと(例:名詞だけを使う,形容詞だけを使う)もあるでしょう。このような場合に“KH Coder”を併用した分析が可能です。これを簡単にご紹介します。

KH Coderとは樋口耕一氏(立命館大学)により開発された内容分析(計量テキスト分析)やテキスト・マイニングのためのフリーウェアです
http://khc.sourceforge.net/index.html)。よってこのソフトだけでもテキスト・マイニングの分析が可能です。KH Coderのアイディアは,既存のコンピュータ技法を有機的に統合化したことにあります。例えば以下のような特徴があります。

  • 1. 多様なOSに対応:Windows(XP, Vista),Linux,Macintosh上で動作
  • 2. 分かち書き処理・形態素解析には茶筌(ChaSen)を利用
  • 3. 検索や集計を行うために,内部でオープンソース・データベースMySQLを利用
  • 4. 多変量解析手法の利用と分析結果の可視化処理など(R言語を用いた処理)

テキスト・マイニングに必要な様々な機能を,SQL,茶筌,R言語などを巧みに融合させた独自に開発のインターフェースが用意されています。フリーウェアであることを考えるとかなりハイパーフォーマンスなソフトウェアと言えるでしょう。

実はこのKH Coderの諸機能を使って得られたコーディング情報をWordMinerの変数(構成要素変数)として入力,分析することが可能です。樋口氏のご協力により,この具体的な手順が公開されておりますので,ご関心のある方は下記をご覧いただきご利用ください。

KH Coderについての参照先:
http://khc.sourceforge.net/index.html
「WordMinerとKH Coderとの連携・併用について」は以下を参照:
http://khc.sourceforge.net/FAQ.html#wm1

1. プログラムの機能

このプログラムは,社会調査などにおいて,同じ調査票・質問文を用いて得られた“2組の回答者集団の回答比率”を標本誤差、信頼限界で比較分析する際に用いるソフトです。

2. 計算例

例えば、下の図は、2つのパネル(パネルA、パネルB)に、調査方式としてウェブ調査を用いて得られた回答比率を比較した例です。

計算例

この例では、信頼度を95%、サンプル数をn=833(人)としたときの信頼限界を書き入れてあります。もしも2パネルの回答者の回答比率が類似しているならば、対角線上に点(回答比率)が分布するはずです。同じ調査方式(ウェブ調査)を用いても、また調査票や質問文をほとんど同じにしても、この例のように回答比率の揺らぎが生じることが分かります。このように同じ質問を行った2グループの回答比率の比較を行うときに利用するソフトです。

データの出処:http://www.health-net.or.jp/tyousa/houkoku/h18_oyatoko.html
(財)健康・体力づくり事業財団(2007):
「親と子の生活行動と健康に関する調査」事業報告書



シェアウェア

□価格:セットで6,000円(消費税込み)
(*)なお,研究目的で利用していただく場合は,フリーウェア(無料)でお使いいただけます(ダウンロードは自由)。ただし,このマクロ・プログラムを使っていただいたことを,必ず引用することをお願いいたします。
・「集計マクロ・プログラム」

「2005年5月19日(木)〜20日(金)に、統計数理研究所(大学共同利用機関法人 情報・システム研究機構)を会場として開催されましたテキスト・マイニング研究会主催「WordMiner第3回活用セミナー」において配布された資料をここに掲載します。

・「構成要素カラリング表示マクロ・プログラム」(アップデートしました)

WordMinerの優れた機能の一つに、選択肢型設問や属性項目などと、得られた構成要素群(単語、語句など)との間の関連を測る「有意性テストの機能」があります。決め手となる単語・語句群が質的変数の各選択肢や属性項目区分とどう関係するか、あるいはクラスター化で得た分類情報と構成要素群がどのように関連するかを、テストの結果として一覧表示します。この情報の表示形式を一歩進めて、ユーザの指定により表の中で同じ単語・語句をカラー表示するという機能です。

注意:

 これらのマクロ・プログラムは、WordMinerユーザ向けに分析の利便性向上を図る目的でフリーウェア、シェアウェアとして開示するものです。したがって、これらプログラムについては、各自の責任の範囲でご利用ください。また、これを用いた分析で生じた不都合・不具合については、テキスト・マイニング研究会としては責任を負うことはできませんので、十分にご注意のうえご利用ください。
 個別的なアフターケアまでは行うことができませんが、プログラムをなるべく正しく使っていただくため、ご質問内容によっては回答をいたしますので、お問い合わせください(お問い合わせアドレス:[email protected]