KHcoder22. 共起ネットワーク(第３回) タブローでネットワーク図

KHcoder22.　共起ネットワーク(第３回)　タブローでネットワーク図

KHcoderでは共起ネットワーク図をCSVで出力する機能がありません。ならば、Rからデータを出力してタブローで表現してみようということです。

テキストマイニングツール「KHcoder」の活用メモ
開発者である樋口先生に感謝！
【今回の分析対象テキストはこちらからコピーできます】

Ｒからデータを取り出す

KHcoderの手順

　今回はKHcoderで描画できる共起ネットワーク図をタブローで再現しようとする、大胆で生産性が低いことにチャレンジします。

　KHcoderで共起ネットワーク図を描画します。
・「集計単位」を「段落」
・「最大出現数」を１
・「外部変数・見出し」を「年代」に設定します。
・右下の「保存」をクリック
・「R Source」を選択して名前を付けて保存します。

　Ｒを起動して保存したファイルをドラッグ＆ドロップします。手順は共起ネットワーク(第２回)と同様です。

Ｒからデータをとりだすコマンド

data1<- cbind(d[,0],freq)
#data1をＣＳＶで取り出します
write.csv(data1, "ディレクトリ名/マスタ.csv")
#ノードの座標（lay_f）へ列名を付与します
colnames(lay_f) <- c("X座標", "Y座標")
#lay_fをＣＳＶで取り出します
write.csv(lay_f, "ディレクトリ名/xy座標.csv")
#線分の起点・終点、線の太さ（el）をＣＳＶで取り出します
write.csv(el, "ディレクトリ名/線と太さ.csv")

（”<-”などが文字化けしていたら直してくださいませ、ディレクトリ名、ファイル名はご自身で書き直してください。）

Ｒへコマンドを入力して必要なデータをアウトプットします。これで指定したディレクトリへＣＳＶ形式で３つのファイルが作成されます。

・マスタ.csv(語と外部変数名、出現回数)
・xy座標.csv(語と外部変数をプロットする座標)
・線と太さ.csv(線分の起点・終点、線の太さ)

ＣＳＶファイルを整形

　「マスタ.csv」ファイルを開きます。
・行の下の方にある「外部変数・見出し」の頭についている”＜＞”を削除します。

・Ｃ列へ「語番号」と列名を入れて１から昇順ユニークになる番号を最終行まで追加します。（画像は６～３２行を非表示にしていますが実際にはすべての行にたいして処理を実施してください）

・上書き保存して終了です。

タブローでデータへ接続する

語をプロットするデータ

　保存した「マスタ.csv」データへつなぎます。

・元データＡ列の列名がぬけているのでＦ１になっています。ダブルクリックして列名を「語」に書き換えます。
・「語」は座標へプロットする「語」（ノード）です。
・「freq」は「語」の出現回数ですからプロットのサイズになります。
・「語番号」は直線をプロットするデータとブレンドするためのコードになります。