Text Mining Maniax:フリーソフトで始める日本語計量テキスト分析(増補版)
サークル: 後藤和智事務所OffLine
サークルHP:
発売日: 2022年10月27日 16時
ジャンル: 評論 技術書
紹介
2016年に刊行した、テキストマイニング(計量テキスト分析)の基礎的な解説書『TextMiningManiax』に、2018年刊行の『TextMiningManiaxAdvance』の第2章を増補しました。刊行日:コミックマーケット99(2021年12月)
目次
【目次】
はじめに
第1章ソフトのインストール
1.1はじめに
1.2下準備:R、MeCabをインストールする
1.3RMeCab、KHCoderをインストールする
1.4そろえておくべき書籍など
第2章西田幾多郎『善の研究』を分析する
2.1はじめに
2.2KHCoderの形式にデータを修正する
2.3KHCoderの基本動作と抽出水準の策定
2.4RMeCabを用いた分析
2.5KHCoderを用いた分析
第3章ある日の新聞の社説を分析する
3.1はじめに
3.2複数のテキストファイルを対象としたRMeCabの操作(単語のカウント、N-gram)
3.3KHCoderによる文章のクラスタリング
第4章「東方Project人気投票」のコメントを分析する
4.1はじめに
4.2MeCabで任意の単語を使用できるようにする方法
4.3KHCoderと外部変数の読み込み
4.4コーディングを用いた分析
第5章KHCoderの本が(たぶん)教えないKHCoderの裏技
5.1はじめに
5.2未知のワード、強制抽出にするか?辞書登録するか?
5.2.1検証
5.2.2MeCabを使うメリット
5.2.3強制抽出を使うメリット
5.3Rソース活用術
5.3.1はじめに
5.3.2多次元尺度構成法
5.3.3クラスター分析