中堅企業IT部門の日常

中堅企業IT部門の中間管理職で半研究者の雑談です。毎週火曜日更新予定

文書

文書はもう書かない?

前回まで形態素解析の話をしてきました。 blog.sme-itdept.com ただ、内容としてはKH-Coderを使って遊んでみました程度で、解析というのもおこがましい内容です。これで解析というと研究者の方々には怒られてしまいます。 文書評価は難しい 前回までは、ブロ…

ブログはどうかわったか - 形態素解析4-対応分析

前回、対応分析がうまくいかなかったのですが、樋口先生からコメントいただきまして、リトライしてみました。 まず、失敗作がこちら 大量に「2016」、「2015」といった年が出力されています。これは<H1>タグの使い方が間違っているようです。 <H1>2015</H1>[記事1]<H1>2015</H1>[記</h1>…

ブログはどうかわったか - 形態素解析3

引き続き、ブログの形態素解析です。 図示してみる 前回行った年度別に頻度を出すだけでも特徴的なワードがなんとなくわかるのですが、もう少し図的に表記することで、各年度の関係性が良く分かります。共起ネットワークという機能を使うと、各年のタグと同…

ブログはどうかわったか - 形態素解析2

前回、ブログデータを整形しました。早速KH-CODERに取り込んでみます。ファイルを選択して取り込み、前処理を実施すると、とこんな感じになります。 H1の数がブログの投稿数+ドラフト数となります。ブログ数としては199件です。行数としては、10016行。1ブ…

ブログはどうかわったか - 形態素解析1

前回、前々回と語彙の話をしてきました。他にも、文書の書き方本は多々読んでいるのですが、結果としてブログの文書は進歩しているのか、それが最大の関心事です。 そこで形態素解析を用いて、自分の文書を定量化し傾向を見てみようというのが今回の趣旨です…

日本語を改善する - 語彙を作る

引き続きこちらの書籍より 語彙力を鍛える 量と質を高めるトレーニング (光文社新書) 作者: 石黒圭 出版社/メーカー: 光文社 発売日: 2016/05/19 メディア: 新書 この商品を含むブログ (2件) を見る 前回は、類義語、対義語を考えることで語彙が増えるという…

日本語を改善する - 語彙を増やす

ブログを書いていると、もう少し文書力を向上したいと感じることがあります。別に文学的な文書を書きたいとは思いませんが、人並みの文書を書きたいという気持ちはあります。 語彙力を増やす そんな中、最近読んでいるのがこちら、 語彙力を鍛える 量と質を…

ブログランキング・にほんブログ村へ