中堅企業IT部門の日常

中堅企業IT部門の中間管理職で半研究者の雑談です。毎週火曜日更新予定

統計

文書はもう書かない?

前回まで形態素解析の話をしてきました。 blog.sme-itdept.com ただ、内容としてはKH-Coderを使って遊んでみました程度で、解析というのもおこがましい内容です。これで解析というと研究者の方々には怒られてしまいます。 文書評価は難しい 前回までは、ブロ…

ブログはどうかわったか - 形態素解析4-対応分析

前回、対応分析がうまくいかなかったのですが、樋口先生からコメントいただきまして、リトライしてみました。 まず、失敗作がこちら 大量に「2016」、「2015」といった年が出力されています。これは<H1>タグの使い方が間違っているようです。 <H1>2015</H1>[記事1]<H1>2015</H1>[記</h1>…

ブログはどうかわったか - 形態素解析3

引き続き、ブログの形態素解析です。 図示してみる 前回行った年度別に頻度を出すだけでも特徴的なワードがなんとなくわかるのですが、もう少し図的に表記することで、各年度の関係性が良く分かります。共起ネットワークという機能を使うと、各年のタグと同…

ブログはどうかわったか - 形態素解析2

前回、ブログデータを整形しました。早速KH-CODERに取り込んでみます。ファイルを選択して取り込み、前処理を実施すると、とこんな感じになります。 H1の数がブログの投稿数+ドラフト数となります。ブログ数としては199件です。行数としては、10016行。1ブ…

ブログはどうかわったか - 形態素解析1

前回、前々回と語彙の話をしてきました。他にも、文書の書き方本は多々読んでいるのですが、結果としてブログの文書は進歩しているのか、それが最大の関心事です。 そこで形態素解析を用いて、自分の文書を定量化し傾向を見てみようというのが今回の趣旨です…

経営学論文を読むことになった素人社会人が最初に読むべき3冊

社会人で特に博士号を持っているわけでもなく、経営学専攻でもないのに、経営学の論文を読まなければならなくなったという、レアケースの方に向けたオススメ3冊です。 MBAでもたまには読むかも MBAは基本職業訓練校です。経営戦略、会計、マーケティング等を…

ちょっと調べてみた(ラグビー人口)

ちょっと気になったので、ネットで数字を拾ってみたというだけの話。 で、いざデータを取ろうとすると結構難しいのですこれが。 そもそも、「競技人口」って何?という定義から始まります。 何かの団体に登録している人? 日曜に草野球やる人は、野球競技人…

Nature誌の査読もせめられているようで。。。

英語の話の途中でしたが、ちょっと別の話題を。 最近話題のSTAP細胞、一時期持ち上げられて、その後コピペ問題等々で急激に評判を落としてますが、そんな論調の中に、Nature誌の査読に対する批判もちらほら。 個人的には生物とは全く分野の違う研究なので、…

ブログランキング・にほんブログ村へ