テキスト分析の作業効率、飛躍的にアップ

働き方改革が叫ばれる昨今だが、当編集部員は、各社・団体からの文章を前にして、日夜意味の把握のためにうんうん唸っている。ビッグデータとともに世間にテキストがあふれ出せば、きっともう手に負えない、文章の分析ツールが欲しいと思う。

今日のコンピュータはまだ人間のように意味を理解できない。ために分析する人が、「ツール」に指示を与えなければならない。対象となる文章が膨大となればその作業負担だって甚大である。そこで、アンケートの自由記述、インタビュー記録、新聞記事など、さまざまな社会調査データを分析するために制作したという。立命館大学の樋口耕一先生は、テキスト型データを統計的に分析するフリーウェア「KH Coder」を開発。この分析ツールの機能追加プラグインとして、SCREENアドバンストシステムソリューションズは、「文錦™シリーズ」を発表した。

樋口先生監修のもと、KH Coder本体にはなかった便利な機能を提供する。シリーズの第一弾は、昨年12月に発売の「文錦™ クレンジング for KH Coder」だ。分析対象データに対して、クレンジング(ゴミの除去)処理の一括実行機能、変数の追加・編集機能を提供する。このプラグインは、たとえば対象データに半角英字のような文字が存在する場合や、文章がKH Coderに認識されない終止符(「!」「?」等)で終わる場合に有効となる。

KH Coderの「文」の抽出・集計処理が正常に機能せず、正しい「文」の数を認識できないとき、もしくはテキスト分析を有意義なものとする際には、テキストに紐づく変数――アンケート回答者の年齢層や職種などが重要となる。これら変数の追加・編集作業は、元データの加工を伴うために労力を要する。ところで同プラグインを用いれば、作業をより簡単かつシンプルな手順で実現でき、正確で素早い分析を実施可能とのことだ。