MeCab(mecab-python3) を使った形態素解析

このページでは、形態素解析エンジンの「MeCab」と Pythonライブラリ「mecab-python3」を使った形態素解析について、簡単にまとめています。
形態素解析エンジンの本体「MeCab」は、Python のライブラリとは別のプログラムのため、下記の公式サイトより、事前にダウンロードしインストールを行っておいてください。
「mecab-python3」ライブラリから、「MeCab」本体を呼び出して形態素解析を行う流れになります。
※検証環境は、Windows 10 Pro 64bit 版で行いました。
MeCab 公式サイト
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
https://taku910.github.io/mecab/
※インストール時の「辞書の文字コードの選択」では、[UTF-8]を選択してください。
解説内容
1. mecab-python3 ライブラリのインストール
以下のコマンドを実行して、mecab-python3 ライブラリをインストールします。
コマンド:pip install mecab-python3
2. MeCab を使った形態素解析
先ほどインストールした「mecab-python3」ライブラリの MeCab モジュールから、OS にインストールした MeCab を呼び出し、形態素解析を行います。
今回は、以下のような文章を入力して、形態素解析を行った結果になります。
解析対象:このページでは、プログラムの解説をしています。
実行コマンド:python mecab_test.py
# MeCab を使って形態素解析の検証を行う
import MeCab
# 解析対象の文章
text = 'このページでは、プログラムの解説をしています。'
print('----- 解析対象 ----------------------------------------')
print(text)
print('----- 解析結果 ----------------------------------------')
# 形態素解析の結果を Chasen の出力形式で表示
t = MeCab.Tagger('-Ochasen')
result = t.parse(text)
print(result)
print('-------------------------------------------------------')
結果確認
以下の様に、形態素解析の結果が出力されました。
結果のデータ型は文字列でタブと改行で区切られているため、個別に使用する場合は分割する必要があるようです。
以上で、MeCab(mecab-python3) を使った形態素解析の検証は終了です。