MeCab(mecab-python3) を使った形態素解析

このページでは、形態素解析エンジンの「MeCab」と Pythonライブラリ「mecab-python3」を使った形態素解析について、簡単にまとめています。

形態素解析エンジンの本体「MeCab」は、Python のライブラリとは別のプログラムのため、下記の公式サイトより、事前にダウンロードしインストールを行っておいてください。
「mecab-python3」ライブラリから、「MeCab」本体を呼び出して形態素解析を行う流れになります。
※検証環境は、Windows 10 Pro 64bit 版で行いました。

MeCab 公式サイト
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
https://taku910.github.io/mecab/

MeCab 公式サイト
MeCab 公式サイト

※インストール時の「辞書の文字コードの選択」では、[UTF-8]を選択してください。

解説内容

  1. mecab-python3 ライブラリのインストール
  2. MeCab を使った形態素解析

1. mecab-python3 ライブラリのインストール

以下のコマンドを実行して、mecab-python3 ライブラリをインストールします。

 コマンド:pip install mecab-python3

mecab-python3 ライブラリのインストール
mecab-python3 ライブラリのインストール

2. MeCab を使った形態素解析

先ほどインストールした「mecab-python3」ライブラリの MeCab モジュールから、OS にインストールした MeCab を呼び出し、形態素解析を行います。
今回は、以下のような文章を入力して、形態素解析を行った結果になります。

 解析対象:このページでは、プログラムの解説をしています。

実行コマンド:python mecab_test.py

# MeCab を使って形態素解析の検証を行う
import MeCab

# 解析対象の文章
text = 'このページでは、プログラムの解説をしています。'

print('----- 解析対象 ----------------------------------------')
print(text)

print('----- 解析結果 ----------------------------------------')
# 形態素解析の結果を Chasen の出力形式で表示
t = MeCab.Tagger('-Ochasen')
result = t.parse(text)
print(result)
print('-------------------------------------------------------')

結果確認

以下の様に、形態素解析の結果が出力されました。
結果のデータ型は文字列でタブと改行で区切られているため、個別に使用する場合は分割する必要があるようです。

形態素解析の結果
形態素解析の結果

以上で、MeCab(mecab-python3) を使った形態素解析の検証は終了です。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です