読者です 読者をやめる 読者になる 読者になる

39Si

プログラミング関連の勉強した内容を簡単にまとめておきます

Python で Mecabを利用する【mac】

形態素解析ツールである MecabPython から使えるようにした。
他にも形態素解析に用いられるものは存在したが、
Mecab がもっとも一般的のようだったので、今回はこちらを使うことにした。

環境

MacBook Air - OS X Yosemite

mecabの導入

まずはMecabをHomebrewでいれる。
方法は以下のページを参考にした。

Pythonでつくる検索エンジン(Webクローラ, Mecab, MongoDB, Flask) - c-bata web

$ brew install mecab
$ brew install mecab-ipadic

動作テスト

terminal で mecab と入力して、適当な日本語入れる。
無事に動いた。

$mecab 
今日はいい天気ですね。
今日  名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
いい  形容詞,自立,*,*,形容詞・イイ,基本形,いい,イイ,イイ
天気  名詞,一般,*,*,*,*,天気,テンキ,テンキ
です  助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ
。 記号,句点,*,*,*,*,。,。,。
EOS

動いた!

Mecab導入時につまずいた内容

こんな作業でもエラーに遭遇した。

・ Homebrewのupdateをしていない
Homebrewのアップデートをしろというエラーが出ていたようだが、
今度はHomebrewをアップデートできないというエラーが発生。

以下のページに従うことで何とか解決した。

ヾ(o゚ω゚o)ノ゙brew updateでエラーでたった[Homebrew] - Qiita

PythonMecab を使う

Mecabpython で使用するにはバインディングをインストールする必要があるようです。
同じページを参考に導入した。

$ wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
$ pip install mecab-python-0.996.tar.gz 

Python からmecabをする

$python
>>> import MeCab
>>> text = "今日はいい天気ですね"
>>> t = MeCab.Tagger("-Owakati")
>>> result = t.parse(text)
>>> print result
今日 は いい 天気 です ね

できた