JUMAN module

class pyknp.juman.juman.Juman(command='jumanpp', server=None, port=32000, timeout=30, option='', rcfile='', ignorepattern='', pattern='^EOS$', jumanpp=True, multithreading=False)[source]

Bases: object

形態素解析器 JUMAN を Python から利用するためのモジュール

Parameters
  • command (str) – JUMANの実行コマンド

  • option (str) – JUMAN解析オプション (ラティス形式 -s, ビーム幅 –beam <int>)

  • rcfile (str) – JUMAN設定ファイルへのパス

  • pattern (str) – JUMAN出力の終端記号

  • jumanpp (bool) – JUMAN++を用いるかJUMANを用いるか。commandを指定した場合は無視される。

__init__(command='jumanpp', server=None, port=32000, timeout=30, option='', rcfile='', ignorepattern='', pattern='^EOS$', jumanpp=True, multithreading=False)[source]

Initialize self. See help(type(self)) for accurate signature.

juman_lines(input_str)[source]

入力文字列に対して形態素解析を行い、そのJuman出力結果を返す

Parameters

input_str (str) – 文を表す文字列

Returns

Juman出力結果

Return type

str

juman(input_str, juman_format=0)[source]

analysis関数と同じ

analysis(input_str, juman_format=0)[source]

入力文字列に対して形態素解析し、その結果を MList オブジェクトとして返す

Parameters
  • input_str (str) – 文を表す文字列

  • juman_format (JUMAN_FORMAT) – Jumanのlattice出力形式

Returns

形態素列オブジェクト

Return type

MList

result(input_str, juman_format=0)[source]

Juman出力結果に対して、その結果を MList オブジェクトとして返す

Parameters
  • input_str (str) – Juman出力結果

  • juman_format (JUMAN_FORMAT) – Jumanのlattice出力形式

Returns

形態素列オブジェクト

Return type

MList