対話形式議事録は,口語での会話内容が記録されており,言語研究において重要な資料となる.対話形式議事録の1つである帝国議会議事速記録は,記録期間が長く分量も多いという特徴があり,近代における言語表現の変化を分析するのに適した資料であるといえる. このようなテキストデータに対して分析の第一段階である表現抽出を自動で行う手法については知見が少なく,抽出作業のほとんどが手作業で行われているのが現状である.大規模なデータに対して手作業での該当表現の抽出を行うのには多大な労力がかかり,見逃しも発生しやすく,分析を行う上でのボトルネックとなる. 本研究では,抽出段階の自動化を目的とし,可能の意味を表す可能表現について,品詞の組み合わせマッチングによる自動抽出を試みた.さらに,可能表現の出現頻度や変遷と会議の話題の関係性を分析するための先駆けとして,重要単語抽出による話題の自動タグ付けを行った.話題タグの自動付与においては,TF-IDFを用いたシンプルな特徴単語の抽出を試みた.可能表現の抽出においては,文型に注目した品詞のパターンマッチングによる抽出を試みた.