Skip to content

文部科学省が公開している大学一覧のエクセルファイルから、大学情報をパースしデータとして使いやすい形で出力するプログラムです。

License

Notifications You must be signed in to change notification settings

RikitoNoto/japanese-school-parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

43 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

JapaneseSchoolPaser

文部科学省が公開している大学一覧のエクセルファイルから、大学情報をパースしデータとして使いやすい形で出力するプログラムです。

使い方

使用にはPythonの実行環境が必要です。

  1. 文部科学省のサイトよりエクセルファイルをダウンロードします。

  2. Json出力の場合、以下のpythonコマンドを実行し、出力を行います。

    python japanese_school_parser.py <入力Excelファイルパス> <出力ファイルパス>
    #
    python japanese_school_parser.py 20220415_mxt_daigakuc01_000021808_03-7.xlsx 20220415_mxt_daigakuc01_000021808_03-7.json
    # => コマンドを実行したディレクトリに20220415_mxt_daigakuc01_000021808_03-7.jsonが生成されます。

    Pythonのdict型で出力を行いたい場合は以下の関数を呼び出します。

    schools = parse_schools_to_dict(source_path)

実装状況

出力形式

  • Json
  • Python dict型
  • yaml

出力内容

学校基本情報

  • 学校コード
  • 学長
  • 学長任期
  • 所在地
  • 電話番号

設置者情報

  • 設置者
  • 役職
  • 役職者名

学部・研究科所在地(キャンパス名など)

  • 名称
  • 所在地
  • 電話番号

国立大学附置研究所

  • 附置研究所名
  • 所在地住所
  • 電話番号
  • 設置年月日
  • 備考

国立大学附置研究所附属施設

  • 附置研究所名
  • 附属施設
  • 所在地住所
  • 電話番号

学部

  • 学部
  • 学科
  • 都道府県
  • 市区町村
  • 修業年限
  • 入学定員
  • 編入定員
  • 編入(夜間)

研究科

  • 研究科
  • 専攻
  • 都道府県
  • 市区町村
  • 夜間昼夜
  • 修士/博士 前期課程
  • 博士後期課程
  • 博士課程(一貫制)
  • 専門職学位課程
  • 編入定員

学部沿革

  • 年月
  • 沿革

大学院沿革

  • 年月
  • 沿革

貢献

現状作成者が個人的に使用する部分のみ実装しています。

Issueでご要望があれば追加実装を行います。

Pullrequestもお待ちしています。

備考

出典:文部科学省ホームページ

本プログラムは上記出典のデータを加工して出力しています。

About

文部科学省が公開している大学一覧のエクセルファイルから、大学情報をパースしデータとして使いやすい形で出力するプログラムです。

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages