データ研磨
DATA Polishing

本講義は、TDBが実施してきた集中講義「データエンジニアリング人材養成演習」を、滋賀大学データサイエンス学部のカリキュラム改訂により、2021年度から単位科目として設置されたものです。
毎年、約100名の受講者となり、滋賀大学でのデータサイエンティスト育成に貢献しています。

本講義の目的は、「研磨済みデータ」を独力で正確に作成・評価できる人材を養成し、その人材がデータサイエンスによる付加価値創出に貢献することです。地域経済分析システムRESASにおいて実際に搭載されているオープンデータのデータ研磨事例などの実践処理を通じ、実践的なデータ研磨能力を獲得することを目指します。
また、企業でデータ活用を業務として取り組んでいるデータサイエンティストを招聘し、実ビジネスにおいてどのようなデータ分析を行っているのかを学び、使用されているソフトウェアに関する講演も行っています。
学部生は本講義を受講後に、DEMLセンターに入所することができます。

実際に講義で行うデータ研磨の一例
  • 〈データ研磨前〉
    2008年~2015年の各市区町村別決算概要ファイル

    2008年~2015年の各市区町村別決算概要ファイル
  • 〈データ研磨後〉
    8つの各ファイルを1つにまとめたファイル

    8つの各ファイルを1つにまとめたファイル

〈処理のイメージ図〉

処理のイメージ図

授業計画

本講義はR言語(UIはRstudio)を利用します。
講義の前半はデータ利活用のためのデータリテラシと基礎的なスキルの習得を目指します。必要なスキルと実例を紹介し、演習課題に取り組みます。
講義の後半では、オープンデータを利用したデータ研磨の演習課題を実施します。課題として利用するデータベースは5つ以上用いており、中にはRESASに搭載されているデータ研磨を行うものもあります。