シラバス情報

授業科目名
データサイエンスII
学年
1年
単位数
2.00単位
実務経験の有無
開講クォーター
セメスタ指定なし
担当教員
小松 悟朗
授業形態
授業で主に使用する言語
日本語
授業方法区分
開講キャンパス
オンライン(オンデマンド)
授業の到達目標及びテーマ
-------------------------------
※本講義はオンデマンド授業です。
-------------------------------

本講義では、データサイエンスIの内容をもとに、プログラミングの基礎とデータ分析の実践を学ぶ。

データサイエンスで主流のRを用いてプログラミングを学びながら、実際のデータ分析事例を題材にデータサイエンスの実践を行う。

実際に手を動かしさまざまなデータ分析を行うことで、データサイエンティストとして第1歩を踏み出すことを目指す。


キーワード:
データサイエンティスト、プログラミング、ランダム化比較試験、因果推論、記述統計、データビジュアライゼーション、クラスター化、回帰分析、予測、R


紹介動画:
https://jiu.webex.com/jiu/ldr.php?RCID=637d96714b4acdf46d6de4baf2d2fee8

Password:
Ab9WdAxJ


授業の概要
本講義は、文科省「数理・データサイエンス・AI(応用基礎レベル)」の内容に準拠している。

事前の統計学やプログラミングの知識は仮定しない。
統計学やプログラミングに興味のある初心者の受講を歓迎する。

期末プロジェクト課題では、自らデータを集めデータ分析プロジェクトを実施する。
データサイエンティストとしての第1歩を踏み出すことを目指す。


講義スケジュール

I Rとプログラミングの基礎
01 Rの基礎 (1)ーRのインストール, 演算, オブジェクト
02 Rの基礎 (2)ーベクトル, 関数
03 Rの基礎 (3)ーデータファイル
04 Rの基礎 (4)ー練習問題

II 因果関係
05 因果関係 (1)ーデータの部分集合化
06 因果関係 (2)ーランダム化比較試験
07 因果関係 (3)ー観察研究, 1変数の記述統計量

III 測定
08 測定 (1)ー欠損データ, データのビジュアル化
09 測定 (2)ー2変量関係の要約
10 測定 (3)ークラスター化

IV 予測
11 予測 (1)ーループと条件文
12 予測 (2)ー線形回帰
13 予測 (3)ー回帰分析と因果関係, RMarkdown

授業計画
1回
01 Rの基礎 (1)ーRのインストール, 演算, オブジェクト
・データ加工 (集計処理、四則演算処理)
・プログラミング基礎 (文字型、整数型、浮動小数点型)
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

2回
02 Rの基礎 (2)ーベクトル, 関数
・データ加工 (集計処理、四則演算処理)
・プログラミング基礎 (文字型、整数型、浮動小数点型)
・ベクトルと行列
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

3回
03 Rの基礎 (3)ーデータファイル
・データベース (データ操作)
・データ加工 (集計処理、四則演算処理、クレンジング処理 (外れ値、異常値、欠損値))
・プログラミング基礎 (関数、引数、戻り値)
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

4回
04 Rの基礎 (4)ー練習問題
・データ観察 (データの集計、比較対象の設定)
・データベース (データ操作)
・データ加工 (ソート処理、サンプリング処理)
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

5回
05 因果関係 (1)ーデータの部分集合化
・データ観察 (データの集計、比較対象の設定、クロス集計表)
・データ加工 (ソート処理、サンプリング処理、データ型変換処理、データの標準化・ダミー変数)
・プログラミング基礎 (変数、代入、四則演算、論理演算、順次、分岐、反復の構造を持つプログラムの作成)
・相関係数、相関関係と因果関係
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

6回
06 因果関係 (2)ーランダム化比較試験
・データ観察 (データの集計、比較対象の設定、クロス集計表)
・データ加工 (結合処理 (内部結合、外部結合))
・相関係数、相関関係と因果関係
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

7回目
07 因果関係 (3)ー観察研究, 1変数の記述統計量
・データ観察 (データの集計、比較対象の設定、クロス集計表)
・データ加工 (結合処理 (内部結合、外部結合))
・代表値(平均値、中央値、最頻値)、分散、標準偏差
・相関係数、相関関係と因果関係
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

8回
08 測定 (1)ー欠損データ, データのビジュアル化
・データ観察 (データの集計、比較対象の設定、クロス集計表、データのバラツキ、ヒストグラム、散布図)
・データ可視化 (可視化目的(比較、構成、分布、変化など)に応じた図表化、1~3次元の図表化(棒グラフ、折線グラフ、散布図、積み上げ縦棒グラフ、箱ひげ図)
・データ加工 (クレンジング処理 (外れ値、異常値、欠損値))
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

9回
09 測定 (2)ー2変量関係の要約
・データ観察 (データの集計、比較対象の設定、クロス集計表、データのバラツキ、ヒストグラム、散布図)
・データ可視化 (可視化目的(比較、構成、分布、変化など)に応じた図表化、1~3次元の図表化(棒グラフ、折線グラフ、散布図、積み上げ縦棒グラフ、箱ひげ図)
・データ加工 (データの標準化・ダミー変数)
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

10回
10 測定 (3)ークラスター化
・データ分析 (クラスター分析)
・データ可視化 (可視化目的(比較、構成、分布、変化など)に応じた図表化、散布図)
・データ加工 (結合処理 (内部結合、外部結合)、データの標準化・ダミー変数)
・ベクトルと行列 (ベクトルの演算、行列の演算、行列の和とスカラー倍、行列の積)
・機械学習 (教師あり学習、教師なし学習)
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

11回
11 予測 (1)ーループと条件文
・データ観察 (データの集計、比較対象の設定)
・データ分析 (クラスター分析、時系列データ、時系列グラフ)
・データ加工 (集計処理、四則演算処理、ソート処理、サンプリング処理、結合処理 (内部結合、外部結合))
・プログラミング基礎 (順次、分岐、反復の構造を持つプログラムの作成)
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

12回
12 線形回帰
・データ観察 (データの集計、比較対象の設定、散布図)
・データ分析 (単回帰分析、最小二乗法)
・データ加工 (クレンジング処理 (外れ値、異常値、欠損値)、結合処理 (内部結合、外部結合))
・相関係数、相関関係と因果関係
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

13回
13 回帰分析と因果関係
・データ分析 (単回帰分析、重回帰分析、最小二乗法)
・データ収集、データ加工 (データの標準化・ダミー変数)
・相関係数、相関関係と因果関係
事前学習
(2時間) テキストの指定箇所を読み、不明点を明らかにする。
事後学習
(2時間) 課題を解き、解答を提出する。

14回
事前学習
事後学習

15回
事前学習
事後学習

16回
事前学習
事後学習

17回
事前学習
事後学習

18回
事前学習
事後学習

19回
事前学習
事後学習

20回
事前学習
事後学習

21回
事前学習
事後学習

22回
事前学習
事後学習

23回目
事前学習
事後学習

24回
事前学習
事後学習

25回
事前学習
事後学習

26回
事前学習
事後学習

試験及び成績評価
課題: 50%
期末レポート: 50%
課題(試験やレポート等)に対するフィードバック
Universal Passportや動画を通じて適宜行う。
講義で使用するテキスト(書名・著者・出版社・ISBN・備考)
社会科学のためのデータ分析入門 (上)
今井耕介
岩波書店
978-4000612456
2018年
参考文献・推薦図書
社会科学のためのデータ分析入門 (下)
今井耕介
岩波書店
ISBN: 978-4000612463
2018年
研究室
オンライン授業のため、オンラインで受け付ける。
事前にアポイントメントを取ること。
オフィスアワー
質問がある場合は、Universal Passportの「授業Q&A」に入力すること。
科目ナンバリング
学位授与方針との関連
関連ページ