教員名 : 寺原 譲治
|
授業科目名
データサイエンスI
学年
1年
単位数
2.00単位
実務経験の有無
開講クォーター
セメスタ指定なし
担当教員
寺原 譲治
授業形態
授業で主に使用する言語
日本語
授業方法区分
開講キャンパス
オンライン(オンデマンド)
授業の到達目標及びテーマ
-------------------------------
※本講義はオンデマンド授業です。 ※必ずMicrosoft OfficeをインストールしたWindows PCまたはMacを用意してください: ・iPadなどのタブレット端末では、演習を行うことができません ・また、ブラウザ版のOfficeでも、演習を行うことができません ・PCまたはMacを持っていない方は、授業前に用意するか、図書館のPC等を活用してください ※Microsoft Officeのインストール方法は、第2回の講義で説明します。 ------------------------------- 本講義では、データサイエンスをはじめて学ぶ学生を対象に、データサイエンスの基本を学ぶ。 そのために、本講義は導入、基礎、心得の3つを学ぶ。 導入では、近年のデータサイエンスやAIの発展を学ぶ。 データサイエンスが、私たちの日常生活や組織・社会にいかに役立っているか、そして今後どのように役立つかを詳しく学ぶ。 基礎では、教員と一緒にExcelによるデータ演習を行う。 自らデータを読みこなし、説明し、データから価値を引き出す基礎スキルを身につける。 心得では、今後データを扱っていく場合に気をつけるべき事項を学ぶ。 データ倫理の問題など、データサイエンスを活用する場面での留意事項を学ぶ。 授業の最後には、これら導入・基礎・心得をもとに、自らデータを集め分析を行う「データ分析プロジェクト」を実践する。 本講義を通じて、データ・AI時代のデータサイエンス・リテラシーの習得を目指す。 紹介動画: https://jiu.webex.com/jiu/ldr.php?RCID=373a06759505d8520d0b8a054864f9af Password: aGpjn4wq 授業の概要
本講義は、文科省「数理・データサイエンス・AI(リテラシーレベル)」の内容に準拠している。
事前の統計学や数学、またExcelの知識は仮定しない。 第1週 1 (講義) 導入 1-1 社会で起きている変化 2 (Excel演習) 基礎 2-1 データを読む 第2週 3 (講義) 導入 1-2 社会で活用されているデータ 4 (Excel演習) 基礎 2-1 データを読む (続き) 第3週 5 (講義) 導入 1-3 データ・AIの活用領域 6 (Excel演習) 基礎 2-2 データを説明する 第4週 7 (講義) 導入 1-4 データ・AI利活用のための技術 8 (Excel演習) 基礎 2-2 データを説明する (続き) 第5週 9 (講義) 導入 1-5 データ・AI利活用の現場 10 (Excel演習) 基礎 2-3 データを扱う 第6週 11 (講義) 導入 1-6 データ・AI利活用の最新動向 12 (講義) 心得 3-1 データ・AIを扱う上での留意事項、データ分析プロジェクト(1/2) 第7週 13 (講義) 心得 3-2 データを守る上での留意事項、データ分析プロジェクト(2/2) 授業計画
1回
(講義) 導入 1-1 社会で起きている変化
1.1.1 ビッグデータ ビットとバイト、ムーアの法則、3V、GAFA 1.1.2 検索エンジンとSNS EC、パーソナライゼーション、スマートフォン 1.1.3 第4次産業革命、データ駆動型社会 1.1.4 AIの驚異的発達、機械学習、深層学習、深層ニューラルネットワーク 1.1.5 人間の知的活動とAI 帰納法(データを起点としたものの見方)と演繹法、人間の知的活動を起点としたものの見方、第4次産業革命、Society 5.0、超スマート社会 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
2回
(Excel演習) 基礎 2-1 データを読む
2.1.1 データの種類 質的変数と量的変数、データ尺度 2.1.2 データの分布と代表値 ヒストグラム、平均値、中央値、最頻値 2.1.3 代表値の性質の違い 2.1.4 データのばらつき 分散、標準偏差、偏差値 2.1.5 観測データに含まれる誤差の扱い 2.1.6 打ち切りや脱落を含むデータ,層別の必要なデータ 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
3回
(講義) 導入 1-2 社会で活用されているデータ
1.2.1 データの種類 調査データ、ログデータ、実験データ、観測データ 1.2.2 データの所有者 1次/2次/3次/4次データ、データのオープン化(オープンデータ)、メタデータ(データのメタ化) 1.2.3 構造化データと非構造化データ、データ作成(ビッグデータとアノテーション)、SQL、特定物体認識、一般物体認識 1.2.4 自動翻訳 自然言語、プログラミング言語(C, Pythonなど) 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
4回
(Excel演習) 基礎 2-1 データを読む (続き)
2.1.7 相関と因果性 相関係数、因果性、交絡因子、疑似相関 2.1.8 母集団と標本抽出 単純無作為抽出法、層別抽出・層化抽出、多段抽出法 2.1.9 クロス集計表,相関係数行列,散布図行列 2.1.10 統計情報の正しい理解 生態学的相関 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
5回
(講義) 導入 1-3 データ・AIの活用領域
1.3.1 事業活動におけるデータ・AI活用の広がり(生産、消費、文化活動など) 研究開発・購買物流調達・製造・出荷物流・マーケティング・販売・サービスにおけるデータ・AI利活用 1.3.2 活用目的ごとのデータ・AI活用の広がり 仮説検証・知識発見・原因究明・計画策定・判断支援・活動代替・新規生成におけるデータ・AI利活用 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
6回
(Excel演習) 基礎 2-2 データを説明する
2.2.1 データの表現 棒グラフ、円グラフ、帯グラフ、散布図、折れ線グラフ、ヒートマップ 2.2.2 データの図解表現 データの可視化、チャート 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
7回目
(講義) 導入 1-4 データ・AI利活用のための技術
1.4.1 誰もが無意識にデータを解析して生きている 1.4.2 さまざまなデータ解析—予測 線形回帰、補間 1.4.3 さまざまなデータ解析—グルーピングとクラスタリング 1.4.4 さまざまなデータ解析—発見 相関分析、頻出パターン分析 1.4.5 データ解析の関連話題 最適化、シミュレーション、データ同化 1.4.6 非構造化データ処理 画像認識、音声処理 1.4.7 データ可視化 1.4.8 認識技術、ルールベース、自動化技術 1.4.9 人工知能 特化型AI、汎用AI 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
8回
(Excel演習) 基礎 2-2 データを説明する (続き)
2.2.3 データの比較 箱ひげ図、処置群と対象群 2.2.4 不適切なグラフ表現 2.2.5 優れた可視化の例 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
9回
(講義) 導入 1-5 データ・AI利活用の現場
1.5.1 データ分析による意思決定 説明的データ分析、予測的データ分析、指示的データ分析、効用関数 1.5.2 情報技術による自動化 1.5.3 データ分析・自動化の実際 CRISP-DM (CRoss-Industry Standard Process for Data Mining) 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
10回
(Excel演習) 基礎 2-3 データを扱う
2.3.1 表形式のデータ csvファイル 2.3.2 データ解析ツール Excel、xls/xlsxファイル 2.3.3 SSDSEデータを扱う 教育用標準データセット (Standard Statistical Data Set for Education)、データの集計(和・平均)、データの並び替え・ランキング、ヒストグラムの作成、散布図の作成 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
11回
(講義) 導入 1-6 データ・AI利活用の最新動向
1.6.1 AI等を活用した新しいビジネスモデル シェアリングエコノミー、サーベイランス、デジタルトランスフォーメーション 1.6.2 AI最新技術の活用例 敵対的生成ネットワーク、強化学習、自動運転、転移学習 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
12回
(講義) 心得3-1 データ・AIを扱う上での留意事項、データ分析プロジェクト(1/2)
3.1.1 ELSI (Ethical, Legal and Social Issues) 3.1.2 個人情報保護 EU一般データ保護規則 General Data Protection Regulation (GDPR) 、忘れられる権利、オプトアウト 3.1.3 データ倫理 データのねつ造、改ざん、盗用、プライバシー保護 3.1.4 AI社会原則 公平性、説明責任、透明性、人間中心の判断 3.1.5 データバイアス、アルゴリズムバイアス、説明責任、トラスト 3.1.6 AIサービスの責任論、ブラックボックス化 3.17 データ・AI活用における負の事例紹介 フラッシュクラック データ分析プロジェクト(1/2) 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
13回
(講義) 心得3-2 データを守る上での留意事項、データ分析プロジェクト(2/2)
3.2.1 情報セキュリティ 情報セキュリティ三原則(機密性、完全性、可用性)、暗号化、パスワード、リスク、脅威 3.2.2 匿名加工情報 個人情報、個人識別符号、要配慮個人情報、仮名化、匿名化、k-匿名化 3.3.3 悪意ある情報搾取、情報漏洩等によるセキュリティ事故の事例紹介 外部要因による情報漏洩事例、内部要因による情報漏洩事例 データ分析プロジェクト(2/2) 事前学習
(2時間) テキストの指定箇所を読む
事後学習
(2時間) 課題を提出する
14回
事前学習
事後学習
15回
事前学習
事後学習
16回
事前学習
事後学習
17回
事前学習
事後学習
18回
事前学習
事後学習
19回
事前学習
事後学習
20回
事前学習
事後学習
21回
事前学習
事後学習
22回
事前学習
事後学習
23回目
事前学習
事後学習
24回
事前学習
事後学習
25回
事前学習
事後学習
26回
事前学習
事後学習
試験及び成績評価
(1) 理解度確認テスト: 35%
(2) Excel演習: 25% (3) データ分析プロジェクト: 10% (4) 期末Take-Home Exam: 30% 課題(試験やレポート等)に対するフィードバック
Universal Passportや動画を通じて適宜行う。
講義で使用するテキスト(書名・著者・出版社・ISBN・備考)
教養としてのデータサイエンス (データサイエンス入門シリーズ),北川 源四郎・竹村 彰通 他,講談社,978-4065238097,2021年
参考文献・推薦図書
データサイエンス入門 (岩波新書)
竹村 彰通 岩波新書 978-4004317135 2018年 研究室
オンデマンド授業のため、オンラインで受け付ける。
事前にアポイントメント取ること。 オフィスアワー
質問がある場合は、Universal Passportの「授業Q&A回答」に入力すること。
科目ナンバリング
学位授与方針との関連
関連ページ
|