2025年度前期集中データサイエンス基礎

曜日・時限 不定期その他 期別 前期集中 週時間数 0
ナンバリング
開講学科等 工学部-電気電子工学科
工学部-電子機械工学科
工学部-機械工学科
情報通信工学部-通信工学科
医療健康科学部-医療科学科
医療健康科学部-理学療法学科
医療健康科学部-健康スポーツ科学科
総合情報学部-デジタルゲーム学科
総合情報学部-ゲーム&メディア学科
総合情報学部-情報学科
建築・デザイン学部-建築・デザイン学科 建築専攻
建築・デザイン学部-建築・デザイン学科 空間デザイン専攻
工学部-基礎理工学科 数理科学専攻
工学部-基礎理工学科 環境化学専攻
教員名

目的

 ほとんどの社会活動において, データに基づく意思決定が行われている. その背景にはデータを蓄積し分析できうる情報化社会の進展に依るところが大きい. しかしながら, 間違ったデータ収集, データ蓄積, データ加工, またはデータ分析は意思決定の誤りを招く. 本講義では、データに基づいて意志決定や課題解決を行っていくデータサイエンスの入門編として、人文科学、社会科学、自然科学、いずれの分野においても必要とされる記述統計, 推測統計学の基礎をベースとして重要な統計学の考え方と統計解析の手法を演習形式も含めて習得することを目的とする。
 内閣府AI戦略2021における数理・データサイエンス・AI(応用基礎レベル)のデータサイエンス基礎およびデータエンジニアリング基礎に基づいて, 基本的な概念と手法、応用例を学ぶ。

授業計画

授業回 形式 学修内容 学修課題
1 I:オンデマンド データサイエンスの活用事例と課題
・データ駆動型社会、Society 5.0
・データから価値を見いだす事例(仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替)
・Garbage in Garbage out
・All models are wrong, but some are useful
・All models are wrong, but some are completely wrong
・But we all know the world is nonlinear
事前学修 データサイエンスにおける格言を調べておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(3時間).
2 I:オンデマンド 統計工学①:記述統計
・データをわかりやすく可視化する図表化(1, 2次元の図表化)
・目的に合致したわかりやすいデータの数値要約 
・3次元以上の記述統計
事前学修 配布テキストを予習しておく(2時間).
事後学修 時間内演習と練習問題を解答しておく(3時間).
3 I:オンデマンド 統計工学②:推計統計
・標本調査
・標本調査の妥当生
事前学修 配布テキストを予習しておく(2時間).
事後学修 時間内演習と練習問題を解答しておく(3時間).
4 I:オンデマンド 統計工学③: 相関関係と因果関係
・因果関係と相関関係の違い
・相関関係があるが因果関係は認められない例, 疑似相関の有用性 
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(3時間).
5 I:オンデマンド 統計学と機械学習
・各手法の目的の違い
・ランダム化比較試験(A/Bテストと2019年ノーベル経済学賞の事例を紹介.  喫煙の有無のランダム化比較試験がなぜ行われないのか?)
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(3時間).
6 I:オンデマンド 単回帰
・回帰式
・最小二乗法
重回帰
・住宅販売価格の予測事例
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(3時間).
7 I:オンデマンド ロジスティック回帰
・タイタニックの生存者予測事例
分類モデルの評価
・適合率、再現率、特異度
・ROC曲線, AUC
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(3時間).
8 I:オンデマンド クラスタリングの初歩
・k平均クラスタリング
・階層クラスタリング
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(3時間).
9 I:オンデマンド データマネジメントの基礎
・ICT(情報通信技術)の進展、ビッグデータ
・ビッグデータの収集と蓄積、クラウドサービス
・ビッグデータ活用事例
・スクレイピングとクローニング, その法律
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(2時間).
10 I:オンデマンド 構造化データと非構造化データ
・数値、文章、画像、音声、動画など
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(2時間).
11 I:オンデマンド データクレンジング
・外れ値、異常値、欠損値
・データの標準化、ダミー変数
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(2時間).
12 I:オンデマンド 情報セキュリティの基礎
・セキュリティの3要素(機密性、可用性、完全性)
・データの暗号化、復号化
・分野ごとのセキュリティ事案の紹介とその対策入門
事前学修 配布テキストを予習しておく(2時間)
事後学修 時間内演習と練習問題を解答しておく(2時間).
13 I:オンデマンド まとめと総合演習 事前学修 配布テキストを予習しておく(2時間).
事後学修 時間内演習と練習問題を解答しておく(2時間).

授業形式記号

  • A:一斉授業(通常の講義)
  • B:問題発見・解決学習、プロジェクト学習
  • C:体験、実験、実習、演習など
  • D:調査 分析、解析など
  • E:ものづくり、作品制作
  • F:グループワーク(ディスカッション・ディベートを含む)
  • G:プレゼンテーション
  • H:地域・企業 連携型学習
  • I:その他

到達目標

〇2024年度以降の入学生
下記リンク先のカリキュラム・マップを参照
URL:https://www.osakac.ac.jp/about/policy/faculty/

〇2023年度以前の入学生
 ○取得する資質・能力: 知識・理解力、応用力【DP-P-1-1】 【DP-F-1-1】 【DP-T-1-1】
 1. 統計的検定・推定の考え方を理解できる.
 2. 統計学と機械学習の目的の違いを理解できる.
 3. アンケートの作成、調査、分析を通して、データを収集する際の留意点を理解し、WordやPowerPointを使って、分析結果を表現することができる.

 ○取得する資質・能力: コミュニケーション力【DP-E-2-2】 【DP-H-2-2】 【DP-J-2-2】 【DP-N-2-2】 【DP-U-2-2】 【DP-C-2-1】 【DP-P-2-2】 【DP-F-2-2】 【DP-L-2-2】 【DP-Y-2-2】 【DP-S-2-2】 【DP-W-2-2】 【DP-B-2-2】 【DP-T-2-1】
 1. 講義内で与えられる, または, 取得したデータに対する統計処理をRやPythonを用いて行うことができる. 

 〇修得する資質・能力:態度・志向力 【DP-E-3-2】 【DP-H-3-2】 【DP-J-3-3】 【DP-N-3-2】 【DP-U-3-1】 【DP-C-3-1】 【DP-P-3-3】 【DP-F-3-2】 【DP-L-3-3】 【DP-Y-3-4】 【DP-S-3-2】 【DP-W-3-2】 【DP-B-3-2】 【DP-T-3-1】
 1. データ・AIを利活用する際に求められるモラルや倫理について理解する.

評価方法と評価観点

評価方法 配点合計知識・理解力応用力コミュニケーション力態度・志向性創造力 合計
定期試験またはレポート試験 50% 100% 100%
小テスト、小論文 30% 80% 10% 10% 100%
グループワーク 0%
プレゼンテーション 0%
レポート、宿題 20% 70% 10% 20% 100%
授業での姿勢(ノート、質疑など) 0%
作品、パフォーマンス(実技、実演) 0%
その他1(具体的に: 0%
その他2(具体的に: 0%
100% 88% 5% 3% 0% 4% 100%

教科書・参考書

データサイエンスのための統計学入門 第2版-予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング- Peter Bruce、Andrew Bruce、 Peter Gedeck 著、黒川 利明 訳、大橋 真也 技術監修 

オフィスアワー

moodle上で質問を受け付ける.

その他

授業内外の課題について,解答あるいは考え方を適宜解説する.
期末試験は,希望があれば,解答例あるいは総評を適宜開示する.

本科目はGoogle Colaboratory上でRやPythonを使用して統計解析を行う。それらの使い方を学ぶ授業ではないため、簡易な導入の説明は行うがRやPythonの基本的な操作は事前に学習しておくことが望ましい。

実務経験のある教員による授業科目