Course title
N2860200,P2860500,Q2860400,R2860300,V28601002
Data Science

HARADA Takuya

MOCHINAGA Dai

NAKAI Yutaka
Course description
本授業では、数理・データサイエンス・AI教育におけるデータサイエンスの基礎及びデータエンジニアリングの基礎を修得する。また、これらの基礎を実施する手法を習得する。

本授業の履修を希望する場合、以下の2つに取り組んでください。
・ガイダンス動画を閲覧する
・ガイダンス動画に基づく事前テストに受験する

2025年度前期の締め切りは決定次第連絡します。ガイダンス動画と事前テストのURLは学生課からメールで連絡します。
Purpose of class
データサイエンスおよびデータエンジニアリングの基本的な概念と手法、応用例を学ぶことで、データから意味を抽出し、現場にフィードバックするためのプロセスを経験する 。さらに、実際にデータの分析や可視化を行うことで、日進月歩するデータサイエンスおよびデータエンジニアリングを自ら学ぶ姿勢を身につける。
Goals and objectives
  1. データサイエンスの基本的な概念と手法を説明できる。
  2. データエンジニアリングの基本的な概念と手法を説明できる。
  3. 日進月歩するデータサイエンスおよびデータエンジニアリングを自ら学ぶ姿勢を身につける。
Relationship between 'Goals and Objectives' and 'Course Outcomes'

テスト 毎回の課題 Total.
1. 25% 10% 35%
2. 25% 10% 35%
3. 0% 30% 30%
Total. 50% 50% -
Language
Japanese
Class schedule

Class schedule HW assignments (Including preparation and review of the class.) Amount of Time Required
1. イントロダクション
・データ駆動型社会とデータサイエンス
・ビッグデータとデータエンジニアリング
配布資料の指示に従い自ら調べること 100minutes
PythonとPandasの基礎を学習すること 100minutes
2. データエンジニアリング:Pythonの基礎
・PythonとPandas
配布資料の指示に従い自ら調べること 100minutes
PythonとPandasの基礎を学習すること 100minutes
3. データエンジニアリング:Pythonの演習
・PythonとPandas
配布資料の指示に従い自ら調べること 100minutes
PythonとPandasの基礎を学習すること 100minutes
4. これまでの振り返り これまでの内容を復習し、理解が浅い箇所は自ら調べる身につけること 200minutes
5. データエンジニアリング:データハンドリング
・データの前処理
・データ型
・欠損値、異常値
・標準化
配布資料の指示に従い自ら調べること 100minutes
データの前処理方法の予習と復習をする 100minutes
6. 教師あり学習・教師なし学習の特徴と解説、分析と可視化(1)
・重回帰分析
配布資料の指示に従い自ら調べること 100minutes
教師あり・教師なし学習の方法の予習と復習をする 100minutes
7. 教師あり学習・教師なし学習の特徴と解説、分析と可視化(2)
・主成分分析
配布資料の指示に従い自ら調べること 100minutes
教師あり・教師なし学習の予習と復習をする 100minutes
8. 自然言語処理の特徴と解説、分析と可視化
・スクレイピング
・テキストマイニング
・出現頻度・共起ネットワーク
・ベクトル化
配布資料の指示に従い自ら調べること 100minutes
自然言語処理の予習と復習をする 100minutes
9. 教師あり学習・教師なし学習の特徴と解説、分析と可視化(3)
・ロジスティック回帰
配布資料の指示に従い自ら調べること 100minutes
教師あり・教師なし学習の方法の予習と復習をする 100minutes
10. 教師あり学習・教師なし学習の特徴と解説、分析と可視化(4)
・過学習
・汎化性能
配布資料の指示に従い自ら調べること 100minutes
教師あり・教師なし学習の方法の予習と復習をする 100minutes
11. 深層学習の特徴と解説、分析と可視化(1)
・ニューラルネットワークの仕組み
・ニューラルネットワークを用いたベクトルデータの2クラス分類
配布資料の指示に従い自ら調べること 100minutes
深層学習について予習と復習をする 100minutes
12. 深層学習の特徴と解説、分析と可視化(2)
・深層学習の仕組み
・深層学習の利活用
・深層学習を用いた画像の他クラス分類
配布資料の指示に従い自ら調べること 100minutes
深層学習について予習と復習をする 100minutes
13. 深層学習の特徴と解説、分析と可視化(3)
・大規模言語モデルの利活用
・大規模言語モデルを用いたアプリケーション開発
・プロンプト
・Retrieval-Augmented Generation
配布資料の指示に従い自ら調べること 100minutes
深層学習について予習と復習をする 100minutes
14. 深層学習の特徴と解説、分析と可視化(4)
・大規模言語モデルを用いたアプリケーションの評価
配布資料の指示に従い自ら調べること 100minutes
深層学習について予習と復習をする 100minutes
Total. - - 2800minutes
Evaluation method and criteria
毎回出題するテストと課題によって評価する。各回の要点を説明でき、かつデータの分析、可視化を最低限体験できたことを60点の目安とする。
Feedback on exams, assignments, etc.
ways of feedback specific contents about "Other"
授業内と授業外でフィードバックを行います。
Textbooks and reference materials
なし
Prerequisites
なし。ただし、授業ではPythonを用いるので、インターネットや書籍を用いて積極的に予習をしておくことを期待する。
Office hours and How to contact professors for questions
  • 授業後に講義室か研究室、もしくはメールやグループウェアで連絡してください。
Regionally-oriented
Non-regionally-oriented course
Development of social and professional independence
  • Course that cultivates an ability for utilizing knowledge
  • Course that cultivates a basic problem-solving skills
Active-learning course
Most classes are interactive
Course by professor with work experience
Work experience Work experience and relevance to the course content if applicable
Applicable 民間企業に勤める特別講師による特別講義あり。データサイエンスが企業でどのように用いられているかを知ることができる。
Education related SDGs:the Sustainable Development Goals
  • 1.NO POVERTY
  • 2.ZERO HUNGER
  • 3.GOOD HEALTH AND WELL-BEING
  • 4.QUALITY EDUCATION
  • 5.GENDER EQUALITY
  • 6.CLEAN WATER AND SANITATION
  • 7.AFFORDABLE AND CLEAN ENERGY
  • 8.DECENT WORK AND ECONOMIC GROWTH
  • 9.INDUSTRY, INNOVATION AND INFRASTRUCTURE
  • 10.REDUCED INEQUALITIES
  • 11.SUSTAINABLE CITIES AND COMMUNITIES
  • 12.RESPONSIBLE CONSUMPTION & PRODUCTION
  • 13.CLIMATE ACTION
  • 14.LIFE BELOW WATER
  • 15.LIFE ON LAND
  • 16.PEACE, JUSTICE AND STRONG INSTITUTIONS
  • 17.PARTNERSHIPS FOR THE GOALS
Last modified : Fri Mar 28 02:04:16 JST 2025