Welcome to Scribd!

0% found this document useful (0 votes)

72 views

E1 277 January-April 3:1 Reinforcement Learning: Instructor

Uploaded by

This document provides information about a reinforcement learning course including the instructor, teaching assistants, schedule, prerequisites, syllabus, course outcomes, grading policy, and resources. The course deals with probabilistic models and algorithms for dynamic decision making under uncertainty, covering topics like stochastic dynamic programming, Q-learning, temporal difference learning, and actor-critic algorithms. Students will learn modeling and analysis techniques that can be applied to problems involving sequential decision making and will gain an understanding of commonly used reinforcement learning algorithms.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

E1 277 January-April 3:1 Reinforcement Learning: Instructor

Uploaded by

praveen

0% found this document useful (0 votes)

72 views2 pages

Original Description:

Signal

Original Title

E1277

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

72 views2 pages

E1 277 January-April 3:1 Reinforcement Learning: Instructor

Uploaded by

praveen

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 2

Search inside document

E1 277 January-April 3:1

Reinforcement Learning

Instructor
Shalabh Bhatnagar
Email: [email protected]
Teaching Assistant
Sindhu P.R., Raghuram Bharadwaj
Email: [email protected], [email protected]

Department: Computer Science and Automation

Course Time: Tuesday/Thursday 9:30-11:00
Lecture venue: CSA 252
Detailed Course Page:

Announcements

Brief description of the course

The course deals with probabilistic models for problems of dynamic decision making under uncertainty.

Stochastic dynamic programming is a general framework for modelling such problems. However, one requires

knowledge of transition probabilities (i.e., the system dynamics) as well as the associated cost function. Both

of these quantities are normally not known and one only has access to data that is available from the

experiment. For instance, one may not know the transition probabilities but one may see what the next state is

given the current state and the action or control chosen. The course deals with building first the model based

dynamic programming techniques and subsequently the model free, data driven algorithms, and deals with the

theoretical foundations of these.

Prerequisites
Any student who has done the course E0 232 -- Probability and Statistics or an equivalent probability course.
Syllabus
Introduction to reinforcement learning, introduction to stochastic dynamic programming, finite and infinite

horizon models, the dynamic programming algorithm, infinite horizon discounted cost and average cost

Page 1/2
problems, numerical solution methodologies, full state representations, function approximation techniques,

approximate dynamic programming, partially observable Markov decision processes, Q-learning, temporal

difference learning, actor-critic algorithms.

Course outcomes
The students will get to know modelling and analysis tools and techniques for problems of dynamic decision

making under uncertainty. They will know the algorithms they can apply when faced with such problems and

the convergence and accuracy guarantees that such algorithms would provide.
Grading policy
Two mid term exams, One course project, and One final exam
Assignments

Resources

Page 2/2

syllabus-ELG7113MCG5470 w2024
Document4 pages
syllabus-ELG7113MCG5470 w2024
Adil Majeed
No ratings yet
Business Dynamics and System Modeling Syllabus
Document8 pages
Business Dynamics and System Modeling Syllabus
Pard Teekasap
No ratings yet
Syllabus For Buan-Opre 6398.001 - Sp22
Document7 pages
Syllabus For Buan-Opre 6398.001 - Sp22
SHRUTI KHANNA
No ratings yet
LUMS EE - 3rd Year Course Outlines
Document34 pages
LUMS EE - 3rd Year Course Outlines
Ahsan Ahmed Moin
No ratings yet
DP Phys Topic 2 1 Unit Planner STDN
Document5 pages
DP Phys Topic 2 1 Unit Planner STDN
api-196482229
No ratings yet
Course Outline-FS13-EE 801 Analysis of Stochastic Systems-MUI
Document3 pages
Course Outline-FS13-EE 801 Analysis of Stochastic Systems-MUI
Sara Afzal
No ratings yet
Schaum's Outline of Strength of Materials, Seventh Edition
From Everand
Schaum's Outline of Strength of Materials, Seventh Edition
Merle C. Potter
Rating: 4.5 out of 5 stars
4.5/5 (9)
Strahlenfolter Stalking - TI - GBPPR Mind Control Devices and Experiments
Document19 pages
Strahlenfolter Stalking - TI - GBPPR Mind Control Devices and Experiments
Karl-Hans-Rohn
No ratings yet
Marshall University Department of Mathematics Student Information Sheet and Syllabus
Document4 pages
Marshall University Department of Mathematics Student Information Sheet and Syllabus
Las Ukcu
No ratings yet
EE 564-Stochastic Systems-Momin Uppal
Document3 pages
EE 564-Stochastic Systems-Momin Uppal
Waseem Abbas
No ratings yet
Automated Problem and Solution Generation Software For Computer Aided Instruction in Elementary Linear Circuit Analysis
Document19 pages
Automated Problem and Solution Generation Software For Computer Aided Instruction in Elementary Linear Circuit Analysis
elbarkanima
No ratings yet
ECON 330 Outline - 2023
Document6 pages
ECON 330 Outline - 2023
UmmeKalsoom Shah
No ratings yet
IJCRT24A4501
Document4 pages
IJCRT24A4501
samiksha gangurde
No ratings yet
WVSU Education 300 Technology Unit Lesson Plan: Teacher Candidate School Name Class/Grade Level Lesson Topic Subject
Document34 pages
WVSU Education 300 Technology Unit Lesson Plan: Teacher Candidate School Name Class/Grade Level Lesson Topic Subject
api-385032400
No ratings yet
MGMT E-104: Quantitative Methods For Economics and Finance: Course Overview
Document7 pages
MGMT E-104: Quantitative Methods For Economics and Finance: Course Overview
miguel
No ratings yet
EE 564-Stochastic Systems-Momin Uppal
Document3 pages
EE 564-Stochastic Systems-Momin Uppal
vik05
No ratings yet
Post Graduate Program in Management (PGPM)
Document8 pages
Post Graduate Program in Management (PGPM)
mohitv_18
No ratings yet
COMM 1DA3 SS23 Course Outline Bakhtiari
Document9 pages
COMM 1DA3 SS23 Course Outline Bakhtiari
aamnak170801
No ratings yet
2017 SNU ISISyllabus For Team Teaching Format
Document3 pages
2017 SNU ISISyllabus For Team Teaching Format
Lewis Patten
No ratings yet
414 Syllabus Fall 2013
Document4 pages
414 Syllabus Fall 2013
freeoffer7900
No ratings yet
Advanced Dynamics Syllabus
Document4 pages
Advanced Dynamics Syllabus
Andrea Spencer
No ratings yet
1225-Article Text-2315-1-10-20220818
Document6 pages
1225-Article Text-2315-1-10-20220818
20ucs067
No ratings yet
Simplified Teaching and Understanding of Histogram Equalization in Digital Image Processing
Document20 pages
Simplified Teaching and Understanding of Histogram Equalization in Digital Image Processing
team jellyfish
No ratings yet
E0 251 Aug 3:1 Data Structures and Algorithms: Instructor
Document2 pages
E0 251 Aug 3:1 Data Structures and Algorithms: Instructor
Boul chandra Garai
No ratings yet
Teacher Subject Allocation Pranav Kadam
Document58 pages
Teacher Subject Allocation Pranav Kadam
Pranav Kadam
No ratings yet
BUS 135 Course Outline PDF
Document4 pages
BUS 135 Course Outline PDF
Tanvir Hasan Khan
No ratings yet
IEEE Education Society Papers-04589061
Document8 pages
IEEE Education Society Papers-04589061
Anoop Mathew
No ratings yet
CHEN/SENG 460/660, Quantitative Risk Analysis in Safety Engineering Syllabus
Document9 pages
CHEN/SENG 460/660, Quantitative Risk Analysis in Safety Engineering Syllabus
kkakosim
No ratings yet
Course Outline: International Islamic University Malaysia
Document5 pages
Course Outline: International Islamic University Malaysia
Omar Abdi
No ratings yet
Ece541 2
Document4 pages
Ece541 2
AbhiramDanthala
No ratings yet
Structural Analysis 267 Semester 1 2013 Bentley Campus INT (1) .
Document6 pages
Structural Analysis 267 Semester 1 2013 Bentley Campus INT (1) .
Jimisha Halai
No ratings yet
UT Dallas Syllabus For Mech3350.001.11s Taught by Wooram Park (wxp103020)
Document2 pages
UT Dallas Syllabus For Mech3350.001.11s Taught by Wooram Park (wxp103020)
UT Dallas Provost's Technology Group
No ratings yet
QM Course Outline Sandeep 2017
Document7 pages
QM Course Outline Sandeep 2017
Sumedh Saraf
No ratings yet
Introduction To Machine Learning
Document1 page
Introduction To Machine Learning
Rajat Raj
No ratings yet
Ade 2014
Document4 pages
Ade 2014
MALLIKARJUN Y
No ratings yet
MECH 315 Course Outline F2013
Document7 pages
MECH 315 Course Outline F2013
animaniax666
No ratings yet
Gujarat Technological University: Bachelor of Engineering Syllabus Subject Code: Subject Name
Document3 pages
Gujarat Technological University: Bachelor of Engineering Syllabus Subject Code: Subject Name
Smit Patel
No ratings yet
Lesson Plan For Implementing NETS - S-Template I: (More Directed Learning Activities)
Document8 pages
Lesson Plan For Implementing NETS - S-Template I: (More Directed Learning Activities)
api-405567093
No ratings yet
GROUP 3 Technology Integration Planning
Document17 pages
GROUP 3 Technology Integration Planning
badaybadat
No ratings yet
Novel Approach To Evaluate Student Performance Using Data Mining
Document31 pages
Novel Approach To Evaluate Student Performance Using Data Mining
Rahul Kanojia
No ratings yet
Introduction To Machine Learning: Dep Artment of Computer Science and Engineering IIT Madras
Document1 page
Introduction To Machine Learning: Dep Artment of Computer Science and Engineering IIT Madras
Varun Jain
No ratings yet
Tybsc Cs368 Data Analytics Labbook
Document58 pages
Tybsc Cs368 Data Analytics Labbook
raut9657991617
No ratings yet
Syllabus FEM11090 2023
Document6 pages
Syllabus FEM11090 2023
thedieguexomg
No ratings yet
Mathematical Modelling of Engineering Problems: Received: 13 October 2019 Accepted: 26 January 2020
Document5 pages
Mathematical Modelling of Engineering Problems: Received: 13 October 2019 Accepted: 26 January 2020
avaunzaz
No ratings yet
BUS173.10 Course Outline
Document4 pages
BUS173.10 Course Outline
Jeff Hardy
No ratings yet
Math 2301 S 12016
Document8 pages
Math 2301 S 12016
John
No ratings yet
Pss 5
Document9 pages
Pss 5
Aaradhya Singh
No ratings yet
Tsion Abeje AI Ass
Document3 pages
Tsion Abeje AI Ass
Quotes 'nd notes
No ratings yet
IENG314
Document4 pages
IENG314
Abdu Abdoulaye
No ratings yet
BIWE 09e
Document2 pages
BIWE 09e
Charlie
No ratings yet
231 Syl Lab Uss 2010
Document1 page
231 Syl Lab Uss 2010
hohonot
No ratings yet
11861-Article Text-21047-1-10-20211230
Document7 pages
11861-Article Text-21047-1-10-20211230
Mohammed Shahid
No ratings yet
CE573 Fall2016 Syllabus
Document3 pages
CE573 Fall2016 Syllabus
ahmed11 engyemen
No ratings yet
Module 1 Math 4 Obtaining Data
Document25 pages
Module 1 Math 4 Obtaining Data
Benj Paulo Andres
No ratings yet
Module 1 - Math-4 - Obtaining Data
Document25 pages
Module 1 - Math-4 - Obtaining Data
Khiel Yumul
No ratings yet
Students Understanding of Sequence and Series As Applied in Electrical Engineering
Document11 pages
Students Understanding of Sequence and Series As Applied in Electrical Engineering
akraees293
No ratings yet
APPM2023 Course Outline PDF
Document7 pages
APPM2023 Course Outline PDF
Ndumiso Maphanga
No ratings yet
Automatic Grading of Answer Sheets Using Machine L
Document10 pages
Automatic Grading of Answer Sheets Using Machine L
Yashwanth JV
No ratings yet
Linear Algebra Fall'20
Document6 pages
Linear Algebra Fall'20
r
No ratings yet
EE6560 Spring17 Syllabus Final 2
Document2 pages
EE6560 Spring17 Syllabus Final 2
Ashraf Irfan
No ratings yet
A Machine Learning Approach For Tracking and Predicting Student Performance in Degree Programs
Document2 pages
A Machine Learning Approach For Tracking and Predicting Student Performance in Degree Programs
sireesha payyavula
No ratings yet
Cinnamic Acid
Document18 pages
Cinnamic Acid
praveen
No ratings yet
TOPIO
Document10 pages
TOPIO
praveen
No ratings yet
Helmholtz Pitch Notation
Document13 pages
Helmholtz Pitch Notation
praveen
No ratings yet
Phye222 13
Document3 pages
Phye222 13
praveen
No ratings yet
Scan Chain: Scan Chain Is A Technique Used in Design
Document7 pages
Scan Chain: Scan Chain Is A Technique Used in Design
praveen
No ratings yet
Proof of Delivery
Document8 pages
Proof of Delivery
praveen
No ratings yet
Protestation at Speyer PDF
Document28 pages
Protestation at Speyer PDF
praveen
No ratings yet
Anglo-French Conference On Time-Keeping at Sea
Document6 pages
Anglo-French Conference On Time-Keeping at Sea
praveen
No ratings yet
Nautical Time
Document16 pages
Nautical Time
praveen
No ratings yet
Product Binning Is The Categorizing of
Document11 pages
Product Binning Is The Categorizing of
praveen
No ratings yet
Data Signaling Rate
Document10 pages
Data Signaling Rate
praveen
No ratings yet
Biophilia Hypothesis
Document23 pages
Biophilia Hypothesis
praveen
No ratings yet
Clock Rate: Clock Cycles Per Second or Its Equivalent
Document19 pages
Clock Rate: Clock Cycles Per Second or Its Equivalent
praveen
No ratings yet
Bionomical Name
Document1 page
Bionomical Name
praveen
No ratings yet
Scheduled Power Outages in Northern California Begin
Document8 pages
Scheduled Power Outages in Northern California Begin
praveen
No ratings yet
Origins of Frame Story
Document1 page
Origins of Frame Story
praveen
No ratings yet
Breed Registry: Herdbook, Studbook or Register, in Animal
Document35 pages
Breed Registry: Herdbook, Studbook or Register, in Animal
praveen
No ratings yet
Conservation Status: Near Threatened (IUCN 3.1)
Document1 page
Conservation Status: Near Threatened (IUCN 3.1)
praveen
No ratings yet
Structure of The Comprehensive Examination in The ME Department For Circulation To Students
Document4 pages
Structure of The Comprehensive Examination in The ME Department For Circulation To Students
praveen
No ratings yet
Color Breed PDF
Document9 pages
Color Breed PDF
praveen
No ratings yet
ME 688 Advanced Machining Processes (3-0-0-6) : Textbooks
Document1 page
ME 688 Advanced Machining Processes (3-0-0-6) : Textbooks
praveen
No ratings yet
ME150 Non-Conventional Manufacturing
Document1 page
ME150 Non-Conventional Manufacturing
praveen
No ratings yet
Empowerment Module 10
Document5 pages
Empowerment Module 10
Josh Taguinod
No ratings yet
Mind Mapping Ebook v3
Document143 pages
Mind Mapping Ebook v3
taurus_vadivel
100% (4)
Tybca OOSE Notes
Document49 pages
Tybca OOSE Notes
Tejas Patil
No ratings yet
The Kisssoft Interface To Pro/Engineer
Document2 pages
The Kisssoft Interface To Pro/Engineer
Anonymous pMVR77x1
No ratings yet
Switch Zoning
Document42 pages
Switch Zoning
Sankarsan Adhikari
No ratings yet
Graph Algorithms
Document82 pages
Graph Algorithms
Dharmendra Kumar
No ratings yet
Start Up Procedure For Siemens M
Document6 pages
Start Up Procedure For Siemens M
S.Dharanipathy
No ratings yet
PX309 100MV
Document5 pages
PX309 100MV
Anonymous sZSqlCILs
No ratings yet
Subject: Big Data 5th SEM / Computer
Document2 pages
Subject: Big Data 5th SEM / Computer
mukulranag4
No ratings yet
Default Values OMFI
Document11 pages
Default Values OMFI
Pavilion
No ratings yet
Chapter 15: Query Processing
Document41 pages
Chapter 15: Query Processing
Love Jhala
No ratings yet
01 - TACIDS Award Letter - 2 PDF
Document14 pages
01 - TACIDS Award Letter - 2 PDF
ali_winston
No ratings yet
6 Hazard Avoidance
Document22 pages
6 Hazard Avoidance
firahliyana
No ratings yet
LJ-Navigator2 Help SettingsCommon
Document4 pages
LJ-Navigator2 Help SettingsCommon
doobyy
No ratings yet
Smart Grid System Operation (ELEN-6108) Lec 5
Document14 pages
Smart Grid System Operation (ELEN-6108) Lec 5
musa
No ratings yet
Particles: (SIA) National Technology Roadmap For Semiconductors (NTRS) Calls For Defect Densities For
Document6 pages
Particles: (SIA) National Technology Roadmap For Semiconductors (NTRS) Calls For Defect Densities For
Animesh Jain
No ratings yet
Time: 3 Hours Maximum Marks: 100 Note: Question No. One Is Compulsory. Attempt Any Three Questions From Four
Document4 pages
Time: 3 Hours Maximum Marks: 100 Note: Question No. One Is Compulsory. Attempt Any Three Questions From Four
krishan murari
No ratings yet
DL-502-503 Broch 7010 2062 Reva-V3
Document2 pages
DL-502-503 Broch 7010 2062 Reva-V3
Marcos Romero
No ratings yet
ALV TREE Program
Document7 pages
ALV TREE Program
Ricky Das
No ratings yet
Chapter 6: Test Practice Problems
Document6 pages
Chapter 6: Test Practice Problems
gaurav kumar
No ratings yet
03a. Relational Algebra Tambahan + Jawaban Latihan
Document62 pages
03a. Relational Algebra Tambahan + Jawaban Latihan
kirimke sofyanaja
No ratings yet
DIALux Direct3D Information
Document2 pages
DIALux Direct3D Information
gabi1234567890
No ratings yet
Syllabus - System Analysis and Design
Document4 pages
Syllabus - System Analysis and Design
kriz anthony zuniega
100% (1)
Product Guide - Power Generation Applications PDF
Document28 pages
Product Guide - Power Generation Applications PDF
GiangDo
No ratings yet
CA Arcserve 11 Manual
Document382 pages
CA Arcserve 11 Manual
lucho210876
No ratings yet
Conference
Document31 pages
Conference
Dhanu Chetty
No ratings yet
Examples For Chemical Engineering Thermodynamics Using Matlab
Document7 pages
Examples For Chemical Engineering Thermodynamics Using Matlab
mbolantenaina
No ratings yet
Project: 3: Topic: Power BI Case Study
Document41 pages
Project: 3: Topic: Power BI Case Study
Emon Hossain
No ratings yet
Group 6 - Chap 4
Document29 pages
Group 6 - Chap 4
Bùi Phan Ý Nhi
No ratings yet