Tags

Blog About Categories 强化学习资源 Tags RSS

Deep learning

2019-07-06 MC学习笔记-蒙特卡洛法求解Blackjack的最优策略
2019-05-10 使用RNN生成文本-shakespeare

Rnn

2019-05-12 使用RNN预测股票下一日的收盘价
2019-05-10 使用RNN生成文本-shakespeare

深度学习

Lstm

2019-05-12 使用RNN预测股票下一日的收盘价

Numpy

2019-05-14 tensorflow中的索引和切片操作

切片

2019-05-14 tensorflow中的索引和切片操作

Categorical

2019-05-14 tensorflow的二项分布和多项分布

Binomial

2019-05-14 tensorflow的二项分布和多项分布

Tensorflow

Random

2019-05-14 tensorflow的二项分布和多项分布

Jupyter

2019-05-15 jupyter使用技巧

Python

强化学习

2019-05-20 Q Learning示例-极简的一维agent
2019-05-17 强化学习笔记

None

2019-05-19 tensorflow中的None

Pandas

2019-07-14 python的yield用法
2019-07-11 A股年报数据提取小工具
2019-05-19 pandas学习笔记

Batch size

2019-05-26 深度学习中的batch size

Deeplearning

2019-08-26 policy iteration释疑一则
2019-08-22 DP（动态规划）解决租车运营问题
2019-08-22 In place iterative policy evaluation
2019-08-21 policy improvement的数学证明
2019-08-20 MDP学习笔记-Ex 3.22
2019-08-19 MDP学习笔记-最优价值函数和最优策略
2019-08-16 MDP学习笔记-grid world问题的解析
2019-08-15 MDP学习笔记-价值函数
2019-08-14 关于Exercise 3.8的疑问
2019-08-14 关于Exercise 3.11的解析
2019-06-29 MC学习笔记-蒙特卡罗方法进行状态价值评估
2019-06-21 DP学习笔记-使用值迭代解决赌徒问题
2019-06-20 DP学习笔记-策略增强
2019-06-16 DP学习笔记-策略评估
2019-06-03 MDP学习笔记-基本的交互过程

Mdp

Reinforcement learning

2019-08-26 policy iteration释疑一则
2019-08-22 DP（动态规划）解决租车运营问题
2019-08-22 In place iterative policy evaluation
2019-08-21 policy improvement的数学证明
2019-08-20 MDP学习笔记-Ex 3.22
2019-08-19 MDP学习笔记-最优价值函数和最优策略
2019-08-16 MDP学习笔记-grid world问题的解析
2019-08-15 MDP学习笔记-价值函数
2019-08-14 关于Exercise 3.8的疑问
2019-08-14 关于Exercise 3.11的解析
2019-07-06 MC学习笔记-蒙特卡洛法求解Blackjack的最优策略
2019-06-29 MC学习笔记-蒙特卡罗方法进行状态价值评估
2019-06-21 DP学习笔记-使用值迭代解决赌徒问题
2019-06-20 DP学习笔记-策略增强
2019-06-16 DP学习笔记-策略评估
2019-06-03 MDP学习笔记-基本的交互过程

Dynamic programming

Monte carlo

2019-07-06 MC学习笔记-蒙特卡洛法求解Blackjack的最优策略
2019-06-29 MC学习笔记-蒙特卡罗方法进行状态价值评估

Model-free

2019-06-29 MC学习笔记-蒙特卡罗方法进行状态价值评估

Print

2019-07-14 Linux下面双面打印的方法（FS-1020MFP）
2019-07-04 Python的print的用法

Format

2019-07-04 Python的print的用法

Blackjack

2019-07-06 MC学习笔记-蒙特卡洛法求解Blackjack的最优策略

Financial

2019-07-11 A股年报数据提取小工具

Stock

2019-07-11 A股年报数据提取小工具

Linux

2019-07-14 Linux下面双面打印的方法（FS-1020MFP）

Yield

2019-07-14 python的yield用法

Early stopping

2019-07-21 Tensorflow的EarlyStopping技术

Regression problem

2019-07-24 回归问题-基于Tensorflow

Pyscopg2

2019-07-26 使用pyscopg2连接PostGreSQL数据库

Postgresql

2019-07-26 使用pyscopg2连接PostGreSQL数据库

Tuple

2019-07-29 tuple的构造方法：单个元素的情况

Android

2019-08-12 使用tensorflow lite遇到的一些坑
2019-08-08 Android Studio在国内访问dl.google.com的方法

Tensorflow lite

2019-08-12 使用tensorflow lite遇到的一些坑

Policy

2019-08-14 关于Exercise 3.11的解析

Reward

2019-08-14 关于Exercise 3.8的疑问
2019-08-14 关于Exercise 3.11的解析

Return

2019-08-14 关于Exercise 3.8的疑问

Value function

2019-08-16 MDP学习笔记-grid world问题的解析
2019-08-15 MDP学习笔记-价值函数

Grid world

2019-08-19 MDP学习笔记-最优价值函数和最优策略
2019-08-16 MDP学习笔记-grid world问题的解析

Optimal value function

2019-08-20 MDP学习笔记-Ex 3.22
2019-08-19 MDP学习笔记-最优价值函数和最优策略

Optimal policy

2019-08-20 MDP学习笔记-Ex 3.22
2019-08-19 MDP学习笔记-最优价值函数和最优策略

Policy improvement

2019-08-21 policy improvement的数学证明

Policy evaluation

2019-08-22 In place iterative policy evaluation

Policy interation

2019-08-26 policy iteration释疑一则
2019-08-22 DP（动态规划）解决租车运营问题