最近思考量化交易的问题,因为交易是成对出现的,只有买完后再卖掉才能判断这一对动作是否有效,卖掉比较好设置reward,只要用收益就好了,无非是做一些变换。
但是第一个动作,在量化问题里就是买入该怎么设置reward呢,感觉没有有效的评价是否应该买入的方法。
除非对算法进行改变。
关键词:动作组 reward 动作对 一组动作 一对动作