我有一个学生正在研究按照现有的各类假设,办理一个好处优化的问题,使我知道怎么把计较机资源分派到各类币上。而且信息是不绝变革的,那么这种环境下按照它价值的差异,它已经被挖出几多了,还剩几多资源,我们假设就把它酿成一个回报的变革,我怎么来预测这个变革?其次有些变革它回报大概很大,但它的这个本钱同样也很大,这个框架计策怎么来动态更新?
问 :您为什么会转向巨大系统的研究?
特征选择假如要说的更详细一点的话,我们就是在 lasso 可能 ridge regression 这样的要领来看这个,个中有个 subtopic,我们正在做的就是怎么把这个 lasso feature selection 放到神经网络内里去。
本来许多的 ABSM 都长短常虚设的,也就是说碰见一件工作,它就做一个决定,实际上就是基于一个很简朴的 possibility model。可是我们但愿做的这个模子实际上是有点雷同于马尔可夫模子,这个模子可以按照我此刻的状态,进修周围的情况,使这个 agent 越发智能。同时这个决定实际上又要基于博弈论的角度来做,因为每小我私家都要使本身效益最优化,所以把这三方面团结到一起其实挺难的,这个 agent 确实能模仿真实环境。
首先它必定是一个大局限优化,我本来一直在做进修方面的特征选择,有那么多的影响因子,我到底选哪些作为我的存眷点,好比说怎么识别要害用户,怎么识别要害因素。假如能把这个问题简化成一个只有 5 到 6 个 key factor 的环境下,就很容易做出决定模子,但假如你给我 1200 个 factor,是很难做优化的。
问:那您这个研究在将来大概会有哪些更细分的课题呢?
拿社交网络中 Information 是怎么来运转举例,此刻社交网络内里存在一些影响力较量大的用户,他们影响力是很大的。这些人 Information 的流传,和其它普通用户是完全纷歧样的,所以这是巨大系统自己纷歧样的处所。
这是区块链内里很重要的一个原则,别的就是能制止把持。在这种环境下,你是很难对整体有一个出格清楚的思路,你更多知道的实际上是 inpidual player 的,你把它放进去,然后 inpidual player 之间做各类百般的 interaction,你去调查这个系统的进化,这长短常纷歧样的。
这个系统最要害的,一是有一个明晰的起始和竣事,好比说天天这个商店从早上八点,开到晚上九点;二是 study state analysis,即这个系统一直处于进修状态。好比说我们用的网络,这实际上是一个持续不绝的系统。这个系统会有颠簸,inpidual 的 observtion 也不确定,可是它的幂和整体的漫衍实际上是不变在一个水平了。
答 :feature selection 包罗 lasso 大部门都是一步性的,你有许多的数据来做一个阐明,此刻的 trend 的实际上我们也在做。怎么把这个对象放到神经网络这部门去,这内里会有一些问题。深度进修实际上是多级的,包罗这个马尔可夫随机树这些对象,并且它不断的有新数据进来,那这种环境下的 feature selection 怎么能酿成一个 adaptive multistage,前面的数据怎么能尽大概用到这里。而做模仿的一个奇特的处所,就是说我可以设计我要从那边拿到数据。
离散事件模仿和蒙特卡罗模仿根基都是从上向下的,先看数据是如何漫衍的,再确定随机模子,然后设立一系列假设来搭建这个模子。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。