本发明公开了一种分布式的垂直切换和资源分配方法,切换用户根据服务质量要求选择目的基站进行接入,目的基站根据网络效益对切换用户进行资源分配,特征是切换决策和资源分配以最大化时间维度上的全网收益为目标,综合根据基站状态、信道状态和移动设备的状态。本发明不需要集中式控制器,候选基站和移动终端经过简单地协调,可以在基站上进行资源分配,在移动终端商进行目的网络选择。本发明不局限于效用函数的具体定义,并且状态集合可以变化和扩展,具有极大的可扩展性和适应性。并且本发明不需要预先知道各个状态的收益值和状态转移概率,可以通过在线学习的方式逐步获得,能够自动适应于复杂网络环境。