2022-12-03
pytorch学习15-加入注意力机制的seq2seq优化流量预测

seq2seq序列到序列模型,是从一个序列生成另外一个序列。 它涉及两个过程:一个是理解前一个序列的编码器,另一个是用理解到的内容来生成新的序列的解码器。至于序列所采用的模型可以是RNN,LSTM,GRU,其它序列模型等。上述的过程和我们大脑理解东西的过程很相似,听到一句话,理解之后,尝试组装答案,进行回答,一般用于机器翻译等NLP领域。当然用来优化我们的流量预测模型也是没问题的。

Read More
 2022-11-09
pytorch学习14-使用GPU训练

之前一直是使用CPU进行深度学习训练,最近申请下来了一块Tesla T4 GPU卡,不过是vGPU。在经历了一系列grid特殊驱动、license、重装gpu版pytorch之类的踩坑之后,终于实现了使用GPU进行训练,开启疯狂调参之路。速度从原来CPU训练一轮20分钟变成了7分钟左右,CUDA加速提升还是十分可观。

Read More