cyberyang blog


更新知识地图,拓展认知边界

来看火星

0 条评论 记录 无标签 chen
前几天看到了一则新闻,讲NASA的“机智号”火星无人机寄了,里面插入了几张火星上航拍的照片,看见这些照片我就突然想起来,高中网课的时候我弄了个可以从NASA的API上获取火星车拍摄图片的网页,于是乎从硬盘的角落里翻出来了远古时期服务器的备份,把这个网页恢复了起来。地址是:https://ws.cyberyang.com/mars/mars.html,我找了几张照片贴在了下面,他们分别由好奇号...

TensorRT加速MNIST手写数字识别

0 条评论 模型部署 TensorRT chen
本文将会通过TensorRT C++ API来完成一个MNIST手写数字识别模型的转换、推理过程,并给出相应代码,在runtime阶段将会使用最新的enqueueV3方法。代码/模型文件已上传GitHub仓库:https://github.com/cyberyang123/Learning-TensorRT

VSCode配置C++开发

2 条评论 记录 无标签 chen
配置终端生成任务一键调用CMake编译tasks.json{ "version": "2.0.0", "tasks": [ // cmake 配置 { "type": "cppbuild", &qu...

基于Transformer网络的中译英翻译器

0 条评论 自然语言处理 无标签 chen
本文将会逐一拆解Transformer网络,并给出代码实现,最终将应用Transformer模型完成一个文本翻译任务。Transformer网络拆解Transformer唯一难理解的地方,也是唯一涉及到了数学知识的地方就是正弦位置编码表,对于这部分的工作原理大可不比过于纠结,知道它是做什么的、会用就可以;其他地方只需要像搭积木一样摆放到合适的位置就好。缩放点积注意力虽然说Attention机...

多头交叉Attention机制的代码实现

0 条评论 自然语言处理 无标签 chen
深蓝学院生成式预训练语言模型 第6章作业怎么搞在Encoder-Decoder模型中,Attention机制可以将编码器的输出和解码器的隐藏状态联系起来我们需要计算的是解码器输出对于编码器输出的注意力(代码里的编码器输出指的是RNN的output,不是最后一层hidden)对于编解码交叉注意力,我们需要将Context(Encoder输出)看成是K和V,将Decoder的输出看成是Q,再按照...