网站迁移完成

实施: hugo + github action + git pages + cloudflare 目前通过本地 vscode 写完日志后,直接推送到 github 私有仓库,通过 github action 生成静态内容自动推送到 github pages 仓库,完成部署。 静态内容存放: github pages 域名解析使用: cloudflare 附注: github pages 自定义域名 解析设置(支持A记录) https://docs.github.com/en

论文阅读:MHA、MQA、GQA的差异与共性

MHA、MQA、GQA差异 MHA:Multi-Head Attention,QKV 三部分有相同数量的头,且一一对应。每次做 Attention,head_i 的 QKV 做好自己的运算就可以,输出时各个头加起来就行。 MQA:Multi-Query Attention,让 Q 仍然保持原来的头数,但 K 和 V 只有一个头,相当于所有的 Q 头共享一组 K 和 V 头,所以叫做 Multi-Query 了。 实现改变了会不会影响效果呢?确实会影响,但相对它