RNN的复兴03:现代RNN的并行计算 发表于 2025-08-17 | 分类于 机器学习 | 阅读次数 本文主要总结了现代RNN的并行计算的若干基本问题,和我自己的一些体会。主要为接下来的RNN的复兴系列文章,做一点知识介绍。 阅读全文 »
RNN的复兴01:向量和矩阵微分-大语言模型研究08 发表于 2025-07-20 | 分类于 机器学习 | 阅读次数 本文主要总结了向量和矩阵微分的若干基本问题,和我自己的一些体会。主要为接下来的RNN的复兴系列文章,做一点前置知识介绍。 阅读全文 »
KBALM-知识库增强型语言模型-大语言模型研究07 发表于 2025-03-21 | 分类于 机器学习 | 阅读次数 本文主要总结了知识库增强型语言模型的若干基本问题,和我自己的一些体会。 阅读全文 »
Bone微调,超越LoRA系列的高效微调方法——大语言模型研究04 发表于 2024-12-12 | 分类于 机器学习 | 阅读次数 本文主要介绍了Bone微调的方法,该方法超越了LoRA系列方法。如有错误请指正。 阅读全文 »
01解读技术报告初识书生.浦语2——internlm2系列 发表于 2024-03-27 | 分类于 工程实践 | 阅读次数 本文主要总结了internlm2的一个大致印象,并结合internlm2点技术报告讨论了笔者感兴趣的内容,和我自己的一些体会,如有错误请指正。 阅读全文 »
如何使用llama.cpp部署InternLM2——大模型CPU部署系列05 发表于 2024-01-21 | 分类于 工程实践 | 阅读次数 本文主要介绍了开源大模型使用工具原理,如有错误请指正。 阅读全文 »