RNN的复兴01:向量和矩阵微分-大语言模型研究08

发表于 2025-07-20 | 分类于机器学习 | 阅读次数

本文主要总结了向量和矩阵微分的若干基本问题，和我自己的一些体会。主要为接下来的RNN的复兴系列文章，做一点前置知识介绍。

KBALM-知识库增强型语言模型-大语言模型研究07

发表于 2025-03-21 | 分类于机器学习 | 阅读次数

本文主要总结了知识库增强型语言模型的若干基本问题，和我自己的一些体会。

发表于 2025-02-11 | 分类于机器学习 | 阅读次数

本文主要总结了大语言模型中的强化学习的若干基本问题，和我自己的一些体会。

发表于 2025-01-31 | 分类于机器学习 | 阅读次数

本文主要总结了大语言模型中的强化学习的若干基本问题，和我自己的一些体会。

发表于 2024-12-12 | 分类于机器学习 | 阅读次数

本文主要介绍了Bone微调的方法，该方法超越了LoRA系列方法。如有错误请指正。

发表于 2024-06-21 | 分类于机器学习 | 阅读次数

本文主要介绍了如何微调大语言模型常见的十个问题。如有错误请指正。

发表于 2024-03-27 | 分类于工程实践 | 阅读次数

本文主要总结了internlm2的一个大致印象，并结合internlm2点技术报告讨论了笔者感兴趣的内容，和我自己的一些体会，如有错误请指正。

发表于 2024-01-21 | 分类于工程实践 | 阅读次数

本文主要介绍了开源大模型使用工具原理，如有错误请指正。

发表于 2024-01-07 | 分类于工程实践 | 阅读次数

本文主要介绍了开源大模型使用工具原理，如有错误请指正。

发表于 2023-12-07 | 分类于机器学习 | 阅读次数

本文主要介绍了如何训练大语言模型与人类对齐一些理论问题，最近发现RLFT实质是一个贝叶斯推断，本文基于贝叶斯推断提出了一个类似多脑区的多模型多模态训练构想。如有错误请指正。

引线小白

小湖椰影廊桥,曾记否,谷围晓月,灯影朦胧。