01解读技术报告初识书生.浦语2——internlm2系列 发表于 2024-03-27 | 分类于 工程实践 | 阅读次数 本文主要总结了internlm2的一个大致印象,并结合internlm2点技术报告讨论了笔者感兴趣的内容,和我自己的一些体会,如有错误请指正。 阅读全文 »
如何使用llama.cpp部署InternLM2——大模型CPU部署系列05 发表于 2024-01-21 | 分类于 工程实践 | 阅读次数 本文主要介绍了开源大模型使用工具原理,如有错误请指正。 阅读全文 »
如何训练——大语言模型研究02 发表于 2023-12-07 | 分类于 机器学习 | 阅读次数 本文主要介绍了如何训练大语言模型与人类对齐一些理论问题,最近发现RLFT实质是一个贝叶斯推断,本文基于贝叶斯推断提出了一个类似多脑区的多模型多模态训练构想。如有错误请指正。 阅读全文 »
不得不说的Chat Format——大模型CPU部署系列03 发表于 2023-10-25 | 分类于 工程实践 | 阅读次数 本文主要介绍了大模型量Chat Format的格式,如有错误请指正。 阅读全文 »