3.17 百度-大模型算法(nlp) —— 侧重点:垂类做模型对新数据的应用/微调相关/COT/RAG相关
拷打项目就不说了
- RAG是怎么做的
- COT是什么,原理是什么
- RAG和SFT的区别和好坏
- GQA是什么, MLA是什么,MLA是怎么用上RoPE的
- Llama3 和 Llama2的区别
- PreNorm和PostNorm的区别以及为什么使用PostNorm
- 强化学习相关DPO、PPO、GRPO
算法题:
每个数字位的平方和为1
- 例子:28(4 + 64) -> 68(36 + 64) -> 100 -> 1
下一个满足条件的时间(要求在时间内出现过的字符)
- 例子:输入:12:34 输出 12:43 ;输入:09:09 输出 00:00;输入:23:59 输出 22:22